지난 뉴스레터에서는 효과적인 비용 관리의 토대인 “자사의 재무 현황을 파악하는 것”의 중요성에 대해 다뤘습니다. 하지만 많은 조직에게 있어 이러한 개념을 실제로 실행에 옮기는 것은 큰 난관입니다. 가장 큰 장애물 중 하나는 무엇일까요? 바로 데이터를 분석하여 유용하고 실질적인 통찰력으로 전환할 수 있는, 활용 가능한 형식으로 정리하는 것입니다.
제 경험상 가장 가치 있는 데이터는 대개 청구서에서 나옵니다. 청구서에는 구매 내역에 대한 상세한 설명, 품목 번호, 그리고 비용 분석에 있어 금과도 같은 거래 단위 수준의 통찰력이 담겨 있습니다. 문제는 무엇일까요? 이러한 데이터의 대부분이 PDF 파일에 갇혀 있다는 점입니다.
많은 고객사의 경우, 이는 제가 주로 분기별로 쌓여 있는 PDF 청구서 더미에서 정기적으로 데이터를 수집하고 추출한다는 것을 의미합니다.
지출 현황을 파악하기 위해 새로 시작한 프로젝트의 경우, 수천 건에 달하는 PDF 청구서를 통합된 디지털 형식으로 변환해야 하는 경우가 종종 있습니다.
이상적인 방법은 아니지만, 실제로 활용 가능한 인사이트는 대개 그곳에서 찾을 수 있습니다. 구매 주문서(PO) 데이터도 도움이 될 수 있지만, 종종 불완전하거나 누락된 부분이 많아 유용하게 쓰기 위해서는 상당한 정제 작업이 필요한 경우가 많습니다.
어디서부터 시작해야 할까요? 공급업체부터 시작해 보세요
어디서부터 시작해야 할지 모르겠다면, 가장 큰 거래처부터 시작해 보세요. 많은 업체가 거래 내역을 엑셀이나 CSV 형식으로 한꺼번에 다운로드할 수 있게 해 주는데, 이는 정말 큰 도움이 됩니다. 규모가 작은 업체의 경우 그런 옵션이 없을 수도 있지만, 일단 물어보는 것만으로도 충분히 가치가 있습니다. 요청해 보면 그들이 어떤 도움을 줄 수 있는지 놀라게 될 것입니다.
그렇긴 하지만, 제가 담당하는 프로젝트의 약 90%에서는 결국 PDF 청구서 데이터를 다시 확인해야 했습니다. 초기에는 작업량이 더 늘어나지만, 장기적으로 보면 그만한 가치가 충분히 있습니다.
게임 체인저가 될 도구: Docparser
몇 년 전, 저도 똑같은 문제에 직면했었습니다. 산더미처럼 쌓인 PDF 청구서들인데, 데이터를 추출할 방법이 마땅치 않았던 것이죠. 해외에 이 작업을 외주 맡겨보기도 했지만, 결국 절약한 시간보다 결과물을 수정하는 데 더 많은 시간을 쏟게 되곤 했습니다.
그때 동료 한 명이 PDF(및 기타 형식)에서 구조화된 데이터를 추출해 주는 도구인 Docparser를 한번 써보라고 권해 주었습니다. 완벽하다고는 할 수 없지만, 특히 전자 PDF나 레이아웃이 일관된 청구서의 경우 매우 유용합니다. 무엇보다도 지원팀이 정말 신속하게 대응해 주고 도움이 많이 되는데, 제 경우에는 대개 하룻밤 사이에 답변을 받곤 합니다.
특정 고객에 대한 규칙을 설정해 두면, 문서를 업로드하기만 하면 5분 만에 데이터 추출이 완료됩니다. 설정만 완료되면 300~400건의 청구서를 단 몇 분 만에 처리할 수 있습니다. 제게는 생산성이 획기적으로 향상된 셈이며, 대량의 문서에서 특정 데이터를 추출해야 하는 모든 분들에게 진정한 게임 체인저가 될 것입니다.
도움이 필요하신가요? 한번 이야기해 봅시다
데이터가 PDF 파일에 갇혀 있거나 어디서부터 시작해야 할지 막막하시다면, 혼자만 그런 게 아닙니다. 그리고 아직 끝난 게 아닙니다. 도움이 될 만한 도구와 전략이 있습니다. 직접 해결하시든 도움을 받으시든, 언제든지 기꺼이 상담해 드리거나 직접 나서서 시작하실 수 있도록 도와드리겠습니다.

그랜트 모로우
수석 컨설턴트
+61 415 203 575




























































































