디스커버리 입문(6/7): 비용 관리의 핵심은 견적 확인에 있다 (Part 1)

2020年03月01日配信

beatriz-perez-moya-XN4T2PVUUgk-unsplash-scaled

모든 비즈니스 현장에서 '공동견적'을 받는 것이 일반화되어 있지만, 사실 디스커버리 업계에서는 공동견적에 이르는 경우가 많지 않다.

그 이유는 업체마다 견적의 형식이 제각각이고, 견적을 어떻게 봐야 할지 모르겠고, 비교할 수 있는 방법이 없기 때문이다. 경쟁업체가 적다는 것은 아닙니다. 오히려 기업의 데이터 보유량 증가에 비례해 디스커버리 시장은 계속 확대되고 있고, 새로운 디스커버리 지원 벤더와 벤더들이 속속 등장하고 있다. 이 점이 기업들이 디스커버리 비용을 제대로 통제하지 못하는 가장 큰 이유인 것 같습니다.

견적 금액과 청구 금액의 차이는 일상적인가?

제조판매업이든 서비스업이든 일반적인 비즈니스에서 견적가와 실제 가격이 크게 차이나는 경우는 드물다. 만약 실제 청구금액이 견적보다 크게 늘어났다면 발주처 담당자에게는 불쾌감을 줄 수 있고, 계약한 기업도 견적 단계의 계획성이 부족하다는 지적을 받을 수 있기 때문에, 조금 오버한 정도라면 견적대로 금액을 책정하게 됩니다. 부득이한 사정으로 견적금액을 초과할 것으로 예상되는 경우에도 수주 측에서 발주 측에 먼저 연락하여 허락을 받는 것이 일반적이지 않을까요?

하지만 디스커버리 업계에서는 견적 금액과 실제 청구 금액이 크게 차이가 나는 경우가 종종 발생합니다. 이는 견적은 어디까지나 '참고용 가격'일 뿐이라는 것을 보여줍니다. 견적 단계에서 여러 업체들의 가격을 비교하여 저렴한 업체를 선택했다고 생각했는데, 막상 청구금액을 보니 다른 업체보다 비싸게 청구된 경우도 적지 않습니다.

게다가 기업 입장에서는 그렇게 청구된 금액이 적정한지 판단하기조차 어려운 것이 현실이다. 벤더가 직접 청구하는 것이 아니라 중간에 끼어있는 로펌을 통해 디스커버리 비용을 청구하는 것도 내용 확인을 더욱 어렵게 만드는 요인이다.

청구 금액에 의문이 있다고 하더라도, 그 금액의 적정성에 대해 디스커버리 종료 후 업무 위탁한 벤더가 아닌 다른 벤더에게 '제3자로서 이 금액이 과연 적정하냐'고 물어볼 수도 없는 노릇입니다. 그렇다고 소송을 경험한 다른 기업의 법무부서에 "당신 회사에서는 디스커버리 비용이 얼마나 들었나요?"라고 물어보는 것도 비현실적이다. '라고 물어보는 것도 비현실적입니다. 결과적으로 디스커버리 비용의 내용은 애매모호한 상태로 시작해서 애매모호한 상태로 끝나는 경우가 매우 많다고 할 수 있습니다.

정확한 견적을 받기 위한 포인트

상대방으로부터 소장을 받고 소송을 하기로 결정한 단계에서, 아마도 변호사로부터 '디스커버리 대책을 세우라'는 요청을 받게 될 것입니다. 기업의 법무부서는 요청에 따라 디스커버리 지원 업체에 견적을 의뢰하고, 그 금액과 내용, 실적 등을 참고하여 업체를 선정하게 됩니다.

벤더 선정은 변호사 본인(정확히 말하면 변호사가 아닌 변호사가 소속된 로펌의 리티게이션 지원이라는 사내 부서)이 담당하게 됩니다. 그러나 여기서 주의해야 할 점은 이 디스커버리 벤더의 선정을 미국 로펌이나 미국 현지 법인에 일임하는 것은 매우 위험부담이 크다는 점입니다.

왜 그러냐면, 디스커버리 경험이 없는 기업 입장에서는 견적 내역이나 벤더 선정 업체를 파악하기 어려워 판단이 쉽지 않기 때문에 로펌의 말대로 벤더를 선정하고 말값으로 계약하는 경우도 적지 않게 볼 수 있기 때문입니다. 선택한 벤더의 작업이 고품질이면 좋겠지만, 그렇지 않다면 시세보다 높은 금액으로 계약한 후 저품질의 디스커버리를 진행하여 소송에서 불리한 결과를 초래할 수도 있다.

아래에서는 이러한 실패를 미연에 방지하기 위해 '실패하지 않는 견적서 보는 법'을 소개합니다.

양질의 디스커버리 벤더는 견적 항목이 세밀하다.

예시 1은 한 디스커버리 종합지원 벤더가 실제로 사용하고 있는 견적서입니다. 디스커버리 경험이 없는 법무 담당자에게는 처음 보는 내용일 수 있습니다.

자세한 설명은 나중에 하기로 하고, 여기서는 우선 자신이 디스커버리 벤더를 선정할 생각으로 나름대로의 소견과 의문점을 메모하면서 살펴보는 것을 추천한다. 나름대로의 해석과 의문점을 메모해 보시기 바랍니다.

그 후에 아래 해설을 보시면 어떤 오류에 빠지기 쉬운지 쉽게 이해할 수 있을 것입니다.

체크포인트 1.디스커버리 프로세스별로 견적이 산출되고 있는가?

'데이터 수집', '데이터 프로세스/분석', '데이터 호스팅' 등의 항목은 디스커버리의 각 공정을 나타낸다. 이렇게 프로세스별로 비용이 산출되어 있다면, 비록 개략적인 금액이라 할지라도 전체 금액에서 각 작업의 비용 비중을 쉽게 파악할 수 있습니다.

각 프로세스 중 '검토 비용'에 가장 많은 비용이 소요되는 것을 확인할 수 있습니다. 이 리뷰야말로 디스커버리에서 가장 중요한 과정으로, 감이 좋은 사람이라면 '이 리뷰 비용을 압축하면 전체 비용이 크게 달라지겠구나'라고 판단할 수 있을 것입니다.

체크포인트 2. 단가 x 예상 수량으로 가격이 계산되고 있는가?

디스커버리 작업은 문서를 수집하고, (문서를) 분석하고, 그 (문서)가 증거로 성립되는지 확인하고, (문서를) 제출하는 작업이다. 즉, 대상의 대부분이 '문서'입니다. 그래서 견적은 항상 '단가 기준'으로 산출되는 것이 일반적입니다.

하지만 문서 1장당 계산이 되면 정확한 개수를 조사하는 것만으로도 힘들기 때문에 실제로는 'PC 1대당', '하드디스크 1장당'과 같이 계산하는 경우가 많습니다. 또는 데이터마다 용량이 다르기 때문에 '1GB당'으로 계산하는 경우도 있습니다.

디스커버리 실적이 있는 벤더라면 기업 규모에 따라 어느 정도의 작업을 수행해야 하는지 파악하고 있을 것입니다. 여기서 산출되는 것이 '예상량'입니다. 즉, 디스커버리의 견적은 '단가 x 예상 수량'으로 총 비용이 산출되는 것입니다.

벤더에 따라서는 이 예상수량을 제시하지 않고 '단가'만으로 견적을 제시하는 곳도 적지 않습니다. '왜 총비용이 산출되지 않느냐'고 물어보면, 대부분 '얼마나 많은 데이터를 디스커버리할 지 모르기 때문에 산출할 수 없다'는 답변이 돌아올 것이다.

이 답변을 액면 그대로 받아들인다면 '그래, 데이터가 적으면 총 금액이 적고, 반대로 데이터가 많으면 총 금액이 늘어나겠구나'라고 이해할 수 있습니다.

이럴 때 법무 담당자가 비용 절감 방안으로 가장 먼저 생각하는 것은 '데이터 양 줄이기'입니다. 하지만 무심코 데이터 양을 줄이려고 본래 증거로 제출해야 할 것까지 삭제하면 증거은닉으로 역으로 처벌을 받을 수 있기 때문에 이 부분은 신중해야 합니다.

또한, '예상 데이터량을 모르겠다'는 답변은 자칫하면 '디스커버리 실적이 적다'거나 '추정치로 공개하고 싶지 않다'는 뜻으로 받아들여질 수도 있습니다. 추정치 산출방식이 대충대충일수록 추정금액과 실제 청구금액 사이에 차이가 발생해도 변명할 수 있기 때문입니다.

특히 시간당으로 산출되는 항목은 주의해야 합니다. 예를 들어, 리뷰 금액을 견적할 때 '시간당 문서 검토 건수 0건'이라는 데이터를 제시하는 벤더는 양심적이다. 하지만 그 기준이 명확하지 않다면 '일부러 시간을 늘려서 금액을 부풀리는 것'도 가능하다.

또한, 작업 품질이 낮은 벤더나 일본어 대응이 미흡한 벤더의 경우, 검토 전에 문자가 깨져서 데이터 프로세스 단계까지 거슬러 올라가서 작업을 다시 해야 하는 경우가 발생하기도 한다. 이러한 '벤더 자신의 실수'로 인한 재작업 비용을 발주처에 당당하게 청구하는 벤더도 적지 않다.

그렇기 때문에 견적은 '단가×예상 수량'으로 계산되는 것이 전제 조건입니다. 디스커버리 실적이 있는 벤더라면 기업 규모에서 예상 수량을 추정하는 것은 어렵지 않습니다.

체크포인트 3. '별도 요금'이 상세히 기재되어 있는가?

앞서 언급한 견적서에는 '(주)'로 별도로 발생하는 비용 항목이 기재되어 있습니다. 이는 일반적인 견적서에서는 당연한 사항이지만, 업체에 따라서는 아예 기재하지 않는 경우도 있습니다.

예를 들어, '일본어로 작성된 문서는 별도 견적에 의해 재계산한다'는 주의 사항이나 '메일러를 통해 송수신된 메일 분석은 별도 요금'과 같은, 원래는 사전에 설명해야 할 옵션들이 하나 둘씩 추가되어 결과적으로 처음 제시된 견적과 크게 차이가 나는 금액이 나왔다는 이야기를 자주 듣습니다. 금액이 크게 차이가 났다는 이야기도 자주 듣습니다.

또한, 후술할 호스팅 비용이나 로딩 파일 작성, 업로드 비용과 같은 작업이 견적에 포함되지 않은 경우도 많다. 또한 특수한 파일 형식을 처리하는 추가 작업도 비용에 포함되지 않는 경우가 많으므로, 특수한 파일 형식을 다루는 업체는 주의 깊게 확인하는 것이 좋다.

디스커버리의 작업 프로세스별 견적 보는 법

지금까지 견적을 보는 기본 사항과 전제 조건, 특히 타사와 견적을 비교하는 방법에 대해 간략하게 설명했습니다. 이제부터는 앞서 예시로 든 견적 예시를 따라 자세히 설명해 보겠습니다.

(1) 데이터 수집

데이터 수집은 좁은 의미에서 증거자료가 될 수 있는 데이터를 복제, 수집하는 것을 말합니다. 이 견적 예시에서는 준비 과정부터 복제, 수집에 이르는 과정을 한꺼번에 정리해 보았다. 준비과정은 즉, 데이타의 식별, 보존 작업이다.

  • 데이유 식별 및 보존의 첫 번째 단계는 청문회입니다. 소송과 관련된 부서 및 관계자 파악을 시작으로 정보시스템 담당자에게는 시스템 및 파일 형식 확인은 물론, 데이터 보관 규칙 및 규정에 대한 설명을 들어야 합니다.
  • 데이터의 덮어쓰기, 분실, 변조 등이 발생하지 않도록 보존 절차에 대해서도 논의하고 관계자의 동의를 얻어야 합니다.
  • 어떤 인물이 어떤 자료를 소지하고 있는지, 혹은 어떤 매체에 어떤 데이터가 저장되어 있는지, 추후 디스커버리 작업에서 바로 확인할 수 있도록 '데이터 맵'을 작성하는 것도 필요하다.

이 데이터 수집을 위해 벤더는 엔지니어를 기업에 파견해야 한다. 이 작업은 며칠에 걸쳐 진행되는 경우가 많으며, 이 경우 교통비와 숙박비가 별도로 추가된다. 또한, 견적서의 '예상 수량'은 대상 디바이스에 대한 작업 비용이며, 복제된 데이터를 저장하는 하드디스크나 이를 백업하기 위한 하드디스크는 별도로 청구될 수 있습니다.

(2) 데이터 프로세스

데이터 프로세스는 수집한 데이터를 분석하기 위해 전자 데이터에서 필요한 정보를 추출하여 데이터베이스로 만드는 '데이터 처리' 작업이다.

전 과정에서 보존-수집한 데이터는 방대한 양으로, 이를 원고-피고가 모두 열람하는 것은 불가능하다. 당연히 소송과 무관한 데이터도 많이 포함되어 있고, 이러한 불필요한 서류를 신속하게 걸러내야 합니다.

데이터 프로세스 작업에는 데이터 컬링(culling), 필터링과 관련된 7가지 작업과 그 주변 작업(준비 작업 등)이 포함된다.

아래 ①~⑥은 ⑦과 그 이후의 데이터 분석을 위한 준비 작업이다. 컬링은 전혀 관련이 없는 데이터를 사전에 대상에서 제외하는 것으로, 가장 쉽게 이해할 수 있는 것은 프로그램의 구성 파일이나 OS의 구성 파일을 제외하는 작업입니다.

데이터 프로세스 작업

① 압축 파일이나 아카이브 파일 압축 풀기
② 프로그램 파일 및 OS 데이터 제외
③ 중복 파일 삭제
날짜 및 기간별 필터링
⑤ 텍스트 정보 추출
⑥ 메타데이터 추출
⑦ 검색용 인덱스 생성

압축된 파일은 그대로는 내용을 확인할 수 없으므로 압축을 풀어서 확인할 수 있도록 하고, 동일한 파일을 여러 관계자가 소지하고 있거나 여러 기록 매체에 저장되어 있는 경우에는 그들도 대상에서 제외합니다. 어느 정도 범위를 좁힌 후 텍스트 정보와 메타데이터 정보를 추출하여 생성된 인덱스별로 정리하여 저장합니다.

현재 디스커버리에서 공개되는 정보의 대부분은 전자 데이터입니다. 여러 대의 컴퓨터와 서버, 모바일 단말기에 저장된 데이터, 이메일의 아카이브 데이터까지 포함하면 방대한 정보량이 됩니다. 앞서 언급했듯이 컴퓨터 1대 분량의 데이터를 출력하면 2톤 트럭 4대 분량의 서류가 된다고 하니, 20명의 관리인(데이터 보유자)이 있다면 순전히 트럭 80대 분량의 서류가 대상이 되는 셈입니다.

그 모든 서류를 변호사나 스탭 로이어가 일일이 눈으로 보고 증거로 채택할 것인지 아닌지를 가려내는 것은 사실상 불가능하다. 설령 가능하다고 해도 변호사 비용만 해도 엄청난 비용이 필요하고, 시간도 엄청나게 소요될 것이다.

또한, 소송과 무관한 데이터를 공개하는 것은 기업 전략상 불리한 것은 분명하다. 신제품에 대한 정보를 출시 전에 미리 공개하는 일이 있어서는 안 된다.

그렇기 때문에 고도의 IT 기술을 이용해 소송과 관련이 없는 서류는 철저히 가려내야 한다. 이 분류 작업이 '데이터 프로세스'이며, 이 작업의 정확성이 이후 디스커버리 과정의 정확성을 좌우하는 매우 중요한 작업입니다.

(3) 데이터 분석

데이터 분석에서는 지금까지의 과정을 통해 준비된 데이터를 분석하여 증거자료를 검토하기 위한 준비를 한다. 세부적인 데이터 프로세스 작업을 진행하더라도 소송과 무관한 데이터는 여전히 큰 비중을 차지하기 때문이다. 따라서 기업과 변호사가 키워드를 선정하고, 디스커버리 지원 벤더가 협력하여 기술적 자문을 제공합니다.

이후 더욱 고도화된 키워드 검색을 통해 대상 데이터를 특정하고 추출하여 필요한 데이터만 선별하는 과정을 거칩니다. 이를 '분석(애널리시스)'이라고 합니다.

여기서 발생하는 작업은 크게 세 가지로 나뉩니다.

키워드 검색

ASCII 코드 및 아시아 언어 처리

언어 감지

분석이 적절히 이루어지고 필요한 데이터를 선별할 수 있다면, 다음 단계인 검토의 정확성과 효율성이 높아져 디스커버리 자체도 원활하게 진행될 수 있다.

여기서 주의해야 할 점은 벤더가 ②와 같이 아시아 언어에 대응한 처리를 하고 있는지 여부이다.

일본어가 지원되지 않으면 검토 과정에서 '문서가 깨져서 볼 수 없다' 또는 '문서가 충분히 좁혀지지 않는다'는 문제가 발생하여 계획대로 검토가 완료되지 않는 등의 문제가 발생할 수 있습니다.

'일본어를 읽을 수 있는' 환경과
'일본어에 대응할 수 있는' 환경은 다르다.

일본 고유의 애플리케이션 문화에 대응하고 있는지도 중요하다. 예를 들어 메일 소프트웨어(메일러)는 Microsoft사의 Outlook을 사용하는 기업이 많다고 생각하지만, 일본에서는 RimArts사의 Becky!

외부와의 커뮤니케이션 도구인 이메일의 정보는 디스커버리에서 매우 중요한 의미를 가지고 있음에도 불구하고, 이러한 일본 고유의 메일러를 지원하지 않는다면 프로세스 작업의 정확도가 현저히 떨어질 수 밖에 없다.

견적서에는 그 부분까지 명시되어 있지 않은 경우가 많고, '일본어 파일은 별도 요금'이라고 명시되어 있다면 그나마 양심적이지만, 애초에 일본어 파일에 대응할 수 있는지, 대응할 수 있다면 견적 범위 내인지, 일본 고유의 애플리케이션도 지원하는지 등을 꼼꼼히 확인하는 것이 좋다, 라는 부분까지 꼼꼼히 확인하는 것이 좋습니다.

(4) 데이터 호스팅

데이터 호스팅은 리뷰에 사용할 데이터를 리뷰 툴에서 열람할 수 있도록 지정된 서버에서 관리하는 것을 말한다.

과거 사례를 보면, 견적 단계에서 단가가 가장 낮았던 벤더의 호스팅 총액이 타사의 약 3배에 달하는 경우도 있었다. 어느 단계에서 어떤 데이터를 호스팅하느냐에 따라 금액이 크게 달라지는 것이다.

안타깝게도 디스커버리 업계에는 아직 디스커버리 프로세스 관리(진행 방식)에 대한 글로벌 표준이 존재하지 않는다. 어느 단계에서 호스팅을 하든, 결과적으로 증거를 공개할 수만 있다면 그것으로 충분하다는 생각이 팽배해 있습니다. 그래서 언제까지나 '표준 견적서'가 나오지 않는 것이다. 업체마다 비용 산출 근거가 다르기 때문입니다.

디스커버리 입문(1/7): 디스커버리 벤더 선택은 남의 손에 맡겨서는 안 된다!  에서 언급했듯이, 데이터 압축을 풀기 전의 데이터 용량으로 청구할 것인지, 압축을 풀고 난 후의 데이터 용량으로 청구할 것인지, 업체마다 계산 방식이 달라 단가는 저렴하지만 압축을 풀고 난 후의 데이터 용량이 몇 배로 늘어나는 사례 등이 대표적인 예입니다.

디스커버리를 의뢰하는 측의 법무담당자는 이러한 인식을 가지고 계신가요? 단순히 '호스팅'이라고 적혀있으면 단가만 보고 비교하는 것은 위험합니다. 명확한 가이드라인이 없는 산업이기 때문에 단가가 아닌 총비용을 살펴볼 필요가 있습니다.

최근에는 디스커버리가 끝난 후에도 수집한 데이터를 그대로 호스팅하는 기업이 늘고 있습니다. 소송이나 당국의 조사-수사가 크로스 보더(Cross Border) 사안으로 발전할 경우, 동일한 데이터를 다른 소송이나 조사-수사의 디스커버리에서 사용할 수 있기 때문이다. 따라서 지속적으로 호스팅을 진행할 가능성이 높은 기업은 업체에게 디스커버리 종료 후 발생하는 호스팅 비용에 대해서도 문의하는 것이 좋다.

(5) 프로젝트 관리

대부분의 국제 소송에서의 디스커버리 안건에서는 프로젝트 총괄에 프로젝트 매니저를 2명 정도 배치하는 것이 바람직하다고 알려져 있습니다. 프로젝트 매니저의 역할은 기업의 법무 담당자와 함께 검색 키워드 설정을 고민하고, 검토용 문서 배치를 작성하며, 기업과 로펌 사이에 끼어 원활한 프로젝트 진행을 지원하는 것 등을 들 수 있습니다.

프론테오의 경험상 프로젝트 매니저가 한 프로젝트에 투입하는 시간은 한 달에 20시간 정도다. 단, 이와 관련하여 발생하는 교통비, 출장비 등은 별도로 청구되므로 해외 벤더에 의뢰할 경우 이러한 비용이 발생한다는 점에 유의해야 한다.

예2) 프로젝트 매니지먼트 견적서

(6) 검토 비용

'디스커버리 비용 = 리뷰 비용'이라고 해도 과언이 아닐 정도로 비용 중 많은 부분을 리뷰 비용이 차지하게 된다. 견적서를 보면 알 수 있듯이, 검토 비용의 대부분은 인건비입니다.

그래서 최근에는 리뷰에 '프리딕티브 코딩(Predictive Coding)'이라는 컴퓨터 자동분석을 도입하는 기업들이 늘어나고 있습니다.

프론테오는 인공지능을 이용해 아시아 언어를 분석할 수 있는 프리딕티브 코딩을 개발하여 실제 안건에 적용해보니, 미국인이 리뷰 작업을 한 경우와 비교하여 타사 대비 1/3의 기간으로 처리할 수 있었습니다. 또한 인건비가 발생하지 않아 소요되는 비용은 5분의 1로 압축되는 결과를 가져와 고객사로부터 높은 평가를 받을 수 있었습니다.

2019/11/25자 보도자료 " FRONTEO, 미국에서 AI 검토 툴 'KIBIT Automator' 실증 실험 실시, 미국 내 본격 전개 시작 " 검토 대상 문서량 20% 감소, 문서 검토에 소요되는 평균 속도 1시간에 약 92건, 전체 약 30%의 비용 절감 실현 비용 절감 실현

프리딕티브 코딩을 사용할지 여부는 벤더의 판단에 따라 다르며, 정확도도 다양하다. 견적을 확인할 때는 프리딕티브 코딩 사용 여부와 함께 프리딕티브 코딩의 정확도, 리콜률도 함께 확인하는 것이 좋다.

참고로, 많은 디스커버리 벤더들은 이 정밀도와 회수율을 제시하는 데 있어서는 후순위로 밀리는 경우가 많다. 디스커버리 실적이 있는 데이터라면 샘플을 가지고 있을 텐데, '일본어가 어려워서 요율을 제시할 수 없다'는 핑계를 대며 제시하지 않는 경우가 많은 것도 사실입니다. 요금은 검토 비용과 직결되기 때문입니다.

(7) 프로덕션

프로덕션은 증거 제출에 필요한 작업입니다. 검토를 통해 증거서류가 선정된 단계에서 소송대리인인 변호사가 상대방에게 어떤 증거파일을 제출할 것인지 결정합니다. 벤더는 변호사가 지정한 데이터를 증거로 신뢰할 수 있는 파일 형식(Tiff 형식)으로 가공하고, 필요에 따라 영어 번역 파일을 작성합니다.

사안에 따라 다르지만, 검토 대상 파일 중 프로덕션에 들어갈 수 있는 파일은 대략 3% 정도입니다. 예를 들어, 검토 파일이 9만 개라면 그 중 2,700개의 파일을 프로덕션하게 되는 것입니다.

이전 글: 디스커버리 입문(5/7): 디스커버리 노하우 못지않게 중요한 디스커버리 벤더의 기술력

다음 기사:디스커버리 입문(6/7): 비용 관리의 핵심은 견적 확인에 있다(Part 2)