
디스커버리 입문(5/7): 디스커버리 노하우와 마찬가지로 중요한 디스커버리 벤더의 기술력
2020년 2월 29일
용어집
2020년 3월 5일
모든 비즈니스의 장면에서 '상견적'을 취하는 것이 일반적으로 되어 있습니다만, 실은 디스커버리 업계에서는 상견적에 이르는 경우는 많지 않습니다.
그 이유는, 벤더에 의해 견적의 형식이 제대로 되고, 견적의 견해를 모르는, 비교할 수 없는, 이라는 점에 있습니다.경쟁 기업이 적다는 것은 아닙니다.오히려, 디스커버리 시장은 기업이 보유한 데이터량의 증가에 비례하여 확대를 계속하고 있으며, 새로운 디스커버리 지원 벤더나 벤더가 잇달아 탄생하고 있습니다.이 점이 기업 측이 잘 발견의 비용을 제어할 수 없는 제일 이유인 것 같습니다.
견적액과 청구액에 차이가 있는 것은 일상차반사?
제조 판매업이든 서비스업이든, 일반적인 비즈니스에서는 견적 가격과 실제 가격이 크게 다른 경우는 드뭅니다.만약 실제 청구액이 견적보다 대폭 늘었다는 것이 되면, 발주 담당자에게 폐가 걸리고, 계약한 기업도 견적 단계에서의 계획성의 단맛을 지적될 수 있기 때문에, 조금 오버한 정도라면 견적대로의 금액으로 담아 버립니다.부득이한 사정으로 견적액을 넘어 버리는 것이 예상되는 경우에서도, 수주측으로부터 발주측에 한마디 걸어, 허가를 얻는 것이 통상은 아닐까요.
그러나 검색 업계에서는 예상 금액과 실제 청구 금액이 크게 다른 경우가 종종 발생합니다.이것은 견적이 "참고 가격"일 뿐임을 보여줍니다.견적 단계에서 여러 회사의 가격을 비교해 싼 벤더를 선택했을 생각이, 최종적으로 청구액을 보면 다른 벤더보다 비싸게 되었다고 하는 케이스도 적지 않습니다.
게다가 기업에 있어서는, 그렇게 청구된 금액이 타당한지의 판단조차 어렵다는 것이 현상입니다.벤더로부터 직접 청구되는 것이 아니라, 사이에 들어 있는 법률 사무소를 통해 디스커버리 요금을 청구된다고 하는 것도, 불필요하게 내용을 확인하기 어렵게 하고 있는 요인입니다.
청구 금액에 의문이 있었다고 해도, 그 금액의 타당성에 대해서, 디스커버리 종료 후에 업무 위탁한 벤더 이외의 벤더에게 「제삼자로서 이 금액은 과연 타당입니까」라고 물어볼 수 없습니다.그렇다고 소송을 겪은 다른 기업의 법무부에 "당신의 회사에서는 얼마나 발견 비용이 들었습니까?"라고 듣는 것도 비현실적입니다.그 결과, 발견의 비용 내용은 모호한 채로 시작하고, 모호한 채로 끝나는 경우가 매우 많다고 말할 수 있습니다.
올바른 견적을 얻기 위한 포인트
상대방으로부터 소장이 도착해, 응소하기로 결정한 단계에서, 아마 변호사로부터는 「디스커버리 대책을 강구하도록(듯이)」라고의 요구가 있을 것입니다.기업의 법무부는 요청을 받고, 디스커버리 지원 벤더에 견적을 의뢰해, 그 금액과 내용, 실적 등을 참고로 하여 벤더를 선정해 가게 됩니다.
벤더 선택은, 변호사 자신(정확하게 말하면 변호사가 아니고, 변호사가 소속하는 법률 사무소의 리티게이션·서포트라고 하는 사 내부서)가 실시합니다.그러나 여기서 주의해야 할 것은 이 디스커버리 벤더의 선정을 미국의 법률 사무소나 미국의 현지 법인에 일임하는 것은 매우 위험이 크다는 점입니다.
왜냐하면, 발견 경험이 없는 기업에 있어서는, 견적의 내역이나 벤더 선택의 기업이 알기 어려운 판단이 어렵기 때문에, 법률 사무소가 말하는대로 벤더를 선택해, 말한 값으로 계약해 버리는 케이스 적지 않은 경우를 볼 수 있습니다.선택한 벤더의 작업이 고품질이면 좋지만, 그렇지 않은 경우, 시세보다 높은 금액으로 계약한 후에 저품질의 발견이 되어 버려, 소송이 불리한 결과가 되어 버린다 눈도 맞지 않습니다.
아래에서는 이러한 실패를 미연에 방지하기 위해 "실패하지 않는 견적의 견해"를 소개합니다.
고품질의 디스커버리 벤더는 견적의 항목이 세세하다
예 1은 특정 검색 종합 지원 벤더가 실제로 사용하는 견적서입니다.디스커버리를 경험한 적이 없는 법무 담당자에게는, 처음으로 보는 내용일지도 모릅니다.
자세한 해설은 나중에 실시하기 때문에, 여기서는 우선, 자신이 디스커버리 벤더를 선택할 생각으로, 나름대로의 소견이나 의문점을 메모하면서 보는 것을 추천합니다.나름대로의 해석이나 의문점을 메모해 보세요.
그 다음에 아래의 해설을 보시면 어떤 오류에 빠지기 쉬운지 알기 쉬울 것입니다.
체크 포인트 1.검색 프로세스별로 추정치가 계산됩니까?
"데이터 컬렉션", "데이터 프로세스 / 분석", "데이터 호스팅"과 같은 항목은 검색의 각 단계를 보여줍니다.이렇게 하여 공정마다 비용이 산출되어 있으면, 비록 대략적인 산정이라도 총 금액에 있어서의 각 작업의 비용 비율을 알기 쉽습니다.
각 공정 중에서도 '리뷰 비용'에 가장 많은 비용이 든다는 점에 주의합시다.이 리뷰가 발견의 가장 중요한 공정으로, 감이 좋은 분이라면 “이 리뷰 비용을 압축하면 전체의 비용이 크게 바뀌는 것은 아니다”라고 판단할 수도 있을 것입니다.
검색 작업에서는 문서를 수집하고 (문서를) 분석하고 (문서)가 증거로 성립하는지 확인하고 (문서를) 제출합니다.즉, 대상의 대부분이 "문서"입니다.따라서 견적은 항상 "단가 기준"으로 계산되는 것이 일반적입니다.
그러나, 문서 1부당의 계산이 되면 정확한 수를 조사하는 것만으로도 힘들기 때문에, 실제로는 「PC 1대당」 「하드 디스크 1장당」이라고 하는 세는 방법을 합니다.혹은 데이터 마다 용량이 다르기 때문에 「1 GB당」이라고 하는 계산을 하는 경우도 있습니다.
디스커버리의 실적이 있는 벤더라면, 기업 규모에 따라 어느 정도의 작업을 실시하면 좋을지 파악하고 있는 것입니다.거기서 산출되는 것이 「상정량」입니다.결국, 발견의 견적은 「단가 x 상정량」으로 총 코스트가 산출되는 것입니다.
벤더에 따라서는 이 상정량을 나타내지 않고 「단가」만의 견적서를 제시하는 곳도 적지 않습니다. "어째서 총비용이 산출되지 않는가?"라고 물어보면 대부분 "얼마나의 데이터량을 발견하게 될지 모르기 때문에 산출할 수 없다"는 응답이 돌아올 것입니다.
이 답변을 액면대로 받으면 "과연, 데이터가 적으면 총 금액도 적어지고, 반대로 데이터가 많으면 늘어난다"라고 이해할 수 있습니다.
그렇게 되었을 때 법무 담당자가 비용 절감의 방법으로서 가장 먼저 생각하는 것은 「데이터량의 삭감」입니다.그렇지만, 부주의하게 데이터량을 삭감하려고 하고, 본래 증거로서 제출해야 하는 것까지 삭제해 버리면, 증거의 숨기기로서 반대로 처벌될 수 있으므로, 그 근처는 신중하게 되지 않아서 하지 마십시오.
또, 「상정 데이터량을 모르겠다」라고 하는 회답은, 우울한 견해를 하면 「디스커버리의 실적이 적다」혹은 「견적으로서 공개하고 싶지 않다」라고도 포착됩니다.견적의 산출 방법이 어색한 것이 있을수록, 견적액과 실제의 청구 금액의 사이에 오픈이 있어도 변명을 할 수 있기 때문입니다.
특히 시간당 산출된 항목은 주의해야 합니다.예를 들어 리뷰 금액을 견적할 때 "문서를 시간당 1장 검토한다"라는 데이터가 표시된 벤더는 양심적입니다.그러나 그 날 저녁이 분명하지 않은 경우, "일부와 시간을 들여 금액을 올리는"것도 되어 버립니다.
또, 작업 품질이 낮은 벤더나 일본어 대응이 되어 있지 않은 벤더의 경우에는, 리뷰 전에 문자 깨짐이 발생해, 데이터 프로세스의 단계까지 거슬러 올라 작업의 재실행이 필요하게 되는 경우가 발생해 합니다.그러한 「벤더 자신의 실수」에 기인하는 재실행 작업을 발주자에게 당당히 청구해 오는 벤더도 적지 않습니다.
그러므로 견적은 「단가×상정량」으로 계산되고 있는 것이 전제 조건입니다.디스커버리에 입증된 벤더라면 기업 규모에서 상정량을 추측하는 것은 어렵지 않습니다.
서두에 든 견적에서는 「(주)」로서 별도 발생하는 비용의 항목이 기재되어 있습니다.이것도 일반적인 견적으로서는 당연한 일이라고 말할 수 있습니다만, 벤더에 따라서는 전혀 적지 않는 경우도 있습니다.
예를 들면, 「일본어로 작성된 문서는 별도 견적에 의해 다시 계산한다」라고 하는 주의 사항이나, 「메일러를 통해서 송수신된 메일의 해석은 별도 요금」이라고 하는, 본래는 사전에 설명해야 할 옵션이 다음 부터 다음으로 가산되어 결과적으로 최초로 제시된 견적에서 크게 벗어난 금액이 되었다는 이야기도 자주 듣습니다.
또, 후술하는 호스팅 비용이나 로드 파일 작성, 업로드 비용 등의 작업이 견적에 포함되어 있지 않은 경우도 많습니다.게다가 특수한 파일 형식의 처리에 대처하는 추가 작업도 비용에 포함되지 않는 경우가 많기 때문에, 그러한 파일을 취급하는 기업은 주의해 확인하는 것을 추천합니다.
디스커버리의 작업 공정별 견적의 견해
지금까지, 견적을 볼 때의 기본적 사항이나 전제 조건, 특히 타사와 상견 견적을 취했을 때의 비교 방법에 대해서 간단하게 설명했습니다.여기에서는, 앞서 예로 든 견적 예에 따라서, 상세를 설명해 갑니다.
(1) 데이터 수집
데이터 콜렉션이란, 협의적으로 말하면 증거가 될 수 있는 데이터를 복제, 수집하는 것입니다.이 견적 예에서는 준비 공정에서 복제, 수집에 이르기까지의 프로세스를 한꺼번에 정리하고 있습니다.준비 공정이란, 즉, 데이 저녁의 특정, 보전 작업입니다.
- 데이 저녁의 특정・보전의 패스트 스텝으로서, 히어링을 실시합니다.소송과 관련된 부서나 관계자의 식별로 시작하여 정보시스템 담당자에 대해서는 시스템이나 파일 형식의 확인은 물론, 데이터의 보관 룰이나 규정에 대해서도 알아야 합니다.
- 데이터의 덮어쓰기나 소실, 변조 등이 행해지지 않도록 보전의 순서에 대해서도 협의해, 관계자의 동의를 얻어 둘 필요가 있습니다.
- 어떤 인물이 어떤 자과를 소지하고 있는지, 또는 어떤 미디어에 어떤 데이터가 저장되어 있는지, 나중에 발견 작업에서 즉시 확인할 수 있도록 "데이터 맵"을 작성하는 것도 필요합니다.
이 데이터 콜렉션을 수행하기 위해 공급업체는 엔지니어를 회사에 파견해야 합니다.작업은 며칠에 걸쳐 행해지는 경우가 많아, 그 경우의 교통비나 숙박비는 별도 가산합니다.또, 견적에 있는 「상정량」이란 대상 디바이스에 대한 작업비이며, 복제한 데이터를 보존하는 하드 디스크나, 한층 더 그것을 백업하기 위한 하드 디스크는 별도 청구가 되는 경우도 있습니다.
(2) 데이터 프로세스
데이터 프로세스는 수집된 데이터를 분석하고 전자 데이터에서 필요한 정보를 검색하고 데이터베이스화하는 "데이터 처리" 작업입니다.
전 공정에서 보전·수집한 데이터는 방대한 양으로, 이것을 원고·피고가 모두 열람하는 것은 불가능합니다.당연히 소송에 관계가 없는 데이터도 많이 포함되어 있어 그러한 불필요한 서류를 신속하게 체로 떨어뜨려 나가야 합니다.
데이터 프로세스 작업에는 데이터 컬링(culling), 필터링과 관련된 7가지 작업 및 주변 작업(예: 준비 작업)이 포함됩니다.
아래에 나타내는 ①~⑥는 ⑦ 및 이후의 데이터 분석을 위한 준비 작업이 됩니다.컬링이란, 전혀 관계가 없는 데이터를 사전에 대상으로부터 제외하는 것으로, 가장 알기 쉬운 것은 프로그램의 구성 파일이나 OS의 구성 파일을 제외하는 작업입니다.
① 압축 파일이나 아카이브 파일의 전개
② 프로그램 파일 및 OS 데이터 제외
③ 중복 파일 삭제
④ 날짜 및 기간별 필터링
⑤ 텍스트 정보 추출
⑥ 메타데이터 추출
⑦ 검색용 인덱스 작성
압축된 파일은, 그대로는 내용을 확인할 수 없기 때문에, 전개해 확인할 수 있도록 해, 같은 파일을 복수의 관계자가 소지하고 있거나 복수의 기록 매체에 보존하고 있는 경우에 그들도 대상에서 제거합니다.어느 정도 좁히고 텍스트 정보와 메타 데이터 정보를 추출하여 작성된 인덱스마다 정리하고 저장합니다.
현재 검색에서 공개되는 대부분의 정보는 전자 데이터입니다.여러 대의 PC와 서버, 이동 단말기에 저장된 데이터, 이메일의 아카이브 데이터까지 포함하면 방대한 정보량이 됩니다.전술한 바와 같이, PC 1대분의 데이터를 프린트 아웃하면 2톤 트랙 약 4대분의 서류가 되어 버리기 때문에, 카스트디안(데이터 보유자)이 20명 있으면 순수하게 트랙 80대분의 서류 가 대상이 되어 버립니다.
그 모든 서류를 변호사나 스탭 로이어가 육안해, 증거로서 채용할지 어떨지를 특정해 가는 것은 사실상 불가능합니다.만약 가능하다고 해도, 변호사에게의 지불만으로 거액의 비용이 필요해, 게다가 기분이 멀어지는 것 같은 시간이 필요합니다.
또한 소송과 무관한 데이터를 공개하는 것은 기업 전략에 불리하다는 것이 분명합니다.신제품에 관한 정보를, 발매전에 미스미스 공개하는 일이 있어서는 안됩니다.
그러므로 고도의 IT 기술을 이용해 분명히 소송과 관계 없는 서류를 흔들어 떨어뜨리게 됩니다.이 분류의 작업이 「데이터 프로세스」이며, 이 작업의 정밀도가 후의 디스커버리 공정의 정밀도에 관련되어 오는, 매우 중요한 작업입니다.
(3) 데이터 분석
데이터 분석은 이전 단계에서 준비된 데이터를 분석하고 증거가 되는 데이터를 검토할 준비를 합니다.상세한 데이터 프로세스 작업을 수행하더라도 소송과 관련이 없는 데이터는 여전히 큰 비율을 차지하기 때문입니다.거기서 기업과 변호사가 키워드를 선정하고, 디스커버리 지원 벤더가 협력해, 기술적인 어드바이스를 실시해 갑니다.
그 후, 한층 더 고도의 키워드 검색을 실시해 대상 데이터를 특정·추출해 가는 것으로, 필요한 데이터만으로 좁히기를 합니다.이것이 "분석 (분석)"이라고 불리는 작업입니다.
여기에서 발생하는 작업은 크게 나누어 세 가지가 있습니다.
① 키워드 검색
② ASCII 코드 및 아시아 언어 처리
③ 언어 검출
분석이 제대로 이루어지고 필요한 데이터를 좁힐 수 있다면 다음 공정인 리뷰의 정확성과 효율성이 높아지고 검색 자체도 원활하게 진행될 것입니다.
여기서 주의해야 하는 것은 벤더가 ②와 같이 아시아 언어에 대응한 처리를 하고 있는지.
일본어를 지원하지 않으면 검토 과정에서 "서류가 깨져서 볼 수 없다"또는 "문서의 좁히기가 충분하지 않다"라는 문제가 발생하고 리뷰가 계획대로 종료되지 않는다는 문제가 발생한다. 또한 생각할 수 있습니다.
「일본어를 읽을 수 있다」라는 환경과
「일본어에 대응할 수 있는」환경은 다르다
일본 독자적인 어플리케이션 문화에 대응하고 있는지도 중요합니다.예를 들면 메일소프트(메일러)는 Microsoft사제의 Outlook을 사용하고 있는 기업이 많다고 생각되고 있습니다만, 일본에서는 RimArts사제 「Becky!」나 JustSYSTEMS사제의 「Shuriken」등을 사용하고 있다 기업도 적지 않습니다.
외부와의 커뮤니케이션 툴인 전자 메일의 정보는, 디스커버리에 있어서 매우 중요한 의미를 가지는 것에도 불구하고, 이러한 일본 독자의 메일러에 대응하고 있지 않다면, 프로세스 작업의 정밀도는 현격히 떨어지고 버립니다.
견적에서는 그 근처까지 기록되어 있지 않은 경우가 많고, 「일본어 파일은 별도 요금」이라고 적혀 있으면 아직 양심적입니다만, 원래 일본어 파일에 대응할 수 있을지 어떨지, 대응할 수 있다고 한다 그렇다면 견적 범위 내인지, 일본 독자적인 어플리케이션도 대응하고 있는지, 라는 점에서 제대로 확인하는 것이 좋을 것입니다.
(4) 데이터 호스팅
데이터 호스팅은 리뷰에서 사용할 데이터를 검토 도구에서 볼 수 있도록 지정된 서버에서 관리하는 것입니다.
과거에 본 예에서는 상가 추정 단계에서 가장 단가가 낮은 벤더의 호스팅 총액이 타사의 약 3배가 되었던 적이 있었습니다.어떤 단계에서 어떤 데이터를 호스팅하는지에 따라 금액이 크게 달라집니다.
불행히도, 디스커버리 산업에는 디스커버리의 공정 관리(진행 방법)의 글로벌 표준은 아직 없습니다.어느 단계에서 호스팅을 하겠지만, 결과적으로 증거를 공개할 수 있으면 그것으로 좋다는 사고방식이 가득 찼습니다.그 때문에 언제까지 지나도 「표준적인 견적서」가 나타나지 않습니다.벤더마다 비용 산출 근거가 다릅니다.
디스커버리 입문(1/7): 디스커버리 벤더 선택은 인격으로 하지 않는다! 에서 언급했듯이 데이터 압축을 압축 해제하기 전에 데이터 용량으로 과금할지, 압축 해제 후 데이터 용량으로 과금할지, 벤더에 따라 계산 방법이 다르고, 단가는 싸더라도 압축 해제 후 데이터 용량이 몇 배로 부풀어 오르는 안건 등은 그 가장 좋은 예입니다.
디스커버리를 의뢰하는 측의 법무 담당자는 그러한 인식을 가지고 있습니까?단순히 "호스팅"이라고 쓰면 단가만을 비교해 버리는 것은 위험합니다.명확한 가이드라인이 없는 업계이기 때문에 단가가 아니라 비용의 총액을 살펴볼 필요가 있습니다.
최근에는 검색이 종료된 후에도 수집한 데이터를 그대로 호스팅하는 기업이 늘고 있습니다.소송이나 당국 조사·수사가 크로스·보더 안건으로 발전한 경우는 같은 데이터를 다른 소송이나 조사·수사의 디스커버리로 이용하는 일이 있기 때문입니다.따라서 지속적으로 호스팅 할 가능성이 높은 기업은 검색이 완료된 후 발생하는 호스팅 수수료를 공급 업체에게 요청하는 것이 좋습니다.
(5) 프로젝트 관리
대부분의 국제 소송에서의 발견 안건에서는 프로젝트의 총괄에 프로젝트 매니저를 2명 정도 배치하는 것이 바람직하다고 합니다.프로젝트 매니저의 역할은 기업의 법무 담당자와 함께 검색 키워드 설정을 생각하고, 리뷰용 문서 배치를 작성하거나, 기업과 법률 사무소 사이에 들어가 원활한 프로젝트 진행을 지원 등을 들 수 있다. 합니다.
FRONTEO의 지금까지의 경험상, 1개의 프로젝트에 프로젝트 매니저가 소비하는 시간은 월 20시간 정도입니다.다만 관련하여 발생하는 교통비·출장비 등은 별도 청구되므로 해외 벤더에게 의뢰하는 경우에는 이러한 비용이 발생하는 것에 주의가 필요합니다.
예 2) 프로젝트 관리 견적서
(6) 리뷰 비용
「디스커버리 비용=리뷰 비용」이라고 해도 과언이 아닐 정도로, 비용 중 많은 비율을 리뷰 비용이 차지하게 됩니다.견적을 보면 알 수 있듯이 리뷰 비용의 대부분이 인건비입니다.
거기서 최근에는 리뷰에 있어서 「프레디쿠티브·코딩」이라고 하는 컴퓨터에 의한 자동 해석을 도입하는 기업이 늘고 있습니다.
FRONTEO에서는 인공지능을 이용해 아시아 언어를 해석할 수 있는 프레디크티브 코딩을 개발하여 실제 안건에서 이를 이용한 결과 미국인이 리뷰 작업을 한 경우와 비교하여 타사 상정의 3분의 1의 기간에 처리할 수 있었습니다.게다가 인건비가 발생하지 않기 때문에, 걸린 비용은 5분의 1로 압축되는 결과가 되어 고객의 높은 평가를 얻을 수 있었습니다.
프레 딕티브 코딩을 사용할지 여부는 벤더의 판단에 따라 정확도도 마을입니다.견적을 확인할 때는 접두사 코딩을 사용하거나 사용하지 않고 접두사 코딩의 프리시전 속도 및 리콜 속도를 확인하는 것이 좋습니다.
덧붙여서, 많은 디스커버리벤더에서는, 이 프리시전 레이트, 리콜 레이트를 제시하는 것은 뒤로 향해야 합니다.디스커버리 실적이 있는 데이터라면 샘플은 가지고 있을 것입니다만, 「일본어는 어렵기 때문에 레이트는 낼 수 없다」라고 하는 말 탈출을 해 나오지 않는 케이스가 많은 것도 사실입니다.요율은 리뷰 비용에 직접 연결되어 있기 때문입니다.
(7) 프로덕션
프로덕션이란 증거 제출에 걸리는 작업입니다.리뷰에 의해 증거가 되는 서류가 선택된 단계에서, 소송 대리인인 변호사가 상대방에게 어느 증거 파일을 제출할지 결정합니다.공급업체는 변호사가 지정한 데이터를 증거로 신뢰할 수 있는 파일 형식(Tiff 형식)으로 처리하고 필요한 경우 영어 번역 파일을 만듭니다.
프로젝트에 따라 다르지만 검토 대상 파일 중 프로덕션 대상은 약 3 %입니다.만일 리뷰 파일이 9만 파일 있으면 그 중 2,700 파일을 프로덕션하게 된다는 것입니다.