トピック解説/コラム

ディスカバリ入門(7/7):ベンダーのディスカバリ対応力を見極めるために必ず質問したいこと

ディスカバリを進めていく上で、企業が主導権を握ることができなければコスト・コントロールもできません。これまで述べてきたように日本企業にとって望ましいのは、ディスカバリベンダーと直接契約することです。

そこで、ベンダー選定および交渉の場面で、必ず聞いておいたほうが良いこと、それに対する理想の回答、注意すべき回答例、その理由を簡潔にまとめてみました。

① ディスカバリのカバー範囲はどこからどこまで?
理想の回答 注意すべき回答
自社で全ての工程を手掛けている。 1. (再委託によって)全ての工程を手掛けている。
2. ディスカバリの一部の作業しか手掛けていない。

 

eディスカバリの流れは、EDRMモデルに規定されているとおり、情報ガバナンス、特定、保全/収集、処理/閲覧/分析、作成、提出の工程に分かれています。ベンダーを選定する際には、そのベンダーがこれらの工程のどこからどこまで行えるのか確認する必要があります。

 

大手ベンダーの場合はたいてい「全ての工程を手掛けている」と返答するでしょう。けれど、これを鵜呑みにしてはいけません。下請けベンダーへの再委託の可能性についても確認しておくべきです。「ディスカバリのカバー範囲」を確認する際には、下請けベンダーへの再委託、アウトソーシングをしていないかについても確認するとよいでしょう。なお契約書の中には「外部への再委託を行う際には必ず発注元の書面による同意を得る」という一文を入れておくことをおすすめします。

注意すべき回答例の「2.一部しか手掛けていない」と答えたベンダーは、その「一部の作業」でさえも汎用のツールを使うだけだったり、他社に丸投げだったりします。工程によってベンダーを変えるのはミスが起こりやすく、情報漏洩のリスクもあるため、一貫して全ての作業を手掛けられる「ディスカバリ総合支援ベンダー」を選ぶべきでしょう。

 

② プロセス作業やレビュー作業はどこで行う?
理想の回答 注意すべき回答
作業は日本国内で行う。 作業はアメリカ、または海外で行う。

 

アメリカのベンダーに委託する場合、プロセスやレビュー作業をどこで行うのかが問題になります。多くの場合、アメリカで行うことになりますが、そうすると必要以上の翻訳費用やそのための時間が必要になります。日本でプロセスやレビューを行えば、そういった費用と時間は必要ありません。

また、データ管理の観点にも注意すべきです。海外に持ち出した時点で、データの管理を放棄したのと同じことになります。いくら請負ベンダーとNDAを結んでいたとしても、再委託されればどこの誰がデータを閲覧しているか分からず、企業にとってリスクとなります。

 

 

③ 日本語に対応し、日本企業のディスカバリで実績と豊富な経験がある?
理想の回答 注意すべき回答
日本語に対応しており、今までに少なくとも100件以上の日本企業のディスカバリ案件を手がけている。 日本語には対応しているが、日本企業の経験は少ない。

 

これもディスカバリ入門(6/7):コストをコントロールする鍵は見積もりチェックにあり(Part 2)で詳しく述べてきたとおり、日本語に対応していないと、データの文字化けが起こったり、プロセスの精度が下がったり、無駄な翻訳費用や時間が発生したりして効率が良くありません。

さらに注意していただきたいのは、企業が「日本語に対応」していても、ディスカバリ作業が対応していない場合があることです。

例えば日本にオフィスがあったり、オフィスはアメリカでも日本語を理解できるスタッフがいたりすれば「対応できる」と回答されます。しかし、大切なのは日本語が通じるかどうかではなく、日本企業のディスカバリにおいて高い実績と豊富な経験を持っているかどうかです。

 

④ 日本語をはじめとするアジア言語に高い実績を持つプレディクティブ・コーディングを使用している?
理想の回答 注意すべき回答
使用している(デモンストレーションや数値データの提供も可能)。 使用していない。もしくは、使用しているがデモンストレーションはできない。

 

「ディスカバリ」=「レビュー」と言っても過言でないほど、ディスカバリコスト全体に占めるレビューコストの割合は大きく、コストをうまくコントロールするためには、この工程をできるだけ効率化することが大事です。そこで活躍するのがプレディクティブ・コーディングです。

プレディクティブ・コーディングとは、コンピュータ処理によって、人間に近い精度のプレ・レビューを行うことです。この技術を導入すれば、従来全面的に人の目に頼っていたレビュー作業を、コスト・時間共に大幅に圧縮できます。

プレディクティブ・コーディングはそれを使わない理由がないというほど、レビューの効率を高めるには不可欠なものとなりつつあります。それにもかかわらず使用しないベンダーは、その技術を持っていないか、利益率を高めるためにわざと「人の目によるレビュー」を行い、コストの発生しやすい方法を選んでいるかのどちらかです。このような知らないベンダーは、選択肢から外した方がよいでしょう。

Responsive(関連性あり)文書(=Relevant文書)をどの程度網羅しているかの割合=再現率をRecall Rate(抽出率)という。上図はスコアの高いものから並べた文書数に対してプロットした図である。例えば、スコアの高い30%をレビューすると、Responsive文書の75%をレビューできることになる。

Precision(適合率)とは、Relevant(関連性あり)と判定された文書のうち、実際にRelevantであった文書の割合を指す。Relevantにも関わらず、Not Relevantと判定された文書が多い=誤判定が多いほど値は小さくなる。上図では、上位数%の文書のPrecisionが低く、高スコアの文書で判定ミスが起きていることが分かる。

 

プレディクティブ・コーディングの精度を知るのに最も効果的なのは、デモンストレーションです。

パソコン1台分ほどのサンプルデータがあれば、一日でデモンストレーションと作業の精度確認が行えます。また、ベンダーの「チューニング」力も重要です。デモンストレーションでは、サンプルデータの採取方法などによって、どうしても結果にばらつきがでることがあります。そういった状態で、企業側の訴訟担当者とコミュニケーションを取りながら、どのようにして高精度の作業を行っていくか、その対応力についても、見極めておきたいところです。

また、デモンストレーションを行う前に、リコール・レートやプレシジョン・レートなどをすぐに提出できるかどうかもそのベンダーの対応力を見極めるポイントとなります。それらの数値的な裏付けデータを、支援ベンダーあるいはベンダーの担当者が把握・理解していなければ、精度の高い見積もりを作成するのは不可能だからです。

 

⑤ 翻訳はどの段階で行う?
理想の回答 注意すべき回答
レビュー終了後に、証拠として提出する書類だけ翻訳する。 収集したデータ全てに対して、プロセス前に翻訳する。

 

証拠となる書類を絞り込めていない段階で翻訳を行うのはコスト的にも時間的にも無駄でしかありません。収集した資料全てをプロセス作業前に翻訳したがるベンダーもいますが、最も理想的なのは、提出する証拠だけを翻訳することです。

それが不可能でも、どのタイミングで翻訳作業を行うかは確かめておくとよいでしょう。レビュー後に翻訳すると言っているベンダーなら信用できます。

 

⑥ OCRはどの段階で行う?
理想の回答 注意すべき回答
OCRは行わない(※) OCRは収集したデータ全てに対して、プロセス前に行う。

(※PDF当の画像ファイルや紙の資料等はOCR対象となる可能性がある)

 

書類をTiff化し、OCRをかければデータの文字化けが防げるため、名ばかりの「日本語対応可能ベンダー」が取りたがる手段です。しかし、OCRは精度に限りがあるため、信頼に足る証拠を抽出するという点では不安がぬぐえませんし、高精度の日本語解析技術を有しているベンダーであれば、OCRを用いなくても正しくデータの解析を行うことができます。

 

⑦ レビューの速度はどのくらい?
理想の回答 注意すべき回答
明確な数字を口頭や資料で示す。 案件の内容による、あるいは日本語は難しいから分からない、などの理由で明確な数字を示さない。

 

レビューの速度を尋ねても、はっきりと答えられないベンダーが多いかもしれません。理由についても「日本語は複雑だからどれくらい時間がかかるか分からない」「ドキュメントに依存するから分からない」といったあいまいな返答をしてくる場合は要注意です。

なぜなら、できるだけ時間をかけて、コストを余計に発生させたいと考えている場合が多いからです。彼らにとって売り上げの多くを占めるレビュー費用に直結するため、明確な数字を示すと必要なコストが分かってしまいますし、時間を長くかけて多くの費用をチャージすることも難しくなるので、そのあたりはできるだけうやむやにしたいというのが彼らの本音でしょう。

きちんとした数字を提示してくるベンダーでも、一時間あたりの処理ファイル数について確認しましょう。効率よくレビューを実施するためのノウハウを蓄積しているベンダーであれば、複雑な資料であっても一時間あたり60ファイルはレビューできるケースもあります。多い時では120ファイルまで増やすことができた事例もあります。

 

⑧ ディスカバリのためにベンダーに提供したデータをホスティングするサーバはどこ(どこの国)に置かれている?
理想の回答 注意すべき回答
日本国内のデータセンターに置く。 アメリカなど国外に置く。

 

アメリカの弁護士や法律事務所は頻繁にデータを欲しがる場合があります。工程の色々な段階で「データをアメリカに送ってほしい」と言う話がでますが、これに従う必要はありません。日本のデータセンターに保管できるのであれば、そこで作業を進めても構わないわけです。(データを自社の管理できないところへ送ることで、情報漏えいのリスクが高まることは前述したとおりです。)

弁護士にその理由を尋ねると、データをアメリカに置くことによって、裁判所や司法省の印象が良くなるからだといいます。証拠書類(それ以外のデータもあるが)を差し出したことによって日本企業は観念した、調査に協力的だと印象付けるのが狙いです。

これはあながち間違いではありません。裁判所や司法省の管轄下にデータがあるということで「いつでも調査ができる」という状況ができあがるからです。

ですが、アメリカとヨーロッパの企業が訴訟で争うことになった場合はどうなのでしょう。EUに適用される「データ保護指令」という規則では、十分なデータ保護レベルを確保していない第三国へのデータの移動はNGとされています。米国には個人情報保護のための包括法がないため、基本的にデータの移動は禁止されています。アメリカの弁護士がそれを求めた場合、弁護士自身が罰せられることもあります。このことはよくセミナーなどで注意喚起されているので、アメリカの弁護士なら常識的に知っていることです。

それにもかかわらず「データをアメリカに持ち込んだら訴訟に有利に働く」という理由なのであれば、ヨーロッパの企業は常に不利な立場にあるということになります。これはどう考えてもつじつまが合いません。

また、クロス・ボーダー案件では、複数の訴訟案件に同じデータが証拠として用いられることがあります。一つのファイルがAという訴訟にも、Bという訴訟にも使用されると言うとイメージし易いと思います。

訴訟の範囲の大小にかかわらず、現在では膨大な量のデータがディスカバリ発生ごとに収集されます。同じ書類を案件ごとに都度ディスカバリ作業していくのはコスト的にも時間的にも無駄です。だからこそデータセンターなどでマネジメントし、案件ごとに取り出せるようにする「クロス・マター・マネジメント」が効率的です。

アメリカにデータを送る、あるいはアメリカのサーバにデータをホスティングするというのは「クロス・マター・マネジメント」とは全く逆の行動であり、時代の流れに逆行していると言わざるを得ません。

Tags
Show More
Back to top button