テキストデータを知見に変える
2020年4月1日「言葉」を「センサー」に
2020年4月10日技術的側面と法的な側面から見た フォレンジック調査案件事例の考察
「ディスカバリ入門(6/7):コストをコントロールする鍵は見積もりチェックにあり(Part 1)」では、見積もりと照らし合わせながら各工程の費用内訳を説明してきました。
例に挙げた見積もりは良心的なベンダーのものであると考えてください。ここまで詳細な見積もりを提出するベンダーは限られており、大抵のベンダーは見積もりの項目が少なく「作業一式」の金額だけが書かれているだけでしょう。
また、金額の算出についても「単価×想定量」と記載せず単価だけで提示してくるベンダーも多く見られます。
こういったベンダーがよく用いる「トリック」についてはきちんと理解しておく必要があります。
想定量が記されていない見積もりの場合、単純に単価の比較で業者を選ぶことになります。
価格だけを考えれば安い方を選ぶのが妥当ですが、問題となるのはその精度です。
「ディスカバリ入門(6/7):コストをコントロールする鍵は見積もりチェックにあり (Part 1)」で挙げた(1)~(7)の一連の工程は全てつながっているものです。よってコレクション、プロセス、ホスティングといった初期工程の作業の品質が、全体のレビュー品質に直結することになります。絞り込みが不十分であればレビュー対象のファイル数が増えてしまいますし、翻訳作業も増えてしまうのです。
例えばプロセス工程において、図のとおり日本語の文字コードに対応しバイリンガルのエキスパートがサポートした場合には、レビュー対象ファイルは5分の2程度(100 GB→40 GB)まで削減できます。一方、Unicodeしか対応していないなど技術力が不安視されるようなプロセス作業では、プロセス後やキーワード検索などの段階で文字化けや翻訳が必要になるなどコストが増大する上、レビュー対象ファイルを絞り込むことができません。
つまり、プロセス工程における技術・品質が劣っている場合は、レビューの費用はさらに増えることになります。
コストマネージメントの点から考えれば、プロセス費用を削減するよりも、レビュー費用を抑えることが重要です。
ディスカバリ費用全体に占めるレビュー費用の割合はおおよそ7割と言われており、残りの3割はコレクション、ホスティング、プロセスといった作業が占めます。この3割をいくら圧縮したところで、残りの7割が増えてしまうことになれば、全体費用としてはむしろ高くなってしまいます。
なぜコストに差が出るのか?