第13期より実施しております「日本語処理解析性能評価」につきまして、第15期第1回(通算第4回)評価を2018年6月29日(金)に実施致しましたので、この評価結果等を公開致します。この度の評価製品は「Nuix」となります。

【評価の実施について】
今回は第15期(2018年)4月末より受検製品(企業)の募集を開始し、6月に1社(AOSリーガルテック(株))の「Nuix」の評価を立会人の下に実施致しました。

【これまでの経緯】
デジタル・フォレンジック研究会では、第11期(2014年)に下記を目的として「日本語処理解析性能評価」分科会を立ち上げ、IDF会員及び官民のアドバイザーによるワーキングでの検討を逐次進めて参りました。第12期(2015年)には「評価基準」「評価データ」「評価手順」を作成し、第13期(2016年)に有識者からなる「評価委員会」にてこれらの確認を行い、評価の実施について承認を得ました。
これらに基づき第1回評価を、2016年8月より受検企業の募集を行い、2017年1月に2社、第2回評価は2017年12月に1社の製品性能評価を実施、第3回評価は2018年3月に実施致しました。

☆これまで日本では、客観的な日本語処理解析性能評価に関する指標や基準が無かったことから、IDFが評価基準を設け、評価用データや評価手順を作成し、評価を実施していることの意義は大きいとの評価を頂いております。

【目的】
デジタル・フォレンジックやeディスカバリ用途で、多様な検索機能や解析機能を持つ多くのツールが開発され、利用されている。
しかしながら、海外で開発されたものも多く、日本国内で使用する場合に、どこまで日本語に対応しているかが不明でユーザーが使用してみるまで分からないのが現状である。
実際、フォレンジック調査やeディスカバリ作業現場において以下の様な問題が発生している。

・検索にヒットすべきものがヒットせず、重要な収集されるべきものが漏れる。
・文字化けが発生し、内容を確認できない。
・日本語処理対応とされるツールでも何がどこまでできるのかが不明確で使い込むまで分からないことが多く、精度をどこまで信用して良いか分からない。
・日本語処理対応の定義も不明確。
・実際に性能を評価しようとしても客観的かつ有効な指標も存在しない。

このような状況を踏まえ、日本語処理解析性能の「評価基準」「評価データ」「評価手順」を作成し製品の評価を実施することに致しました。

【今後の評価実施について】
今期第15期(2018年度)内に、第2回(通算第5回)の評価を実施する予定です。
また、第16期(2019年度)以降も評価を実施して参ります。

第4回「日本語処理解析性能評価」受検結果報告file_pdf

※本評価実施時の評価準備手順にミスがあり、本来、調査対象として準備したデータ(エビデンス)内のどこにどのような文字コードのデータが記録されているかを事前に知る事は出来ませんが、本評価では、テキスト評価用データの解析時において、ツールによる文字コードの自動識別ではなく、人による文字コード毎のエンコーディング補正を行っていたことが分かりました。このため、これまで評価を実施しました他製品と評価条件を合わせる必要から解析フローの見直しによる再評価を実施致します。実施後速やかに結果を公開致します。評価結果を参照される方々には、IDF側のこの準備手順確認漏れについてお詫び致します。

【第4回受検実施企業】
2018年6月29日(金) AOSリーガルテック株式会社

お問い合わせ

本報告に関するご意見、ご要望、その他のお問い合わせ等は、【ご氏名】【ご所属先】【ご連絡先】をご明記の上、以下の問い合わせ先へお寄せ下さい。

IDF事務局   E-MAIL:info@idf-test-suite.digitalforensic.jp

また、各受検企業結果内容の詳細及びお問い合せにつきましては、各「日本語処理解析性能評価」実施結果報告に記載しております、受検企業各社問い合わせ先へ直接お問い合わせ下さいますようお願い致します。