TOP
>
業務システム
> 検索精度の問題
社内の情報資産を最大限に活用するエンタープライズ・サーチ
第5回:企業導入における留意点
著者:
アイ・ティ・アール 上村 陽子
2006/6/14
前のページ
1
2
3
次のページ
検索精度の問題
エンタープライズ・サーチ製品の中には登場してすでに数年を経過しているものもあり、いずれの製品も機能面ではある程度成熟しています。しかし、インターネットの検索サービス同様、キーワードを入れたからといって必ずほしい情報が見つかるわけではなく、「ものすごくたくさんヒットしてしまった」「ほしい情報が上位に表示されない」ということは当然起こります。
従ってどうやって検索精度を高めるかという点においては、いずれの製品もまだ進化の過程にあるといえるでしょう。基本的な検索機能では、キーワードとコンテンツの関連性をワードの発生頻度のみで判断する傾向があります。しかし、関連性の高い情報(検索結果の上位に表示すべき情報)であるかどうかの判断は、コンテンツから意味を読み取って文脈を認識し、ユーザが情報をどのように求めているかを加味した上で判断するべきでしょう。
第3・4回で紹介したように、多くの製品がこの領域における機能の拡張に力を注いでいます。日本語処理を高度化してコンテンツの意味をより正確に捉える方向へ進化している製品もありますし、ユーザインターフェースを改善してユーザ側で検索結果の精度を高めるための支援機能も増えています。
しかし、無秩序に溜め込まれた情報の山からほしいコンテンツを見つけだす行為は、いかに高度なアルゴリズムをもってしても限界はあります。逆にコンテンツの分類が構造化されていれば、検索の精度は格段に高まります。コンテンツ分類の構造化とは、例えば図2のような分類法を設計して、個々のコンテンツをその分類にあてはめることです。
図2:コンテンツの分類
(画像をクリックすると別ウィンドウに拡大図を表示します)
コンテンツの分類
ファイルサーバのフォルダ構造はこの分類の1つですが、コンテンツを求めるユーザニーズはその時々で異なるので、単一の構造ですべてのニーズを満たすことは不可能です。自社の要件にあった複数の分類法が定義され、コンテンツのメタデータに各分類が設定されていれば、キーワード検索の結果として該当するコンテンツのカテゴリ分類(提案書、研究報告書、新製品関連情報など)を表示するなどの検索も可能になります。
コンテンツの作成者/作成日付なども重要な分類の1つであり、こうしたメタデータが整備されていれば、「Aさんが、2003年以降に作成した財務報告書」といった複数の軸による検索も可能になります。
自社の要件にあった分類法を正確に定義しようとすると、実際には非常に困難な作業となります。しかし、基本的なところではファイルの命名規則やタイトルや概要をきちんとつけるというルールだけでも、あるとないでは検索精度に大きく影響します。コンテンツの自動分類を支援する機能を持つエンタープライズ・サーチ製品もありますが、やはり重要なのは自社のスタッフがどんな分類で情報を探しているのかを深く掘り下げることです。
エンタープライズ・サーチ導入の評価は、その検索結果が満足できるものであるかどうかにかかっています。そのためには、製品の機能に頼るだけではなく、検索の精度を高めるための企業側の努力も必要です。
前のページ
1
2
3
次のページ
著者プロフィール
株式会社アイ・ティ・アール シニア・アナリスト
上村 陽子(かみむら ようこ)
データウェアハウス、BI、CRM、コンテンツ管理分野の市場調査を担当する。慶応義塾大学理工学部卒業後、ユーザ企業の情報システム部門を経て、1999年より現職。
INDEX
第5回:企業導入における留意点
エンタープライズ・サーチを導入する際の留意点
検索精度の問題
製品選定における留意点