TOP業務システム> 製品選定における留意点
エンタープライズ・サーチ
社内の情報資産を最大限に活用するエンタープライズ・サーチ

第5回:企業導入における留意点
著者:アイ・ティ・アール  上村 陽子   2006/6/14
前のページ  1  2  3   
製品選定における留意点

   最後に、これからエンタープライズ・サーチ製品の導入を検討する場合の製品選定の比較ポイントをまとめておきましょう。
異種データソース、データフォーマットへの対応

   インデックス作成の対象となるデータ形式の豊富さ(Word、Excel、PowerPoint、PDF、HTMLなど)、検索対象となるデータソースの範囲(グループウェア・サーバ、DBサーバ、ファイルサーバ、Webサーバ、コンテンツ管理システム、およびそのバージョン)、さらに社内・外の情報を検索対象とするかは、企業の要件と十分に照らしあわせる必要があります。また、テキスト/コンテンツだけでなく、メタデータに対してもインデックスを作成する機能が求められます。

インデックスの作成と管理

   分散型インデックスを作成してそのインデックスを定期的に中央に集約するか、1つの大規模な中央集約的なインデックスを作成してリアルタイムに近い形で差分を更新するものがあります。インデックス作成/更新での高速性は重要な基準となりますが、新規のファイルやデータあるいはソースが追加された場合の管理の容易性とのバランスを見る必要もあります。

検索アルゴリズム

   検索エンジンがインデックスを作成するアルゴリズムには、形態素解析(文章を意味ある単語に分解する方法)、もしくはN-gram(文章を特定の長さで機械的に分解する方法)が用いられます。

   形態素解析による自然言語処理は検索の精度を高めるものですが、その精度は辞書データの充実に大きく左右されます。辞書の不備により検索漏れも発生し、辞書メンテナンスに運用負荷がかかります。一方のN-gramは、検索漏れは起こりませんが、検索のノイズが多くなりがちであり、検索精度を高める他の機能の併用が求められます。両者一長一短があり、その違いを認識しておくべきです。


セキュリティ/アクセス権限

   検索結果と当該情報へのアクセス権限に不整合が生じないよう、アクセスを制御する必要があります。各情報リポジトリのアクセス制御情報をどのように引継ぎ、アクセス制御情報の変更をどのように認識するのかを確認します。また、アクセス権限がない場合はアクセス拒否だけでなく、検索結果への表示を制御する機能も重要です。


検索精度

   情報分類/コンテンツの構造化/タギング(ユーザによるキーワード付け)/スコアリング・メカニズムのチューニング/概念検索など、検索精度を向上させるためにどのようなテクノロジが組み込まれているかを評価します。


検索の拡張機能

   パラメータを用いた検索機能(フィールドを選択して検索対象を狭める)/検索結果のソート/ユーザ指定によるフィルタリングなどのユーザインタラクションによって、ユーザ自らが検索精度を高めるための支援機能がどの程度提供されているかを評価します。また、ユーザインターフェースの使い勝手も評価ポイントとなるのです。


他の付加価値機能

   管理者側で設定した推奨コンテンツを上位に表示する、事前に設定したキーワードと関連するコンテンツが追加されたらユーザに通知をだす、キーワードの統計情報(人気コンテンツのランキング表示)など、有益なコンテンツの発見を支援する付加価値機能の有無を評価します。

   製品選定にあたっては、検索の精度を高めるための分類法や検索結果絞込みに有効な付加機能の成熟度の評価を視野に入れ、自社要件にあわせた選定を行うことが重要です。

   エンタープライズ・サーチは、これまでシステム化が困難であった非定型/非定常な業務領域において、様々な効果をもたらすものとなるでしょう。本連載が、情報活用の方策を検討する上での一助になれば幸いです。


前のページ  1  2  3   


アイ・ティ・アール  上村 陽子
著者プロフィール
株式会社アイ・ティ・アール  シニア・アナリスト
上村 陽子(かみむら ようこ)

データウェアハウス、BI、CRM、コンテンツ管理分野の市場調査を担当する。慶応義塾大学理工学部卒業後、ユーザ企業の情報システム部門を経て、1999年より現職。


INDEX
第5回:企業導入における留意点
  エンタープライズ・サーチを導入する際の留意点
  検索精度の問題
製品選定における留意点