TOP
>
業務システム
> エンタープライズ・サーチを導入する際の留意点
社内の情報資産を最大限に活用するエンタープライズ・サーチ
第5回:企業導入における留意点
著者:
アイ・ティ・アール 上村 陽子
2006/6/14
1
2
3
次のページ
エンタープライズ・サーチを導入する際の留意点
本連載前半では、氾濫する情報をナレッジとして活用したいと考える企業ニーズについて解説しました。またこのような企業ニーズに対応するソリューションであるエンタープライズ・サーチについて、
「第3回:エンタープライズ・サーチの機能を見極める」
ではその機能を、
「第4回:各社エンタープライズ・サーチの機能を見極める」
では代表製品を紹介しました。最終回となる今回は、エンタープライズ・サーチを導入する際の留意点について述べたいと思います。
セキュリティの問題
エンタープライズ・サーチは、様々なリポジトリを事前にクロール(注1)しておくことで、ユーザが要求するキーワードに対応するコンテンツをすばやく表示することに大きなメリットがあります。
※注:
検索対象情報が置かれた複数のサーバを巡回する役割を果たすプログラムであるクローラが巡回すること
ここで確認したいのが、「企業内のあらゆるコンテンツをすべて検索対象としてもよいのか」という問題です。企業内のコンテンツの中には、一部のユーザしか利用の許されないコンテンツも多々あります。第3回ではこうしたコンテンツを閲覧権限のないユーザに対しては検索結果リストにすら表示させないよう、エンタープライズ・サーチ製品がアクセス制御機能を拡充させていることを述べました。
では、製品のアクセス制御機能だけでセキュリティが守られるのでしょうか。その前提として、個々のコンテンツやフォルダなどに正しいアクセス権限が設定されていることが当然必要となってきます。
図1は、企業内のコンテンツを公開範囲で分類した例です。誰が見てもよい情報、社員と社員以外(派遣スタッフなど)の間で利用を区別すべき情報など、企業によって開示や利用のルールがあります。そのルールに則ってコンテンツのリポジトリが整理され、さらにコンテンツにアクセス権限が設定されているのが理想です。
しかし残念ながら、このようなルールがきちんとできていない、もしくはルールはあるが正しく運用できていない企業は多々あります。エンタープライズ・サーチ製品を導入した結果、人目に触れないところで眠っていたファイルが誰かの検索によって検索結果の上位に表示され、「このファイル、みんなに見せてしまってもいいの?」と問題になる可能性は否めません。
図1:情報の公開範囲
出典:ITR
(画像をクリックすると別ウィンドウに拡大図を表示します)
エンタープライズ・サーチを導入する際には、こういった問題が背後にあることを認識しておく必要があります。最近は内部統制の観点から、情報アクセスに対する管理体制を強化しつつある企業が増えていますが、エンタープライズ・サーチの導入もこの動きを加速させるよいきっかけとなるでしょう。
検索範囲の問題
どこまでを検索(クロール)の対象とするかの判断は、エンタープライズ・サーチを導入するにあたっての大きな問題です。前述のセキュリティの観点はその1つの要素であり、実際に製品を導入する場合には、イントラネットなどの狭い範囲からからスタートして、少しずつ範囲を広げるのが一般的です。
個人宛てのメールは検索対象としないケースの方が多いでしょうが、もし検索対象としたいのなら、メールの所有者にしか検索結果が表示しないようアクセス制御ができるものが必須です。できれば、メール所有者ごとにクロールの可否を選択できる機能がついている製品を選ぶことが望ましいです。
検索範囲はインデックスのサイズに影響します。コンテンツ内のすべてのテキスト情報を分割してキーワードとして蓄積するわけですから、その容量が膨大なサイズとなることは容易に想像できるでしょう。
製品ベンダーの話を総括すると、オリジナルのファイルサイズと同等〜10倍程度のサイズになるようです(全体で1GBのファイルであれば、インデックスのサイズは1〜10GB)。サイズに幅があるのは、ファイルの種類によってテキスト量が違うことや、製品によってキーワード作成のアルゴリズムが異なることが影響するためです。どの程度のサーバが別途必要となるかは、事前に確認しておいた方がよいでしょう。
1
2
3
次のページ
著者プロフィール
株式会社アイ・ティ・アール シニア・アナリスト
上村 陽子(かみむら ようこ)
データウェアハウス、BI、CRM、コンテンツ管理分野の市場調査を担当する。慶応義塾大学理工学部卒業後、ユーザ企業の情報システム部門を経て、1999年より現職。
INDEX
第5回:企業導入における留意点
エンタープライズ・サーチを導入する際の留意点
検索精度の問題
製品選定における留意点