正確に、確実に情報を検索する!
キーワード検索だけでは探せないビジネス文書
PCサーバーのコモディティ化により、企業は高性能なファイルサーバーを低価格で導入できるようになりました。これによりファイルサーバーは、部門別、課別、グループ別、プロジェクト別など、さまざまな利用シーンに合わせて導入されるようになっています。
また、これらのファイルサーバーに接続されているストレージも、大容量、低価格化の一途をたどっており、膨大な情報が複数のファイルサーバー上で管理されるようになりました。
今やファイルサーバーは、企業にとって情報の宝庫となっていますが、複数のファイルサーバーに分散された膨大な情報から、必要な情報を見つけ出すことは容易ではありません。そこで重要になるのが検索技術です。この連載では、検索技術によるファイルサーバーの活用方法について紹介していきます。
検索技術と聞いてまず思い浮かぶのは、インターネット検索サイトなどでもおなじみのキーワード検索でしょう。それでは、キーワード検索だけで本当に必要なビジネス文書を見つけ出すことはできるのでしょうか?
例えば銀行には、銀行業務に関係する偏った文書が大量に蓄積されています。そのため「預金」「金利」というキーワードで検索すると、蓄積されているほとんどの情報がヒットしてしまいます。一方、インターネットで「預金」「利率」というキーワードで検索してみると、情報の真偽にかかわらず「預金」「利率」に関する何らかの役立つ情報が検索できます。
インターネット検索と企業内検索の最大の違いは、インターネット検索が幅広い情報の中から「参考になる情報」を見つけ出せればよいのに対し、企業内検索では偏ったテーマの中から迅速に「正解」を見つけることが求められる点なのです(図1)。
正式あるいは正確でない情報を利用してビジネスを行うと、チャンスのロスや大損失につながります。「あるべきはずのもの」が見つからない、「無いという確証」が得られないために、情報を探す手間が増えたり、同じものを新たに作成したりするという無駄も発生します。また、使うべき情報を使わないために判断ミスをしたり、過去のトラブルや障害を繰り返したりというリスクも高くなるのです。
ビジネス文書をかしこく探すには
では、ビジネス文書を効果的に検索するためにはどうすればよいのでしょうか。それには、キーワード検索のような単語による検索ではなく、文書に書かれている内容を正確に判別できることが重要です。
例えば、文章が肯定文で書かれているのか、否定文で書かれているのかを正確に区別できなければ、業務の中で適切な利用は行えません。テーマで探すのではなく、どのような内容が書かれているのかも見分けられなくてはならないのです。
さらに、見積書や契約書、顧客台帳などのビジネス文書は、基本的にフォーマット化され、整理されて書かれています。「整理」というのは、ある構造に基づいて書かれていると言い換えることもできます。この文書の構造をうまく利用して検索することができれば、ビジネス文書をピンポイントで見つけることができるのです。
企業内の情報をキーワード検索だけで絞り込むことはもはや困難であり、必要な情報をピンポイントで検索できる仕組みが必要です。こうした背景のもとに、企業内検索のために開発されたのがジャストシステムのエンタープライズサーチプラットホーム(ESP)製品である「ConceptBase Enterprise Search」(以下、CBES)です。
次はCBESで採用している企業内検索のための技術について紹介します。