TOP
>
サーバ構築・運用
> TX1に見るXMLデータベースの適用領域
TX1に見るXMLデータベースの可能性
XMLデータベースの本当のライバルとは?
著者:
ThinkIT
協力:
東芝ソリューション
2007/7/19
前のページ
1
2
3
次のページ
TX1に見るXMLデータベースの適用領域
まず、TX1の特徴について簡単にまとめていきます。一般にデータベースは、検索速度を重視した設計のものと、更新速度を重視した設計のものがあります。
TX1は検索速度を重視して設計されたネイティブXMLデータベースです。またXMLデータは階層構造や複雑な構造を持つ文書ですから、特定のタグ以下のどこかのタグに一致するというような緩やかな構造の指定や、キーワードによる全文検索など、変化に柔軟に対応できる問合せも高速に処理できるという特長を持ちます。検索時間の例としては、特許公報8年分300万件(100GB)から、分類コードの前方一致とキーワードによる複合的条件により、1万件の大量の件数がヒットする際にも、検索時間は約1秒であり、検索速度の高さがうかがえます。
TX1の適用分野としては、大きく以下のようなケースがあります。
標準化が進んでいる大量のXMLデータの管理
特許文書、新聞、カルテなどの大量のXMLデータの検索・管理
RDBでは格納しづらい非定型データの管理
規程集や品質情報、問い合わせ情報、申請書など、項目の長さや数が確定できない非定型文書
表1:TX1の適用領域
またTX1は2006年11月にバージョン2を発表し、検索機能とデータ連携機能が強化されました(表2)。
全文検索機能
全文検索方式として、Nグラム方式に加えて、形態素解析方式を採用。両方の方式をXMLの要素単位で使い分けることで、探したい情報を迅速に検索することが可能。
データ連携機能
NotesやRDB、CSVなどの形式のデータを収集し、XML形式に変換してTX1に登録可能。
表2:バージョン2の強化機能
これらの機能によってTX1(XMLデータベース)は、ただ単に大量のXMLデータを検索・管理できるだけでなく、様々な可能性を広げています。
企業の資産であるデータ活用の可能性
データベースの検索機能が充実したことにより、企業内のデータの活用が促進されることが考えられます。「企業内のデータを高度な検索機能で活用する」という点をみると、実はエンタープライズサーチと捉えることもできます。
エンタープライズサーチ
エンタープライズサーチとは、企業内に存在するコンテンツやドキュメントを活用するための検索サービスです。例えば、グループウェアやイントラネット、ファイルサーバ上のWordファイルやEcxelなどのドキュメントファイルなどが検索の対象となります。企業内を対象としたGoogleというイメージです。
エンタープライズサーチは検索の精度向上に注力しており、各ベンダーごとに特色があります(詳しくは下記のURLを参照してください)。
社内の情報資産を最大限に活用するエンタープライズ・サーチ
第1回:エンタープライズ・サーチが求められる背景
前のページ
1
2
3
次のページ
協力者プロフィール
東芝ソリューション株式会社
東芝グループの中でIT関連ソリューションを一手に担う企業として、官公庁、公共、金融、流通、製造、文教、医療、報道・メディアなど、様々な業種のお客様にITソリューションをご提供。クラスタ技術や日本語処理技術などの独自技術を活かした製品開発、大規模な基幹系システムの構築経験・実績で培ったサポート力・システム運用力を基盤に、複雑化するお客様のご要望に的確にお応えしている。
http://www.toshiba-sol.co.jp/
INDEX
XMLデータベースの本当のライバルとは?
XMLデータベースの可能性を探る
TX1に見るXMLデータベースの適用領域
ワンソースマルチユース