TOPシステムトレンド> もう1つの重要なポイント、それはサイズ
ニーズとXMLDB
隠されたニーズを引き出すXMLデータベース

第3回:その必要と条件
著者:ピーデー  川俣 晶   2006/2/22
前のページ  1  2  3   4  次のページ
もう1つの重要なポイント、それはサイズ

   従来の技術では上手く適応できなかったニーズを満たす条件として「スキーマレス」という特徴が浮かびあがってきた。

   だが、まだ十分ではない。

   技術主導とニーズ主導がぶつかり合う場面では、もう1つ外せない重要なポイントが存在する。

   技術を扱う立場に立ったときには、RDBのような主要なデータベースとXMLデータベースやオブジェクトデータベースなどの特殊なデータベースを比較した場合、両者に歴然とした相違があるという認識を持つ場合がある。

   より具体的にいえば、主要なデータベースとは大量のデータを高速に処理する能力や高い信頼性、可用性などを持つものであり、特殊なデータベースはまさに特殊なニーズに適応するために、処理性能や信頼性を犠牲にしたものである…という認識である。

   このような認識は、技術者の観点から見れば、あながち間違いとはいえない。特殊なデータベースを使うためには、それなりの代償が要求されるのである。

   しかしニーズ主導という立場に立ったときには、まったく違う認識が浮上する。実は「事前に厳密な設計ができない」データは、「設計できる」データよりも量が少ないと決まったものではないし、信頼性や可用性が低くてもよいという話でもない。つまり、技術主導の場合には当然許されたはずの性能低下という代償は許されない。

   前回紹介したXMLデータベースの世代による分類とは、まさにこれを意味しているといえる。第1世代のXMLデータベースとは技術主導のデータベースであり、性能や信頼性が劣っていてもやむを得ないという態度のものが多かった。

   しかし第2世代のXMLデータベースはニーズ主導であり、性能や信頼性の面で妥協しないという態度を持つものが多い。

   ここで特に重要な意味を持つのはデータベースのサイズである。大量のデータに対して高速のクエリを実行できねば、そもそも稼働させることすらできないのである。XMLデータベースを採用し、運用するという問題に対して立ちはだかる最大の敵はサイズだといってもよいだろう。

   ここが今回の第2の山場である。

   つまりXMLデータベースだからといって、データ量に妥協はない。必要とされるサイズのデータに対して、高速なクエリが実行できるXMLデータベースでなければ、採用する意味はない。

第2のポイントはサイズ
図2:第2のポイントはサイズ

   では一般論としてXMLデータベースはRDBと同程度のデータ量が扱えればよいのかというと、そうではない。実は「RDBよりも大きなXMLデータベース」に対するニーズも存在する。

   それは、データベースを集めた大データベースの構築である。


RDBよりも大きなデータベース

   ナレッジマネジメントなどの分野では、組織内に散在するいくつものデータベースを統合した大データベースを構築し、それに対して検索を行うことで、組織に対して横断的な情報を把握するという作業が提案されることがある。

   このようなニーズに適合する大データベースの構築は、実は難しい。

   あらかじめ統合されることを想定せずにバラバラに構築されたデータベースは、当然データの整合性などをきちんと意識して作られてはおらず、データベースを寄せ集めてもなかなか上手く噛み合わない。事前に厳密な設計を行わねばデータベースを構築できないRDBなどでは、上手く噛み合わないことが設計不能という結論につながりかねない危うさを持つ。

   しかしスキーマレスのXMLデータベースでは、事前の設計が必要ない。設計しなくてよいということは、どのようなデータでも自由に入れることができることを意味する。つまり、整合しないデータは整合しないまますべてあるがままに1つのデータベースに入れることができる。

   そして仮にそのようなデータベースを構築したとすると、そのデータベースのサイズは個々のデータベースのサイズよりも大きなものになってしまう。

   ここが今回の第3の山場である。

   複数のRDBを集めた大データベースをスキーマレスのXMLデータベースを用いて構築した場合、XMLデータベースのサイズは個々のRDBよりも大きなものになる。つまりXMLデータベースに要求されるデータ量は、RDBよりも大きくなるとすらいえるのである。

   例えば第2世代XMLデータベースのNeoCore XMSでは数百ギガバイトまで使用可能とされ、他の第2世代製品ではテラバイト級というコピーを宣伝に使用しているケースまであるが、これは過大な許容量ではない。

第3のポイントはより大きなDB
図3:第3のポイントはより大きなDB

前のページ  1  2  3   4  次のページ


株式会社ピーデー 川俣 晶
著者プロフィール
株式会社ピーデー  川俣 晶
株式会社ピーデー代表取締役、日本XMLユーザーグループ代表、Microsoft Most Valuable Professional(MVP)、Visual Developer - Visual Basic。マイクロソフト株式会社にてWindows 3.0の日本語化などの作業を行った後、技術解説家に。Java、Linuxなどにもいち早く着目して活用。現在はC#で開発を行い、現在の注目技術はAjaxとXMLデータベース。


INDEX
第3回:その必要と条件
  前回までのあらすじ
  XMLデータベースは唯一の選択肢なのか
もう1つの重要なポイント、それはサイズ
  サーバの台数を減らせ