 |
|

|

|
土日に極める「データベース秘伝書」 |
【参の巻】データベースの動向と対策を考える
2007/7/20
|
|
|
1 2 次のページ
|
第3週はデータベースの動向と対策を考える
|
データベース夏の陣、第3週目の公開記事は、SQL Serverに関してWindows Vistaへの移行で発生する問題を考察した記事、Oracle Database 10gの解説記事、さらに今注目されているXMLデータベースなど、計9本の記事が掲載された。
今回も、これらの連載記事の中から、週末にぜひ読んでおいてもらいたい注目記事をピックアップしていこう。
|
XMLデータベース
|
XMLデータベースは文書管理ソリューションを筆頭に、非定形なデータを扱うデータベースとして注目されている。しかしなぜ非定型データはXMLデータベースがよいのか、その理由を正しく理解している人はあまり多くないようだ。その理由の1つに、XMLデータベースは高価な商用製品ばかりで手軽に試せるものがないことがあげられる。
いまではXMLデータベースを取り巻く環境も大きく変わり、標準化の進展や製品も多岐にわたってきた。そこでオープンソースのXMLデータベースの中からeXistを取り上げ、改めてXMLデータベースの持つ可能性や機能を身近なものであることを理解したい。
eXistではじめよう!使って覚えるXMLデータベース入門
第1回:MySQLはじめの一歩
著者:ウルシステムズ 柏原 宏充、大塚 庸史
皆さんも、XMLにはほとんどの方が何らかの形で触れられていると思いますが、ことXMLDBとなると「XMLデータベース? うーん、ちょっと敷居が高いんだよね……!」とお考えの方が、まだまだ多いのではないでしょうか。その「敷居の高さ」とは、何が原因なのでしょうか。そこで、筆者がかつて感じていた「XMLデータベースに触らなかった理由」を改めて考えてみました。
これまでXMLにそれほど親しんでこなかった筆者は、XMLというツリー構造のデータをみたとき、どのようにして情報を整理してよいのか、その設計の自由度が高いために戸惑ってしまいました。よくあるCSVや固定長のデータは1〜2次元の表をベースとしているので、RDBに格納したときの正規化・非正規化などのノウハウはほぼ定まっています。しかし、XMLはツリー構造をベースとしているので、要素・属性・ツリーをどこで切るかという問いに対する正解が複数あることが多く、自信が持てない原因となっていました。
このように、ここ最近の間、XMLデータベースを取り巻く環境は大きく変わりつつあります。筆者が携わる案件でも、XMLDB導入についての相談が大幅に増加しています。XMLの利用シーンが増えてきたこと、さらにXQueryのW3C勧告化によって、普及がより一層加速されようとしています。
また、本連載で紹介するオープンソースのXMLデータベースプロダクトでは、スキーマレスのXMLを扱うことができます。システムを作りながら要件を少しずつ固めていくようなアジャイル型の開発で、XMLDBは大きな威力を発揮します。さらにAjaxやRIAなどのUIとの相性も抜群なのです。今こそまさにXMLデータベースの覚え時です。
次回はオープンソースのXMLデータベースである「eXist」の導入方法などが掲載されるので、この連載で改めてXMLデータベースの理解を深めていくことをお勧めしたい。
また、すでにXMLデータは新聞、医療、行政、財務などの分野をはじめとした様々な業界において、データ交換形式の標準としての利用が進んでいることはご存じだろうか。こういった新聞のニュース・記事のデータや特許申請データなどは、これまでのデータベースでは扱いにくい非定型データだったことが理由だという。そのような利用やテラバイト規模のXMLデータベースを実現するソリューションを解説しているのが次の記事である。
TX1に見るXMLデータベースの可能性
XMLデータベースの本当のライバルとは?
著者:ThinkIT 協力:東芝ソリューション
XMLデータベースとは、XMLデータの格納を目的として開発されたデータベースです。近年のXMLデータベースの流れには、「ネイティブ型データベース」と「ハイブリッド型データベース」の2つがあります。ネイティブ型データベースとは、ツリー構造であるXMLデータをそのまま格納するデータベースで、TX1やNeoCore XMSがその代表例です。
TX1は検索速度を重視して設計されたネイティブXMLデータベースです。またXMLデータは階層構造や複雑な構造を持つ文書ですから、特定のタグ以下のどこかのタグに一致するというような緩やかな構造の指定や、キーワードによる全文検索など、変化に柔軟に対応できる問合せも高速に処理できるという特長を持ちます。検索時間の例としては、特許公報8年分300万件(100GB)から、分類コードの前方一致とキーワードによる複合的条件により、1万件の大量の件数がヒットする際にも、検索時間は約1秒であり、検索速度の高さがうかがえます。
XMLデータベースにあるデータは、XMLフォーマットで格納されていることから、1つのデータ(ワンソース)から必要な情報だけを取り出し、様々な利用形態に活用することが可能(マルチユース)であるということです。例えば、品質レポートをWordやExcelのようなドキュメント形式ではなく、XMLで記述しておけば、スタイルシートを利用して紙のイメージにレイアウト印刷することもできます。また、特定の部品で発生したレポートだけを正確に探し出して、発生条件等の数値データを集計、分析することもできます。TX1ではXMLの標準問合せ言語によって、複雑な条件での絞り込みや集計などを行うことができます。
この連載では、XMLデータベースの導入がデータの蓄積から、蓄積されているデータをいかに活用するのか、といった視点への移行を分析している。実際にこの記事を読んで「確かにそうだな」とうなずける読者の方も多いのではないだろうか。
|
1 2 次のページ
|
|
|
この記事の評価をお聞かせください
ボタンをクリックしますとウインドウが開きます。
|
|
|
|
|
|
|
|