|
|
Sybase IQで学ぶデータウェアハウス |
第1回:汎用RDBMSとデータウェアハウスの違い
著者:サイベース 2007/7/5
|
|
|
前のページ 1 2 3
|
|
Sybase IQとは?
|
Sybase IQ(以下、IQ)は、多くの企業が直面する情報系システムの構築・運用における性能問題、コスト課題を解決する、情報系分析用高速クエリエンジンです。この製品は、大量データの登録、多くのユーザによる同時アクセスが要求されるデータウェアハウス・データマートのために専用に設計・開発されました。
|
高速性
|
汎用RDBMSからIQに変えるだけで、10〜100倍のスピードでデータの検索を可能とします。しかも、ただ速いだけではなく、高速化のためのチューニング作業が非常に少なくてすむという特徴も併せ持っています。
|
データ格納効率
|
速さを維持しながら、使用するディスク領域が少ないという特性があります。汎用RDBMSでデータベースを構築すると、生データの3〜5倍程度のディスク領域を必要とするのですが、IQの場合は生データの40〜70%程度、汎用RDBMSと比較すると、平均1/5程度の大きさでデータベースを構築することが可能です。
|
安定性
|
定型、非定型を問わずに検索のスピードが安定して速い、という特徴があります。定型検索の場合、クエリがあらかじめわかっていますので、事前にサマリーテーブルを作る、実体化ビューを作成する、といった高速化手法を取れるのですが、非定型クエリの場合にはそういうわけにはいきません。
しかし、IQの場合は、データやクエリに依存しないで、コンピュータのリソースをいかに効率的に使うか、といった観点で高速化手法が考案されているため、非定型クエリが実行されても定型クエリと同じように高速に処理することができます。
|
使いやすさ
|
上記のように、速さ、格納効率の高さ、非定型クエリに対する強さという、一見、相矛盾する要件をすべて満たしながら、使い慣れたSQLインターフェースで操作できるため、ユーザは汎用RDBMSと何ら変わらない使用感を得ることができます。
|
Sybase IQの適用範囲
|
現在の企業情報システムを概観すると、通常業務を執行する基幹系アプリケーションがあり、そこで蓄積されたデータは、EAI、ETLなどのツールにより情報系アプリケーションへ移動、時系列データとして蓄積されます。このデータは分析やシミュレーションに使用され、最終的にその結果は業務実行の為の意思決定材料として基幹系アプリケーションへとフィードバックされるというサイクルをたどります。
Sybase IQは、情報系アプリケーション、即ちデータウェアハウスのためのデータベースとして使用されることを前提としています。
図4:Sybase IQの適用分野 (画像をクリックすると別ウィンドウに拡大図を表示します)
|
Sybase IQが特徴を発揮する状況
|
情報システムとしての要件から見た場合に、IQがその特徴を発揮する状況についてご紹介します。大別して、IQの導入パターンは新規システムとして導入される場合、既存システムが抱える問題の解決手段として導入される場合が考えられます。
新規システムとして導入される場合、IQを適用する要件としては、下記の内のどれかが当てはまる場合には、IQを検討する価値があります。
- 100GB以上の大量データを扱う必要がある
- 非定型クエリが多く実行されるために、事前のチューニングが難しい。結果としてレスポンス時間の基準をクリアできない
- 非常に多数のユーザが同時に実行する可能性があり、性能保障が難しい
表5:IQを適用する要件
特に2、3に該当する場合、汎用RDBMSを使用すると、要件基準のクリアと引き換えにメンテナンスコストの増大というトレードオフを抱え込む可能性が高く、注意が必要です。
既に構築が完了しサービスを提供中のデータウェアハウスで、IQの導入が効果的なケースとしては以下のようなものがあります。
- まず、性能が思うように出せず、当初の性能要件を満たすことができない。しかも、導入当初のリソースでは解決の見通しが立たないような場合、があります
- また、性能要件を満たしていても、メンテナンスコストおよびそのための人的コストが膨大に膨れ上がってしまうケースもあります。インデックスの再構成、集計処理や実体化ビューの作成、超並列データベースの維持などの作業がこれに該当します。
表6:IQの導入が効果的なケース
このような状況下で、多額の予算をつぎ込んだ稼動中のデータベースを一度にリプレースすることは、あまり現実的な方法とは言えません。そこで、IQが稼動する小型のサーバを用意し必要なデータのみをダウンロードし、データウェアハウスで困難な処理をIQ上にオフロードするという方法が考えられます。これは一般的に言うデータマートと考えても良いでしょう。
こうすることにより、企業全体のデータ管理を行なうセントラルウェアハウスと各分析業務を行なうデータマートと言う構成で、当面の課題に対し、性能、コストともに最適化を図ることが可能となり、また、将来の全体的な最適化の足がかりとなります。
|
次回は
|
今回は、Sybase IQの特徴として、高速性、データ格納効率、安定性、使いやすさを紹介しました。次回は、それらを実現する技術的側面をより掘り下げて解説していきます。
|
前のページ 1 2 3
|
|
|
著者プロフィール
サイベース株式会社
1984年、カリフォルニア州バークレーで設立。情報の管理能力と、卓越したレベルでデータの信頼性とセキュリティを提供し、データセンターからアクションポイントまで、情報の管理と可動化のみに焦点を合わせた最大のグローバルエンタープライズソフトウェア企業として活動。サイベース株式会社は、米国 サイベース社 の日本法人として1991年に設立。
|
|
|
|