TOPサーバ構築・運用> インデックスの違い
Sybase IQ
Sybase IQで学ぶデータウェアハウス

第1回:汎用RDBMSとデータウェアハウスの違い

著者:サイベース   2007/7/5
前のページ  1  2  3  次のページ
インデックスの違い

   汎用RDBMSでは、高速化手法の1つとしてインデックスがあります。インデックスは検索条件となるカラムに設定する必要がありますから、データ抽出の視点が多様な、言い換えるとあらゆるカラムが検索条件になり得るようなデータウェアハウスにおいては、下記のような問題が生じることになります。
  • インデックス設定対象となるカラムが増えることにより、インデックス領域が膨大となり、データベースが肥大化する

  • 肥大化したデータベースは、インデックスのメンテナンス工数やデータロード時間に多大な影響を与える

  • 肥大化したデータベースは、ストレージコストを押し上げる

  • 所詮、すべてのカラムにインデックスを設定することはできず、設定した範囲内でしか高速化することができない

  • インデックス自体はグルーピングや集計の負荷を根本から解決できない。したがって実体化ビュー、サマリーテーブルなどの冗長な結果セットを事前に作成しておく必要に迫られる。結果、ストレージコストをさらに押し上げる

表3:データ抽出が多様な場合の問題点

膨大な量のインデックスが発生する例
図3:膨大な量のインデックスが発生する例
(画像をクリックすると別ウィンドウに拡大図を表示します)

   このように汎用RDBMSが採用する「テーブル+インデックス構造」はいたずらにデータベースサイズを膨らませ、ストレージコストやメンテナンスコストを押し上げるだけでなく、データウェアハウスの構造/運用コストを上昇させることになりますが、性能的には投下コストほどの効果を得られないという問題をはらんでいます。

   以上をまとめると表4のようになります。

汎用RDBMSの実装 データウェア
ハウス上の問題
現象 ユーザへの
インパクト
ロー単位の
データ管理
  • 不要データの読み込み
  • ストレージ読み出しの長時間化
  • メモリ使用効率の悪さ
  • 必要CPUの増加
  • システムの肥大化
  • ハードウェアコストの膨張
  • ソフトウェア(CPUライセンス)の膨張
  • 性能の頭打ち
テーブル+
インデックス
構造
  • インデックス適用カラムの増加
  • 集約テーブルの必要性
  • メンテナンス負荷の膨張
  • ストレージ消費量の膨張
  • ストレージコストの膨張
  • 非定型クエリ対応の難しさ

表4:まとめ


データ活用のアプローチ「Sybase IQ」

   このようにデータウェアハウスに求められる要件は、現在の汎用RDBMSでは解決できない点が数多くあります。では、企業にある様々なデータをそのまま眠った資産としておいてよいのでしょうか。本連載では、その解決策としてSybase IQを紹介します。

前のページ  1  2  3  次のページ

技術ホワイトペーパ「情報分析用高速クエリエンジンSybase IQ」

本連載はサイベースが提供している技術ホワイトペーパ「情報分析用高速クエリエンジンSybase IQ」の転載となります。Sybase IQのより詳細な内容については以下のページを参照してください。

http://www.sybase.jp/products/informationmanagement/sybaseIQ_moreInfo.html

サイベース株式会社
著者プロフィール
サイベース株式会社
1984年、カリフォルニア州バークレーで設立。情報の管理能力と、卓越したレベルでデータの信頼性とセキュリティを提供し、データセンターからアクションポイントまで、情報の管理と可動化のみに焦点を合わせた最大のグローバルエンタープライズソフトウェア企業として活動。サイベース株式会社は、米国 サイベース社 の日本法人として1991年に設立。


INDEX
第1回:汎用RDBMSとデータウェアハウスの違い
  データウェアハウスと汎用RDBMSの違い?
インデックスの違い
  Sybase IQとは?