連載 :
大規模化するDWHに挑むDWHのプライベート・クラウド化
2010年3月25日(木)
DWHのプライベート・クラウド化
米Greenplumが提唱するEnterprise Data Cloud Initiativeというコンセプトは、2009年6月に発表されました。その内容は、MPP(超並列処理)アーキテクチャを持ったDWH専用データベース「Greenplum Database」への機能拡張のほか、DWHの構築手法やエコシステムの強化など、多岐にわたります(図2)。
Greenplum Databaseを中核とした同コンセプトの概要は以下の通りです。
(1)プライベート・クラウド環境(仮想化環境)で利用するための機能拡張
- 物理サーバー/仮想サーバーの管理、DWH/データ・マートの作成/管理機能を提供
- サービス化したDWH/データ・マートに対して動的にインフラ・リソースを割り当てるDWHセルフ・プロビジョニング機能を提供
- 各ユーザー専用のサンドボックス(保護領域)生成機能
(2)新しいDWH構築手法
- データをモデル化する作業を削減し、基本的には生データをDWHに投入
- ユーザー専用のサンドボックスを活用し、生データに対してトライ・アンド・エラー可能なデータベース環境を提供
- サンドボックスで検証した分析手法をサービスとして一般ユーザーに公開
(3)パートナ・エコシステムの強化
- ハードウエア/ソフトウエア・ベンダーとの関係強化
新たなDWH構築手法が浸透
Greenplum Databaseへの拡張機能は、DWH/データ・マートをサービス化して提供する機能や、そのサービスに対して動的に物理/仮想サーバーをリソースとして割り当てる機能が中心です。一方、構築手法では、生データのDWHへの投入や、サンドボックスによる試行錯誤という使い方が特徴です。
生データをDWHに直接投入することは、データのモデリング作業を削減し、データ統合の障壁を下げます。また、サンドボックス機能は、分析手法の試行錯誤を容易にするため、DWHにこれまで以上の柔軟性を与えます。
こうした、米Greenplumが提唱する構築手法は、さまざまなDWH製品を使う際に参考になります。例えば、MPPアーキテクチャの製品は、米Greenplum以外にも、米Teradataや米Netezzaなど各社から提供されています。
次ページでは、実際にプライベート・クラウドを利用してDWHを構築し、成果を出した例を紹介します。
Think ITメルマガ会員登録受付中
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。