最新IT技術とBI
アプライアンスとBI
第2回では、ITアーキテクチャがC/S型から3層型に移行する際に、BIシステムも大きな影響を受けたことを説明しました。これほどではないにせよ、BIシステムに影響を与えたIT技術の変化・進歩はたくさん存在します。第4回の今回は、そのような最新IT技術の中から、いくつかをピックアップして解説します。
1つ目のトピックはアプライアンスです。アプライアンスとは、ハードウエアとソフトウエアを一体化して製品化することで、特定用途向けに機能・性能を最適化し、低価格で提供する技術のことを言います。ここでは、アプライアンスとBIの関連について解説します。
第3回で解説したパーティションやサマリー・テーブルは、汎用的なRDB製品がDWH用途で機能強化を図った例と言えます。しかし、DWH用途に限定してより大きな性能向上を図る手段として、近年アプライアンスの技術が使用されるようになりました。
これらの製品は、総称して「DWHアプライアンス」と呼ばれていますが、同じアプライアンスといっても、製品の構成方法は、大きく2つに分かれます。
1つ目の方法は、汎用的なRDBを特定のハードウエアと組み合わせ、あらかじめDWH用途にチューニングされた形で提供するもので、もう1つは、特定のハードウエアを組み合わせるだけでなく、RDB自体の機能もDWH用途に限定してしまう方法です。
DWHアプライアンスの特徴
前者の代表的なものが、「Oracle Exadata」です。DWH性能を低下させる主な原因の1つがRDBとストレージの間で行われるデータ転送量の増大です。Oracle Exadataでは、通常RDBで実行される検索処理の一部が、アプライアンスを構成するストレージ内で実行されます。ストレージ側で実行される検索処理は、主にテーブルの全件走査や結合といった大量のデータを対象とする部分です。これにより、ストレージとRDB間でやりとりされるデータ量が減少し、DWHの性能低下を防ぐことができます。
後者の代表的なものが、「Netezza TwinFin」「Netezza Skimmer」です(従来製品名は「Netezza Performance Server」)。同製品は、DWH専用の計算処理カードを搭載したブレード・サーバー機(ストレージ・ユニット)と専用のRDBで構成されます。これら専用のハードウエア/RDBは、DWH以外の用途での利用は考慮されていません。その代わり、DWHとして高速実行が必要なクエリーについては、汎用のRDBに比べて、より特化した処理が行われます。
Netezzaのアプライアンスでは、テーブルに与えられた分散キーと呼ばれるカラムの値によって、各ブレード・サーバーに均等に負荷が分散するように、レコードが配置されます。従って、多数のレコードを持つテーブルのアクセスであっても、配置が適切であれば、使用されているブレード・サーバーの数に応じて多重度の高い並列処理が実行されることになり、汎用的なRDBよりはるかに高速にクエリーを実行できるようになっています。
前者の方が、RDBをより汎用的に使用できますが、一方で後者は、徹底的にハードウエアとソフトウエアを一体化させることにより、特定用途向けに機能・性能を最適化し、低価格で提供するというアプライアンス本来のメリットを最大限に活用していると言えます。
本原稿執筆時点で、販売もしくは発表されている主なDWHアプライアンス製品は図1のとおりです。
次ページからは、OSSとBI、オンメモリDBとBI、データ・マイニングとBIについて、それぞれの最新動向を解説します。