PR

BIの周辺技術

2010年3月16日(火)
平井 明夫

OLAPと多次元データベース

BIの初期には、パワー・ユーザーが主なユーザー層であったことは、前のパートで述べたとおりです。しかし、この時期、パワー・ユーザーの中でも、さらに高度なデータの分析を必要としたユーザー層が存在しました。これらのユーザー層のニーズを満たすために、OLAP(On Line Analytical Processing)と呼ばれるデータ処理方式を実装した多次元データベースが登場しました。

OLAPでは、3次元以上の多次元データベースから2次元のクロス集計表としてデータを取り出し、ドリルダウン、スライシング、ダイシングという3つのデータ分析操作により、データの多次元的な分析を行います。図2-1は、多次元データベースとOLAP分析操作を模式化したものです。

この図で、さいころの形をしたものが多次元データベースです。この例では、期間、製品、地域という3次元のデータベースになっています。これらの次元は、それぞれ階層を持っています。一方、さいころの中には、販売金額という数値が入っています。ただし、この数値は、既に3つの次元と階層のすべての組み合わせについての集計値になっています。

したがって、このさいころの手前の面を2次元の表として見ると、図の左下のように横軸が期間で縦軸が地域の表になっていて、表の中には期間と地域の組み合わせ(この場合9通り)の集計値が含まれていることになります。

ドリルダウン/スライシング/ダイシング

このように、多次元データベースの中には、次元(ディメンション)とその次元を構成する項目(メンバー)をキーとして、非常にたくさんの集計値(メジャー)が含まれています。RDBではSQLを用いてレコード単位でデータを取り出しますが、多次元データベースでは、集計値を2次元の表の単位で扱い、ある1つの2次元表に対して次の3つの操作を行うことにより、特定の表を取り出します。

(1)ドリルダウン

ドリルダウンは、ディメンションの階層にしたがってデータを掘り下げる操作です。図の例では、期間ディメンションの年階層から月階層にドリルダウンしています。ドリルダウンの反対で、より上位の階層に戻る操作をドリルアップと呼びます。

(2)スライシング

スライシングは、多次元データベースの目に見えていない奥行きになっている次元に沿って切れ目を入れて(スライスして)データの対象を絞り込む操作です。図の例では、製品次元に沿ってスライスして製品Aだけを対象としたデータに絞り込んでいます。

(3)ダイシング

ダイシングは、多次元データベースをさいころ(ダイス)に見立て、それを転がす(ダイシングする)ことによって、目に見える面を取り換える操作です。図の例では、地域ディメンションと製品ディメンションをダイシングにより取り換えています。

このようなOLAPおよび多次元データベースは、主に財務、経営企画、マーケティングといった業務で利用されます。これらの業務に携わるユーザーは、データ分析自体が主要な業務の1つであり、Excelがもっとも使い慣れたユーザー・インターフェースとなります。このため、多次元データベースを操作するソフトウエアは、主にExcelのアドイン・ソフトとして提供されています。

2010年3月時点で、日本で販売・サポートされている主な多次元データベース製品は、図2-2のとおりです。

株式会社クロスキャット シニアコンサルタント

2004年、前職にて、当時は珍しかったOSS BIツールOpenOLAPの開発に参画、現在は、中堅・中小企業向け経営管理ソリューションのローンチに携わるかたわら、データ分析を中心としたテーマでの講演・執筆活動を行っている。主な著書・共著書に『BIシステム構築実践入門』、『データ分析できない社員はいらない』がある。

Think IT会員サービス無料登録受付中

Think ITでは、より付加価値の高いコンテンツを会員サービスとして提供しています。会員登録を済ませてThink ITのWebサイトにログインすることでさまざまな限定特典を入手できるようになります。

Think IT会員サービスの概要とメリットをチェック

他にもこの記事が読まれています