オープンソースBI「Pentaho」とは
Pentaho BIスイートの特徴
Pentahoの特徴は、まず第1に、個々のBIソフトウエアを束ねたスイートであることです。レポーティング、インタラクティブ分析、ダッシュボード、データ統合/ETL、データ・マイニングなどの機能モジュールを備え、販売動向分析/顧客分析/営業レポート/財務分析/KPI(重要業績評価指標)ダッシュボードなど、さまざまな目的に対応できます(図2)。
以下では、それぞれのモジュールの特徴を解説します。
(1)レポーティング
RDBやOLAP(オンライン分析)、XMLベースのデータソースを含む、幅広いデータソースをサポートし、Adobe PDF、HTML、Microsoft Excelやリッチ・テキスト、プレーン・テキストなどポピュラーなフォーマットで出力します。また、ビジネス・ユーザーのための、Webベースでのレポート作成が可能です。
(2)インタラクティブ分析
多次元分析が可能な高速ROLAP(リレーショナルOLAP)エンジン「Mondrian」を搭載し、クロス・タブ・データやビジネス情報キューブを自由にドリリング(ドリル・ダウンおよびドリル・アップ)/ダイシング(集計軸の入れ替え)することで、スピーディに見たい結果を表示できます。
(3)ダッシュボード
Adobe Flashベースのチャート・グラフを含むリッチでインタラクティブなダッシュボードを作成できます。特に有償版のEEは、ビジネス・ユーザーが自ら簡単にダッシュボードを作成できる、セルフサービス型のダッシュボード・デザイナ機能を備えています。
(4)データ統合/ETL
ドラッグ&ドロップ形式の直感的なデザインで、100個以上のオブジェクトを組み合わせて複雑なデータ変換とジョブを作成し、DWH(データ・ウエアハウス)を構築できます。商用やオープンソースのデータベースなど30種類以上のデータソースを幅広くサポートしています。
(5)データ・マイニング
膨大なデータから法則性を分析する、高度なデータ・マイニングをグラフィカルなインタフェースで操作可能です。データ・マイニング・エンジン「Weka」を搭載し、豊富なマイニング・スキームを用いて隠れたパターンや相関関係を発見できます。
BIスイートでは、このほかにも、セキュリティ機能やスケジューリング機能など各種の機能を提供します。Webインタフェースによって、Webブラウザに対して、レポート、OLAP分析、ダッシュボードの配布/管理を行います。
Pentaho BIスイートの入手
コミュニティ・エディション(CE)のPentahoソフトウエアは、Pentaho Communityサイトのそれぞれのプロジェクトから無償でダウンロード可能です。Pentaho CommunityサイトからSourcefogeなどのダウンロード・サイトにリンクしています。
また、国内にあるPentahoパートナ・サイトからは、最新の日本語ソフトウエアや日本語ドキュメント、サポートの付いた日本語スタート・キットを購入できます。
安定したエンタープライズ・エディション(EE)のPentahoソフトウエアは、30日間の体験版が配布されています。米国のPentahoサイトからダウンロードできますが、国内のPentahoパートナ・サイトから入手することも可能です。米国版は日本語化が不十分ですが、Pentahoパートナ・サイトが配布する版は日本語化が十分に進んでいます。
Windows版はインストーラをダウンロードしてインストールすれば使用可能ですが、Linux版はソフトウエアのダウンロードとは別途、体験期間30日間のライセンス・ファイルを取得し、インストール後にライセンス・ファイルの登録が必要となります。
システム要件は以下の通りです。ハードウエア要件は、ここ2~3年のミドルレンジ・モデルのPC(メモリ2Gバイト、HDD空き容量1Gバイト、デュアルコアAMD64またはEM64T)であれば問題なく動作するでしょう。64ビットである必要はありません。一方、ソフトウエア要件は、Windows(XP SP2以降、Server 2003以降)、Linux(SUSE 10以降、Redhat 5以降)、Sun JRE 1.5とブラウザ(IE6以降、Firefox3.0以降など)が必要です。データベースは、MySQL、PostgreSQL、Oracleが推奨されています。
では、次ページでは実際にPentahoソフトウエアをインストールしてみましょう。