クラウドとBI
PaaSがBIに与える影響とその事例(1)
GAE(Google App Engine)やForce.com(SaaSの「Salesforce CRM」からCRM機能を除いた開発基盤)に代表的されるPaaSは、アプリケーションの開発環境をサービスとして提供します。しかし、これらの代表的なPaaSを利用してBIシステムを構築するには、現状では大きな壁が存在します。それは、これらの代表的なPaaS環境で利用できるデータベースは、RDBではないということです。
これらのPaaS環境はもともと、Google AppsやSalesforce.comといった、BI的なものを含まないアプリケーションを、巨大な規模で構築、運用するための基盤として発展しました。そのため、これらに含まれるデータベースは、RDBよりも分散性に優れるキー・バリュー型データベースとなっています。
キー・バリュー型データベースでは、データは、キーとバリューの組み合わせからなるオブジェクトとして格納されます。このオブジェクトに対する検索機能は、RDBに比べると非常に簡略化されています。例えば、GAEにおけるキー・バリュー型データベースの「BigTable」では、1つのキーに対する前方一致検索と範囲指定検索しか使用できません。
また、このようなキー・バリュー型データベースでは、基本的にJOINやVIEWといった、RDBの前提となる概念が存在しません。結果として、スター・スキーマのようなデータベース構造を持つことは難しくなり、GAEやForce.comといった代表的なPaaS環境は、DWHの構築には適さないという結論になります。
しかしながら、このような代表的なPaaS環境がより広い用途に利用され始めるのは時間の問題であり、RDBと同一かどうかは別にして、将来的にはDWHの構築が可能になるような機能強化がされていく可能性は高いと言えます。このような動きの代表的な例が、米MicrosoftのPaaSであるWindows Azureに見られます。
Windows Azureの標準のストレージは、Windows Azure Storageと呼ばれます。Windows Azure Storageで利用可能なテーブルは典型的なキー・バリュー型で、Authority、Container、Entityというオブジェクト階層を持ち、最下層のEntityが複数のProperty(キーとバリューの組み合わせ)を持ちます(図2)。
PaaSがBIに与える影響とその事例(2)
しかし、最近になってオプション・サービスとして追加されたSQL Azureでは、今までのSQL Serverに相当するRDB型の機能がほとんど実現されています。このSQL Azureでは当然のことながら、JOINやVIEWといった機能を利用することができ、今までのRDBと同じ手法で、スター・スキーマのようなデータベース構造を作ることができるようになりました。
一方では、IaaS上にあらかじめRDBやBIスイート製品を導入した環境を、BI用途専用のPaaSとして提供するベンダーも現れています。例えば、2009年8月に米Jaspersoftがほかの3社と共同で発表したサービスは、米JaspersoftのBIツールに米Vertica SystemsのDWH専用RDBなどを組み合わせて、BIシステムの開発環境を提供するものです。
これは、前ページで紹介したIaaSの事例とは異なり、米Jaspersoft自身がBIシステムの開発環境をサービスとして提供しており、その意味でPaaSの事例であると言えます。
次ページでは、SaaSがBIに与える影響を解説します。