データマネジメントの基礎を学ぶ(3)データマネジメント高度化ステップ(前編)
はじめに
前回は、データ統合の実現プロセスやパターン、さらには利用されるツールなどについて説明しました。今回は、データマネジメント高度化のステップについて説明します。
データマネジメント高度化の4ステップ
データマネジメント領域は広範にわたり、全てを同時に実現することは現実的ではありません。DMBOKでは、企業がデータマネジメントを段階的に高度化させていく4つのステップを“DMBOKピラミッド”として提唱しており、それぞれのステップで取り組むべきデータマネジメント領域を整理しています。ここからは、DMBOKピラミッドの4つのステップに沿って、高度化への進め方を考察してみましょう。
データベースの構築、運用にあたって必然的に要求される領域が、データモデリング、データストレージとオペレーション、データセキュリティの3領域であり、これらがデータマネジメントの出発点となります。データベースの種類や数が増え、システムが複雑化すると、データ統合が要求されます。データ統合が実現された段階が第1のステップとなります。
第2ステップは、より高品質なデータの取得です。これには、データ品質領域だけでなく、その土台となるメタデータ領域とデータアーキテクチャ領域への取り組みが必要となります。
第2ステップを達成すると、それまでの領域の成果を制度化し、組織的に運用するためのデータガバナンスが必要となります。データガバナンスが確立された段階で、ドキュメントとコンテンツ管理、参照データとマスタデータ、データウェアハウジングとビジネスインテリジェンスといった戦略的データ活用への取り組みが可能になります。これが第3ステップです。
第3ステップでDMBOKの11領域全てが実現されたことになりますが、DMBOKピラミッドでは、さらに第4ステップとして分析能力の高度化を設定しています。
続いて、各ステップの内容を解説します。
データ統合の実現
データモデリングでは、データ要件をデータモデルとして定義します。データモデルを定義するための一般的な様式にはリレーショナルやディメンショナルなどがあり、いずれの様式においても概念、論理、物理の3つのレベルで行なわれます。
データストレージとオペレーションでは、データモデルに基づいて物理的なデータベースを構築し、運用管理します。この領域は、データベース環境の初期実装からデータの取得、バックアップ、廃棄までのデータライフサイクル全般を対象とします。
データセキュリティでは、データセキュリティ要件に基づいて、セキュリティポリシーや手順を定義、実行し、データに対して適切な認証と権限付与を行い、アクセスを制御し、監査を行います。データセキュリティ要件には、ビジネス要件だけではなく各国、地域により異なる規制要件も含まれます。
以上の3つの領域でのデータマネジメントが実現できれば、単一のデータベースの場合は構築、運用に支障がなくなります。しかし、データベースの種類や数が増え、複数のデータベースに存在するデータを横断的に活用することが要求されるようになると、データ統合領域への取り組みが必要となります。データ統合の内容は前述の通りであり、その結果として部門横断的なデータ活用が実現でき、最短時間かつ最低限のコストで新しいデータソースを追加することが可能になります。これで、データマネジメント高度化の第1ステップに到達したといえます。
より高品質なデータの取得
データ品質では、最初に品質という観点から重要度の高いデータを特定します。コンプライアンス違反を招き、大きなビジネス損失を生むリスクのある低品質なデータや、品質を向上することで直接的に顧客満足度の向上に寄与するといったビジネス上のメリットが大きいデータが対象となります。重要度の高いデータから優先的にデータ品質の標準を設定し、標準をクリアするための仕組みをデータの生成、変換から保存に至るプロセスに組み込み、データ品質を監視します。このプロセスがデータ統合において設計、実装されている場合は、データ統合の一部について再度、設計、実装を行う必要があります。
データ品質の標準を設定するには、データ品質に対するニーズを明確にしたうえで、高品質なデータとは何かを具体的に定義しなければなりません。それを実現するのがデータアーキテクチャ領域です。ここでは、企業のデータニーズを明確にし、それを満たすデータの構造を設計します。
データアーキテクチャで設計されたデータ定義は、全てのシステム間で共有されなければなりません。それを実現するのがメタデータ領域です。メタデータでは、さまざまなデータソースのメタデータをリポジトリとして収集、統合し、それにアクセスするための標準的な方法を提供します。メタデータ・リポジトリには、データ品質に関する情報も含まれるため、データ品質改善活動のインフラとしても機能します。
メタデータ領域とデータアーキテクチャ領域の取り組みを土台としてデータ品質領域に取り組むことで、データマネジメント高度化の第2ステップの最終的なゴールである高品質なデータの取得に到達することができます。
おわりに
今回は、データマネジメント高度化の4ステップのうち、第1ステップのデータ統合の実現と、第2ステップのより高品質なデータの取得ついて説明しました。次回は、第3ステップのデータガバナンスの確立と戦略的データ活用、第4ステップの分析能力の高度化について説明します。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- データマネジメントの基礎を学ぶ(1)データマネジメントの全体像
- データマネジメントの基礎を学ぶ(4)データマネジメント高度化ステップ(後編)
- データ分析システムの全体像を理解する(8) データカタログとデータ・プレパレーション・ツール
- データ分析システムの全体像を理解する(5) 自由な分析環境とデータガバナンス強化を両立させる組織体制
- AI/機械学習とデータ分析の関係を知る(1)データ分析業務と組織の現状
- データマネジメントの基礎を学ぶ(2)データ統合の実現方法
- データ分析システムの全体像を理解する(2)定型的な分析と非定型な分析
- AI/機械学習とデータ分析の関係を知る(4) 学習済み開発における留意点
- データ分析システムの全体像を理解する(4) レポーティングツールとセルフサービスBIツール
- データ中心設計(DOA)に基づいたデータモデリング