AI/機械学習とデータ分析の関係を知る(2) シチズン・データ・サイエンティストの役割
はじめに
前回は、AI/機械学習がもたらすデータ分析業務の効率化の結果としてもたらされる、データ・サイエンティスト組織の少数精鋭化とシチズン・データ・サイエンティストの登場について解説しました。今回は、シチズン・データ・サイエンティストの役割と、これからのデータ分析の組織・体制について解説します。
ビジネス理解/データ理解の
工程における役割
シチズン・データ・サイエンティストが、企業のデータ分析組織・体制において、データ・サイエンティストに代わって遂行できる役割とはどのようなものでしょうか。シチズン・データ・サイエンティストがデータ準備とモデリングに関与するのは前回で解説した通りですが、役割はそれだけではありません。シチズン・データ・サイエンティストは、その前後においても重要な役割を果たします。
シチズン・データ・サイエンティストが持つ統計解析知識と経験は、データ・サイエンティストと比較して限定的であるため、「ビジネス理解」や「データ理解」といった自動化されない初期の工程においては、データ・サイエンティストとの共同作業とならざるをえません。例えば、データの性質やビジネス上で期待される効果に合わせて適用可能な分析アルゴリズムを選択するといった場面では、統計解析知識と経験が豊富なデータ・サイエンティストが主導的な役割を果たす必要があるでしょう。
それでも、これらの工程において、ビジネス部門に所属するシチズン・データ・サイエンティストは大きな役割を果たすことができます。従来、これらの工程ではデータ・サイエンティストが統計解析知識を持たないビジネスユーザーへのヒアリングを行うやり方が一般的でした。
そのため、正しい理解を得るために時間がかかる、あるいは誤った理解の下で作業を進めた結果、最後の「適用」工程で分析結果が的外れであることが判明するといった問題が発生していました。今後は、業務知識と統計解析知識の双方を持つシチズン・データ・サイエンティストが介在することで、このような問題が解消されることが期待されています(図1)。
評価/適用の工程における役割
「評価」工程においては、得られた分析結果が期待通りではない、あるいは、必要な精度が得られないといった場合に、分析アルゴリズムの変更や分析モデルの改善が必要となります。そのため、初期の工程と同様に、シチズン・データ・サイエンティストは、豊富な統計解析知識と経験を持つデータ・サイエンティストと共同で作業にあたることになります。
「適用」工程は、得られた分析結果をビジネスに活用する局面であり、そのためには、統計的に得られた分析結果の内容を、業務上の判断に結びつける必要があります。今までは、データ・サイエンティスト側の業務知識の不足とビジネスユーザー側の統計解析知識の不足により、統計的には正しい分析結果でも業務上の判断に結びつけられないという問題がありましたが、業務知識と統計解析知識の双方を持つシチズン・データ・サイエンティストが主導的な役割を果たすことで、このような問題が解消されることが期待できます(図2)。
以上のように、シチズン・データ・サイエンティストは、データ・サイエンティストの全ての業務を代行できませんが、一部の業務を代行することで、データ・サイエンティストの負担を軽減し、人材不足の解消に貢献できます。さらに、業務知識と統計解析知識の双方を持つシチズン・データ・サイエンティストがデータ・サイエンティストとビジネスユーザーの間に介在することで、従来よりも迅速に分析業務を進め、より正確な分析結果を得ることができるでしょう。
これからのデータ分析の組織・体制
このような役割を果たすシチズン・データ・サイエンティストが各ビジネス部門に配置されることによって、データ分析の組織・体制はどのように変化するでしょうか。
従来のデータ分析の組織・体制は、データ・サイエンティストとビジネスユーザーの2階層で構成されていました。シチズン・データ・サイエンティストは、この両者の中間に位置し、データ・サイエンティストの業務の一部を代行し、データ・サイエンティストがビジネスやデータを理解してビジネスユーザーがデータ分析結果を業務に適用する局面で双方を支援することになります。つまり、これからのデータ分析の組織・体制は、シチズン・データ・サイエンティストを中間層とする3階層構造を持つことになります(図3)。
この3階層のシチズン・データ・サイエンティストの対象となる人材は、特定のビジネス部門で長年の経験と豊富な業務知識を持つ社員です。このような社員が統計解析知識を新たに身につけることで、そのビジネススキルをより有効に活用できるようになることは企業にとっても大きなメリットになります。
一方で、そのような人材は既存業務において中心的な役割を果たしていることが多く、部門内での調整だけで簡単に配置を決断することは難しいと考えられます。加えて、本来の主担当ではないデータ分析業務をビジネス部門に所属したままで副業的に担当させ、かつモチベーションを維持させるには、人事評価や待遇面での何らかの処遇が必要となるでしょう。シチズン・データ・サイエンティストの養成と維持には、人事部門も含めた全社的な取り組みが必要と言えます。
おわりに
ここまで、推論・予測を行う高度なデータ分析を題材に、AI/機械学習が及ぼす業務や組織への影響について見てきました。
現段階では、データ準備とモデリングが主な対象ですが、AI/機械学習が自動化するのはそれだけに留まらず、将来はデータ分析の全工程が対象になると考えられます。今後は機械学習の生成物である学習済みモデルの活用機会が増え、迅速で低コストな分析業務の推進に大きく関わってくることとなります。そこで、次回からは学習済みモデルの活用法や注意点について解説します。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- AI/機械学習とデータ分析の関係を知る(1)データ分析業務と組織の現状
- AI/機械学習とデータ分析の関係を知る(3) 学習済みモデルによるデータ分析の効率化
- データ分析システムの全体像を理解する(8) データカタログとデータ・プレパレーション・ツール
- データマネジメントの基礎を学ぶ(3)データマネジメント高度化ステップ(前編)
- データ分析システムの全体像を理解する(6) 統計的な分析とデータマイニングツール
- データマネジメントの基礎を学ぶ(4)データマネジメント高度化ステップ(後編)
- データマネジメントの基礎を学ぶ(1)データマネジメントの全体像
- データ分析システムの全体像を理解する(1) データ分析の高度化ステップ
- データマネジメントの基礎を学ぶ(2)データ統合の実現方法
- データサイエンティストが高給取りな理由