「DATUM STUDIO Conference 2017(夏)」同社がデータ分析をサポートするユーザー事例を紹介【後編】

2017年8月17日(木)
狐塚 淳(こづか じゅん)

2017年7月13日、データ解析事業を幅広く展開するDATUM STUDIO株式会社が主催するセミナー「DATUM STUDIO CONFERENCE 2017(夏)」が、ハイアットリージェンシー東京エクセレンスシンポジウム会場にて開催された。前回に引き続き、DATUM STUDIOがデータ分析をサポートする幅広い業界・業種のユーザー事例を紹介する。

映画興行はビッグデータで分析する

日活株式会社の中村陽介氏は、「ビッグデータを活用した映画興行データベース」と題して講演を行った。中村氏は冒頭で2016年の国内映画市場について、興行収入2355億円、入場者数1.8億人、上映作品数1149本、劇場スクリーン数3472スクリーン、10代女性客が増加しているというデータを紹介。また作品数1149本のうち、興行収入10億円以上のヒット作は62本(5.4%)、その62本で興行収入の75.5%にあたる1779億円を売り上げており、2極化が進んでいるという。興行後のビデオレンタルや配信、テレビ放映の売上も興行収入での実績基準により条件が決定されるため、最初の入場者数が少ないとライフサイクルでの売り上げの減衰が激しいそうだ。

日活株式会社 中村陽介氏

映画のデータベースとしては、英国のEPAGOGIXが脚本ベースで北米での売り上げを予測できるシステムを持っている。既存映画の脚本構成、ストーリー上の細かい要素から機械的な分析で、米国での興行収入を紐づける分析システムだ。米国のメジャー映画会社はこれに懐疑的なスタンスを示したが、タレントエージェントからの持ち込み依頼が殺到したという。彼らは主に台本の時点で、ギャラを固定にするか米国での興行収入に応じたボーナス方式にするか出演交渉にあたっての指標として用いた。

日活が構築した興行データベースのメイン機能は2つで、いわゆるデータベース機能と、近似作品を抽出する興行シミュレータだ。興行シミュレータはこれから取り組む作品のジャンルやキャスト、監督要素などを変数に傾向が近い作品をデータベース内から抽出し、それをプロデューサーや配給担当が議論、判断する材料にすることを意図している。

データベース機能の活用については、多数の作品をデータベース化したことで見えてくることは多い。「名探偵コナン」のシリーズは昔からのリピーターが多く、年齢が上がっても新作を見続けるため、ここ数年の作品は20代のカップルが観に来るケースも多い。しかし「クレヨンしんちゃん」は圧倒的に親子連れの客が多く、子どもの成長とともに客層が入れ替わる傾向にある、ということなどもわかる。作品の市場戦略を立てるための武器になるだろう。

「データというものは、扱う側が仮説を持って、初めてデータ=事象となります。集合データの分析や、直観・経験の裏付けをデータで検証する際には、あらかじめ仮説があることで事象としての意味合いが現れてきます」(中村氏)。

データは、仮説をもって初めてデータと事象がイコールになり、その活用が可能になると中村氏は語る。もちろんデータと市場は生ものであり、過去のデータだけでは市場を説明できなくなるため、そこはデータを更新してくことで担保される必要がある。

中村氏は、「現在、作品の認知や評価にSNSは大きく関与してきます。映画興行データベースではSNS対応はまだ未開発ですが、今後は必要になるでしょう」と展望を語り締めくくった。

データ分析ツールを、使い勝手はそのままに機能拡張する

日本航空株式会社の渋谷直正氏が「SPSS modelerへのRノード組み込みとその活用事例」と題し、本セミナー最後のスピーカーとして登壇した。

日本航空株式会社 渋谷直正氏

「SPSS modelerは5年前から使っているが便利なツールで、SQLができなくても元データを壊さずに試行錯誤できます。しかし、相関行列やコレスポンダンス分析など基本的な分析ができないのが難点でした。また最新の手法や高度な分析にもチャレンジするようになってきましたが、そのような手法はサポートされておらず、他のツールを使わざるを得ない状況でした」(渋谷氏)とSPSS modelerのメリットとデメリットを指摘した。

しかし、より高度な分析を行うために新しいツールを導入するには、新たな教育が必要になる。無料の統計解析言語であるRはたくさんの分析モデルを持っているが、GUI(マウスによるPC操作環境)に慣れている日本航空の分析担当者がコマンドラインのプログラムを利用することは難しい。そこで渋谷氏はRをSPSS modeler上で動かせないかと考えた。

SPSS modelerはVer.16以降、SPSS modelerからRを呼び出して実行する機能が搭載されたので、Rの新しい分析機能を、SPSS modelerのパレットに追加する形でグラフィカルな使用感はそのままに利用できるようにしたい。

これはある意味、SPSS modelerを日本航空オリジナルにカスタマイズするということだ。渋谷氏はそのカスタマイズをDATUMSTUDIOに依頼した。

「開発と同時に、数学が分からない担当者が読んでも使えるわかりやすいマニュアルの作成もお願いしました」(渋谷氏)。

結果、期待にたがわぬ開発とマニュアルが完成した。一部の機能については依頼時点の仕様をさらに向上させた部分もあり、社内では導入ハードルなしに使いこなせているという。

さらに渋谷氏は同ツールのカスタマイズ後に行った新たな機能の事例として、量率プロットのモザイクグラフ描画、相関行列や相関グラフの出力、新しいクラスタリング手法のpLSA(確率的潜在意味解析)の3つを紹介した。

渋谷氏は「Web宣伝にはお金がかかります。お客様はマイレージを持っているので、データは確実に収集できるため、分析精度を上げてリコメンドに利用していきたい。お客様のニーズをさらに深く知ることで、トライアル施策と結果検証の精度を高めていきたい」と、一新されたツールによるデータ分析に意欲を見せた。

 * * *

2回にわたってDATUM STUDIO Conference 2017(夏)の各セッションに登場した導入事例を紹介してきたが、所有するデータの量や性質、そのデータをビジネスに活かすためのアプローチは企業によって大きく異なることがわかった。

しかし、データトランスフォーメーションが進展する中、企業はこれらのデータ分析を競争の優位性確保と差別化のために推進していく必要がある。自社の保有するデータを見極め、それをビジネスに活かす最適のアプローチを発見するためには、データ分析とAIで豊富な経験を持つビジネスパートナーの存在が、企業のチャレンジを加速してくれるはずだ。

著者
狐塚 淳(こづか じゅん)
コンピュータ系出版社の雑誌・書籍編集を経て、フリーランスのITライターに。現在は雑誌やWebメディアで、AI、ロボティクス、IoT、クラウド、データセンターなどの記事を中心に執筆している。

連載バックナンバー

仮想化/コンテナイベント

KubeCon報告からKubernetes対応版Dockerまで、Docker Meetup Tokyo #20開催

2018/1/30
コンテナーに関する勉強会「Docker Meetup Tokyo #20」が、2017年12月14日に開催された。11月に開催された「Docker Meetup Tokyo #19」に続く回となった。
仮想化/コンテナ

Red Hatが示したOpenShiftの将来とは

2018/1/24
Red Hatが推進するコンテナープラットフォームであるOpenShiftの1dayカンファレンスが開催された。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています