第3回:テキストマイニング技術の全貌 (2/3)

テキストマイニング
顧客の声を活用するテキストマイニング

第3回:テキストマイニング技術の全貌

著者:野村総合研究所  神田 晴彦   2006/12/25
前のページ  1  2  3  次のページ
TRUE TELLERの構文解析

   さらに深い分析を行う場合、TRUE TELLERでは構文解析という処理を行っている。さて、この「構文解析とは何か」について、もう少し深く見ていこう。

   従来のテキストマイニングで行う形態素解析では、文章内での単語の出現状況を把握するのみで、単語間のつながりを判別することは不可能であった。これに対して構文解析は、文章を単語間に分割した後、文法的なつながり(係り受けの関係)を判断する技術である。

   例えば主語と述語の関係や、修飾語と被修飾語の関係の把握を行う。これによって、より正確で、かつ詳細な文章の内容の判断ができる。「何が良くて、何が悪いのか」という、文章で最も重要な情報を正しく知ることが可能になる。

   この構文解析については、具体的な例をみていこう。今、著者は2年前に購入したノートパソコンでこの原稿を書いている。購入時は見た目が良かったのだが、使っていると今ひとつ性能が悪く悩んでいる。そこで、「デザインは良いけど、性能が悪い」という著者のコメントを解析してみよう。

   この文章に形態素解析を行うと、以下のようになる。

   「デザイン/は / 良い/けど / 性能/が / 悪い」

   このまま統計処理を行うと、1つの問題が発生する。例えば著者のような表現を用いた発言が多い場合には、単純に単語の同時出現件数を集計すると「性能 / 良い」の組み合わせが非常に多いと判断してしまうことがある。果たしてこのノートパソコンは、性能が良かっただろうか。

   一方、形態素解析を行った結果をさらに構文解析にかけると、前後関係を捉えて判断してくれる。その結果前述の通り、文法的には主語と述語の関係や修飾語と被修飾語の関係を捉えてくれるため、「良いのはデザイン。悪いのは性能。」と正しく判断することができるのだ。

構文解析結果
図2:構文解析結果

   複数の係り受けも判断できる。例えば、「店員の説明や分厚いマニュアルは、理解でなきかったよ、私には。」といった文章があった場合、表1のように判断できるのである。

  • 店員の説明は理解できない
  • 分厚いマニュアルは理解できない
  • 私には理解できない

表1:判断結果

   また上記の判断に関するTRUE TELLERでの解析結果を図3に示す。

構文解析結果
図3:構文解析結果

前のページ  1  2  3  次のページ


株式会社野村総合研究所  神田 晴彦
著者プロフィール
株式会社野村総合研究所  神田 晴彦
野村総合研究所ビジネスインテリジェンス事業部にてテキストマイニングを活用したCS調査や、データマイニング分析コンサルティングを数多く手がける。近年はテキストマイニングによるBlog分析やFAQ構築、品質管理・経営層向けのポータルサイトの構築を実施している。また人材育成プロジェクトも担当し、日本で最初となるテキストマイニング認定試験の企画に携わる。高度情報処理技術者(上級シスアド)。


INDEX
第3回:テキストマイニング技術の全貌
  テキスト処理の流れ
TRUE TELLERの構文解析
  TRUE TELLERによる分析
顧客の声を活用するテキストマイニング
第1回 テキストマイニングとは
第2回 テキストデータ活用の変遷
第3回 テキストマイニング技術の全貌
第4回 テキストマイニングの活用事例
第5回 顧客の声を経営に活用するための課題解決法

人気記事トップ10

人気記事ランキングをもっと見る