NTTアイティ、評判情報解析サービス「評Ban」に話題まとめ表示機能を新たに搭載

2015年1月16日(金)

NTTアイティは1月13日、ソーシャルリスニングサービス「評Ban」において、「まとめ表示機能」を新たに搭載し、提供開始した。

NTTアイティでは、SNSや掲示板等のソーシャルメディア上に散在するクチコミ情報をリアルタイムで収集・解析して、該当情報数の増減や好評不評傾向を、早期通知し状況把握できるサービス「評Ban」を販売してきた。今回、大量のクチコミ情報を内容レベルでの傾向把握が容易となる「まとめ表示機能」を提供開始する。「まとめ表示機能」は、主にTwitter上の書き込みの中からクチコミ情報を自動的に収集し、類似のクチコミ情報を分類しまとめることで、その日の主要な話題を確認することができる機能。大量の文章の類似性の分析には膨大な計算量が必要なため、高度な類似分析および高速処理技術を用いることで、精度とリアルタイム性を実現している。

評判情報解析サービス「評Ban」は、会社名や製品名などの任意のキーワードを登録しておくだけで、Twitterや掲示板、ブログ、ニュースサイトなどのソーシャルメディアから、一般ユーザの生の声であるクチコミ情報や企業や製品の評判情報を自動的に収集したり、いじめやバイトテロなどのクチコミ情報を監視することができるサービス。Twitterを中心としたソーシャルメディアには日々大量のクチコミ情報が流れている。これまでも、任意のキーワードを含むクチコミ情報を選択的に収集することでクチコミ情報数の増減を把握することは可能だったが、主要なクチコミ情報を確認するためには、収集した大量のクチコミ情報を1つずつ確認する作業が必要だった。そこで、NTTアイティでは、主要なクチコミ情報を容易に確認可能にするため、新たに「類似記事抽出アルゴリズム」を開発し、単語レベルだけでなく文章の内容レベルで類似したクチコミ情報を集約・一覧化する「まとめ表示機能」を搭載した。

特長は以下の通り。

  • クチコミ情報を1/10程度にまで圧縮
    「まとめ表示機能」によりクチコミ情報を類似のものにまとめることで、確認すべきクチコミ情報の件数が1/10程度まで圧縮される。また、まとめた件数の降順で表示することができるので、最も多いクチコミ情報の確認や、一定の件数以上のクチコミ情報だけを確認するなど、確認作業を大幅に減少させることができる。
  • 高度な類似分析(辞書の質に影響受けず、メンテナンス不要)
    類似分析では、新たに搭載した「類似記事抽出アルゴリズム」をリアルタイムで適用することで、収集した全てのクチコミ情報間の相関性を分析し、文章特徴空間内にクチコミ情報をマッピングした後、文章特徴空間を類似のグループに分割していく。分析には辞書やヒューリスティックなアルゴリズムなどを用いず、文章の相関性で判断するため、辞書やアルゴリズムの質に影響されない高度な類似分析が可能となった。また、メンテナンスも不要。
  • 高速な処理
    文章の相関性を用いた類似分析は、精度の高い結果を出すことができる反面、計算量が膨大なため、リアルタイムで結果が要求されるシーンにおいては一般的ではなかった。今回新たに開発した「類似記事抽出アルゴリズム」では、リアルタイム機械学習フレームワークであるJubatus(ユバタス)を使用することで、極めて高度な分析かつリアルタイムでの処理を可能とした。これにより、リアルタイムに準ずる速度で当日の最新のまとめ表示情報を提供することが可能となっている。
  • 3ヵ月分のまとめ情報を保管
    過去3ヵ月分の日別の主要なクチコミ情報を保管している。主要なクチコミ情報を遡って確認することが可能。

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る