PR

TIS、自然言語処理・機械学習向けデータ作成ツール「doccano」を発表

2018年11月11日(日)

TISは11月6日、自然言語処理・機械学習向けのデータ作成ツール(アノテーションツール)「doccano」をオープンソースソフトウェアとして公開すると発表した。

「doccano」は、自然言語処理・機械学習に使われるラベル付きデータ(教師データ)の作成を容易にするツール(アノテーションツール)。テキスト分類、系列ラベリング、系列変換という3つの基本的なタスクで使用するデータを作成することができる。セットアップが容易であり、英語以外に日本語にも対応している。

「doccano」を利用することで、作成に特に手間がかかる系列ラベリングのデータを簡単に作成できる。テキスト分類や系列変換は、Excelなどの帳票ツールでも作成できるが、系列ラベリングでは文字・単語単位でデータを作る必要があるため、帳票ツールのみでは作成が困難。系列ラベリングに「doccano」を活用することで、対象の単語を選択し、ボタンやショートカットキーを押すだけでラベル付けが可能。

TISは「doccano」をOSSとして公開し、より多くのフィードバックを得ることで機能を改善し、データ作成業務を効率化することで機械学習・自然言語処理の市場の拡大を目指す。

(川原 龍人/びぎねっと)

[関連リンク]
プレスリリース
GitHub(doccano)

※本ニュース記事はびぎねっとITニュースから提供を受けて配信しています。
転載元はこちらをご覧ください。

Think IT会員サービス無料登録受付中

Think ITでは、より付加価値の高いコンテンツを会員サービスとして提供しています。会員登録を済ませてThink ITのWebサイトにログインすることでさまざまな限定特典を入手できるようになります。

Think IT会員サービスの概要とメリットをチェック