TIS、自然言語処理・機械学習向けデータ作成ツール「doccano」を発表
2018年11月11日(日)
TISは11月6日、自然言語処理・機械学習向けのデータ作成ツール(アノテーションツール)「doccano」をオープンソースソフトウェアとして公開すると発表した。
「doccano」は、自然言語処理・機械学習に使われるラベル付きデータ(教師データ)の作成を容易にするツール(アノテーションツール)。テキスト分類、系列ラベリング、系列変換という3つの基本的なタスクで使用するデータを作成することができる。セットアップが容易であり、英語以外に日本語にも対応している。
「doccano」を利用することで、作成に特に手間がかかる系列ラベリングのデータを簡単に作成できる。テキスト分類や系列変換は、Excelなどの帳票ツールでも作成できるが、系列ラベリングでは文字・単語単位でデータを作る必要があるため、帳票ツールのみでは作成が困難。系列ラベリングに「doccano」を活用することで、対象の単語を選択し、ボタンやショートカットキーを押すだけでラベル付けが可能。
TISは「doccano」をOSSとして公開し、より多くのフィードバックを得ることで機能を改善し、データ作成業務を効率化することで機械学習・自然言語処理の市場の拡大を目指す。
(川原 龍人/びぎねっと)
[関連リンク]
プレスリリース
GitHub(doccano)
その他のニュース
- 2024/12/15 オープンソースの監視ソフトウェア「Zabbix 7.2.0」リリース
- 2024/12/14 AWS、「Data Exports for FOCUS 1.0」の一般提供を開始
- 2024/12/13 Linuxディストリビューション「OpenMandriva Lx 24.12 "ROME"」リリース
- 2024/12/11 オープンソースのエミュレーター「QEMU 9.2」リリース
- 2024/12/10 systemdの代替を目指すサービスマネージャ「GNU Shepherd 1.0」リリース
Think ITメルマガ会員登録受付中
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。
全文検索エンジンによるおすすめ記事
- 分散型ストリーミング処理フレームワーク「Apache Storm 1.2.3」リリース
- オープンソースJava統合開発環境「Apache NetBeans 11.1」リリース
- Java仮想マシン上で動作するJavaベースのプログラミング言語「Apache Groovy 3.0.0」リリース
- Javaアプリケーションフレームワーク「Apache Wicket 7.16.0」リリース
- オープンソースJava統合開発環境「Apache NetBeans 12.3」リリース
- アプリケーションテストツール「Apache JMeter 5.3」リリース
- Java仮想マシン上で動作するJavaベースのプログラミング言語「Apache Groovy 2.5.0」リリース
- オープンソースJava統合開発環境「NetBeans 9.0」リリース
- オープンソースJava統合開発環境「NetBeans 10.0」リリース
- オープンソースJava統合開発環境「NetBeans 10.0」リリース