Yahoo、分散表現の学習時間を短縮化する「yskip」をオープンソースとして公開
2019年4月22日(月)
Yahoooは4月18日、分散表現の学習時間を短縮化する技術「yskip」をオープンソースソフトウェアとして公開した。
「分散表現」は、単語をベクトルとして扱うAI技術。分散表現を利用すると、大量のテキストから様々な単語の関係を学習し、単語同士の意味の相違を機械的に推定することができる。Yahooでは、ユーザの興味関心情報と、記事や広告のマッチングに応用している。「分散表現」は、大量のテキストデータを学習データに用いることで利用できるが、日々増加するキーワードに対応するためには、学習モデルを頻繁に更新する必要があった。従来の技術では、新しいデータだけでなく既に学習したデータもあわせて学習しなおす必要があり、効率に問題があったという。
「yskip」は、新しいデータの学習のみによって従来の技術と同等精度を維持する分散表現技術として開発された。この技術は、「skip-gram model with negative sampling(SGNS)」を拡張したもの。
「yskip」は、GitHubに公開されている。
(川原 龍人/びぎねっと)
[関連リンク]
Blogによる記事
その他のニュース
- 2024/11/4 Debianベースのデスクトップ向けLinuxディストリビューション「Nitrux 3.7.1」リリース
- 2024/11/4 「LibreOffice 24.2.7 Community」リリース
- 2024/11/3 Microsoft、DNSSECを利用した受信SMTP DANEの一般提供を開始
- 2024/11/1 コードエディタ「Visual Studio Code 1.95」リリース
- 2024/10/31 ブラウザAIを搭載した「Opera One R2」リリース
Think ITメルマガ会員登録受付中
Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。
全文検索エンジンによるおすすめ記事
- OSS検索エンジンLuceneとは
- 最新人気サービスを支えるディープラーニング
- Yahoo!、ビッグデータ処理エンジン「Vespa」をOSSとしてリリース
- Yahoo!、ビッグデータ処理エンジン「Vespa」をOSSとしてリリース
- 伊藤忠テクノソリューションズ、Yahoo! JAPANのデータ分析基盤にオープンネットワーキングソリューションを提供
- 伊藤忠テクノソリューションズ、Yahoo! JAPANのデータ分析基盤にオープンネットワーキングソリューションを提供
- 慶應義塾大学の研究室とYahoo! JAPANがAIを活用した最適なプッシュ通知の技術を発表
- 少人数によるアジャイル開発の事例
- Yahoo!、膨大な選択肢の中から適切な解を予測するAI技術「AnnexML」をオープンソースソフトウェアとして公開
- Yahoo!、膨大な選択肢の中から適切な解を予測するAI技術「AnnexML」をオープンソースソフトウェアとして公開