オープンソースカンファレンス 2007 Tokyo/Spring、セミナーレポート「自由ソフトで翻訳」
ローカライズ翻訳メモリOmegaT
2007/3/19 20:10
翻訳者を支えるオープンソースの翻訳メモリソフト
3月16日、17日の2日間にわたって、日本電子専門学校にて開催された「オープンソースカンファレンス 2007 Tokyo/Spring」の中から、セミナー「自由ソフトで翻訳」の模様をお伝えする。
このセミナーで取り上げられたソフトは、一般的にはなじみの薄い「翻訳メモリ」というカテゴリに属するものだ。翻訳といえば、「翻訳ソフト」の自動翻訳/機械翻訳がまず思い浮かぶだろう。翻訳メモリはそれらとは異なり、以前翻訳したテキストの基文と訳文を1つのセットとして記憶しておき、それを再活用することで翻訳者のサポートをするツールである。
本セミナーで紹介されたのは、オープンソースによって開発が進められている翻訳メモリ「OmegaT」だ。実際に翻訳者としても活動しているエラリー ジャンクリストフ氏は、まず「フリーソフトのフリーは無料という意味で使われていますが、英語ではフリーに自由という意味があります。自由ソフトということで、無料というよりも自由に使えるという点をアピールしています」と語った。
エラリー ジャンクリストフ氏
現在、OmegaTの最新版はバージョン1.6.1で、UIやドキュメントの日本語化が進んでおり、次バージョンの1.6.2から完全な日本語化が行われるという。なお、Javaアプリケーションとして公開されており、翻訳基となる言語の制限がないほか、コミュニティそのものが翻訳者によって構成されているため多言語によるユーザサポートが可能であるという。
対応可能なファイルは、Javaが扱えるすべてのテキストエンコードに対応したテキストファイルをはじめ、HTMLやXML、Windowsのヘルプファイル形式などになる。さらにOpenOffice.orgのODF形式や一部制限はあるがDocBookXMLにも対応するとのことだ。なお、Microsoft OfficeのドキュメントについてはOpenOffice.orgで変換することで対応できる。
これらのドキュメントを読み込むと、翻訳対象となる文章だけが編集対象となり、そこで翻訳作業を行う。その結果と基ファイルの修飾情報などを組み合わせ、翻訳後のファイルとして書きだせるという。
例えばWebサイトを構築するHTMLファイルを翻訳する場合、タグなどに記述された情報はそのままで、テキストのみを翻訳し、最終データとして書きだせることとなる。なお、基文と訳文の対訳データや用語集などはファイル化して保存しており、他者と共用したり、翻訳対象プロジェクトや言語ごとに必要な構成で再利用することもできる。実際にOmegaTはNetBeansのローカライズプロジェクトで利用されているとのことだ。
ジャンクリストフ氏は「OmegaTはJavaの本格的な知識がなくても、読み込みフィルタの開発や用途にあわせたカスタマイズが可能です。他の翻訳メモリツールとの互換性もあり、使い勝手のよいソフトとして開発が進められています。ぜひ翻訳メモリを活用すると共に、コミュニティにも参加してほしいと思います」と締めくくった。
(ThinkIT編集局 神保 暢雄)