ぐれっぐのことば日記・改

引越ししてみました

こんな翻訳ツールを使って・作ってみたい

ふと興味が湧いて、Bing TranslatorSYSTRANGoogle Tranlsationを試してみた。

Bingは仕様を読んでいないので確かではないが、翻訳可能な言語ペアを見るところ、統計的翻訳システムであるらしい。ユーザは出てきた翻訳に対して、「よい」「間違い」「相応しくない」というフィードバックを返すことができる。"How does the translation from English to Spanish work with Bing?"の和訳が、ビンビンな翻訳、"英語からスペイン語への翻訳をビンビンに仕組みは?"になってしまうのはいかがなものか。。。

SYSTRANは前のバージョンまでは翻訳ルールに基づくものだったが、最新のバージョンは翻訳ルールと統計的翻訳の混合システムであることを売りにしている。英日訳の結果を見ると、単語が細かく区切られ一つ一つに翻訳元文中の単語との対応付けを表示してくれるので、翻訳ルールっぽい気もするがどうだろう。"How does the translation from English to Spanish work with Bing?"の和訳は"翻訳はいかにSYSTRANを英語からスペイン語の使用からのか。" 助詞がちょっと多め。

Google Tranlsationは統計的翻訳のみ。SYSTRANにあるように出力された翻訳結果は句レベルでの対応を見ることができ、さらにユーザが正しい翻訳を与えることができる。もし語順が間違っていたら直すこともできるらしい(やったことないけど)。いい機能であるのだが、区の切れ目に少し難があり、直したいと思うことが多い。"How does the translation from English to Spanish work with Bing?"の和訳は"ビングと英語からスペイン語への翻訳の仕事はどうですか?" 動詞としてのworkが「仕事」と翻訳されている。。。


とまあ、ごちゃごちゃ見てきて、ほしいなと思ったのは区の切れ目を直すことにより、どう翻訳が変わるかを動的に可視化するというツール。統計的翻訳モデルではあるところに切れ目ができるのはデータから統計的に導かれる意味があるのだろうが、ユーザが見て意味がなかったら可視化する利点があまりない。

そんな研究なんてどこかでされていそうだが、誰か知りませんかね?