Google翻訳の高性能化が話題ですが
Googleの翻訳サービスがニューラルネットワークに基づく機械翻訳を導入、高性能化したと話題になっております。
山本一郎です。高性能化したら山本十郎とかになるんでしょうか。
ところで、Googleが従来から提供してきた翻訳サービスにおいて、ニューラルネットに基づく機械翻訳を導入したと発表しました。
Google 翻訳が進化しました。(Google Japan Blog 16/11/16)
ニューラルネットを活用した機械翻訳は、数年ほど前から素晴らしい研究成果を生み出しており、9 月には Google の研究者がこの手法の発表を行いました。今回、採用した新しいシステムでは、文章をパーツごとに翻訳するのではなく、ひとつの文として扱います。文のコンテキストを把握することで、より正確な訳語の候補を見つけることができるようになり、その後、言葉の順番を変え調整することで、文法により正しく、人の言葉に近い翻訳が出来るようになります。Google Japan Blogネット民の間でこの新しくなったGoogle翻訳がすごいということでかなり盛り上がったりもしていましたが、実は釣りネタだったという一幕も。
Google翻訳がダチョウ倶楽部の「あのギャグ」を理解?釣られる人続出(しらべぇ 16/11/17)
「押すなよ!絶対押すなよ!」を英訳すると…?Google翻訳が進化(BuzzFeed 16/11/17)
さすがにそうですよね。
で、このGoogleによる新しい機械翻訳の大きなセールスポイントは、システム上に学習機能があり、翻訳をさせればさせるほどより自然な翻訳ができるようになるという点にあるそうです。
ニューラルネットに基づく機械翻訳は、システム上にエンドツーエンドで学習し続けるシステムを構築しています。お使いいただくことで、よりよい、より自然な翻訳が出来るようになっていきます。Google Japan Blog具体的にどのような学習が行われているのかについては以下の記事が参考になります。
グーグル、ニューラル機械翻訳の仕組みをブログで解説(CNET Japan 16/11/24)
たとえば、多言語システムを日本語と英語、韓国語と英語の双方向の翻訳例で学習させるとする(中略)。多言語システムは(中略)この4通りの組み合わせで翻訳するためのパラメータを共有する(中略)。これにより韓国語から日本語への翻訳については教えていないにもかかわらず、まずまずの水準の韓日翻訳ができるようになるCNET JapanさすがAIの時代になるとこうなるのかと感心するわけですが、少しばかり穿った見方をすると、もし誰もこの翻訳サービスを使わなければデータが集まらず、学習できる機会が発生しにくいということになりましょう。なので、Googleとしては現時点ではできるだけ多くの人に同サービスを使ってもらってシステムに学習させたいという意図があると考えられます。ということで、翻訳システムのAPIが企業や開発者向けに今のところは無料で公開されています。
GOOGLE 翻訳 API(Google Cloud Platform)
ここで注意したいのは「今のところは無料」であっても、いずれはGoogleマップのAPIと同じようにいずれ有料化される可能性は否定できないということです。
GoogleマップのAPIは過去に完全無料で提供されていましたが、後にアクセス件数が多い場合には有料となり、さらに最近では課金ユーザーでも利用できる1日あたりのアクセス回数の上限が大幅に引き下げられるというポリシー変更がありました。これによって同APIを利用していた商用サイトでは大きな影響を受けたところもあったようです。
Google Maps API無償版のポリシー変更、猶予期間が10月12日で終了、地図が突然表示されなくなる可能性も(INTERNET Watch 16/11/11)
まあ、ウェブサースはどんなに便利で無料やタダ当然で使えても、いつかは料金が発生したり突然サービス終了という事態が起こり得ると覚悟しておくほうが無難でしょう。もちろん、Googleも営利企業ですから、無料で集まった利用者を見て「よっしゃ収益化するで金寄越せや」と言っても多少のEvil批判さえ甘受する程度のリスクで良いというのもあるかもしれません。
また、Googleのような機械翻訳サービスを利用すれば、翻訳に必要とされる諸々のリソースを節約しつつ海外とのやりとりができるということで、海外への事業拡大を願う事業者にとっては夢のようなサービスに思えるかもしれませんが、リソースを節約することイコールそれだけ翻訳品質は担保できなくなるという現実も知っておくべきでしょう。言葉によるコミュニケーションというのは奥が深いものでして、そこで手を抜くと思わぬ誤解が生じて要らぬトラブルが生まれることも十分にあり得ます。ビジネスに徹するコミュニケーションならなんとかなるのかもしれませんが、機械翻訳がこちらの意図せずして機微に触れるような言葉を選んでしまい、交渉相手の逆鱗に触れるというギャグみたいな事態が発生しないとも限らないのでその点は注意したいところです。
グーグル翻訳が大進化!高評価続々も、まだ途上(R25 16/11/20)
『google翻訳すごいね』と言ったら『全然だめ』というので驚き、よく聞いたら『感情の入った会話文とか使えない』と言われてニーズが全然違うことに気付いた。R25実際、私もちらりと仕事でGoogle翻訳を使ってみたのですが、いくらエンドエンドで学習するとはいえ、さすがにちょっといきなり実務で使えるぐらいのものかというとはなはだ心許ないので、だーっと文章をぶち込んでみて、原文を見ながらちょいちょい修正しながら仕上げるという方法にならざるを得ません。当たり前ですが。結局、テンプレに近い込み入った表現以外は自分で訳してしまうのが早いという結論になりまして、まあしょうがないのかなと思う次第であります。
それまでは山本一郎を名乗り続けたいと思います。そのうち二郎とか三郎になったら「何か進化したな」ぐらいに思っていただけるとこれ幸い。