「原稿」
Facebookの親会社であるMetaは、話し言葉をある言語から別の言語に直接翻訳するための技術ツールを開発しました。
メタは最近、人工知能(AI)を搭載したツールで英語と福建語の翻訳ができることを示すビデオを公開しました。
ビデオの中で、メタのチーフ、マーク・ザッカーバーグは、このプロジェクトには、これまでとは違う、変わった開発方法が必要だと説明した。それは、福建語が主に話し言葉であるためです。広く使われている書き言葉がないのです。
一般的に、翻訳システムの開発者は、ターゲット言語で書かれた膨大な量のテキストを使ってAIモデルを学習させます。これにより、システムは多くの異なる言語の例や組み合わせを学習し、最も正しい結果を得ることができるようになります。
一般に、AIを使った翻訳システムは近年大きく進化しています。オンラインやデバイスで翻訳支援を受けることができるようになり、国際的なコミュニケーションをより円滑にすることができるようになりました。
しかし、このようなシステムの問題点として、翻訳プロセスに連動した遅延が発生することが挙げられます。例えば、音声を録音する場合、まずテキストに変換され、それをAIが翻訳します。そして、翻訳された言葉を再び音声に変換し、聞き取ることができるようにします。
Metaプロジェクトで異例だったのは、開発チームがAIシステムに投入する大量の福建語のテキストを持っていなかったことです。
福建語は中国語の方言の1つです。中国南東部の福建省で何百万人もの人々に話されています。また、台湾の多くの人々や、マレーシア、シンガポール、フィリピンの一部の地域でも話されています。この言語は、一般的に何世代にもわたって家族で受け継がれています。
メタ社は、福建語は主に話し言葉で、広く使われている文字体系を持たない3,500近い現存言語の一つであると指摘する。同社は、AI開発者が世界のほとんどの言語をカバーする音声翻訳ツールの作成を目指しているという。
今年初め、メタ社は2つの新しいAIプロジェクトを発表しました。1つは「No Language Left Behind」と呼ばれるもの。ザッカーバーグはビデオの中で、この取り組みは「何百もの」世界の言語をカバーする翻訳システムを作るためのものだと述べた。
もうひとつは「Universal Speech Translator(ユニバーサル・スピーチ・トランスレーター)」と呼ばれるもの。このプロジェクトの目標は、「あらゆる言語の音声翻訳」を可能にするシステムを構築することだと、同社は声明で述べている。今回、メタが開発した福建語のシステムは、「Universal Speech Translator」プロジェクトの一環として開発された。
「どんな言語でも誰とでもコミュニケーションできる能力、それは人々が永遠に夢見てきた超能力であり、AIは私たちが生きている間にそれを実現しようとしています」と、ザッカーバーグは語った。
Metaは、福建語と英語の間を翻訳する新しいシステムを作るために、いくつかの異なる方法を使用したと述べています。このチームは、福建語に近い中国語である北京語の文章を例にして、AIモデルを訓練しました。
さらに、Metaの開発者は、話し言葉の福建語と類似の英語テキストを比較するために設計されたエンコーディングツールを使用しました。さらに、開発チームは北極圏の話者と密接に協力して、結果が正しいかどうかを確認しました。
メタ社によると、今後、福建語で使用したのと同じ手法で、さらに多くの言語の音声翻訳システムを作ることを目指すという。
しかし、同社は、福建語の翻訳モデルは "まだ未完成 "であると述べている。現在、一度に1つの全文を翻訳することしかできないとしている。
Words in This Story
translate – v. to change words from one language into another
artificial intelligence – n. the development of computer systems with the ability to perform work that normally requires human intelligence
text – n. written words
convert – adj. to change the appearance, form or purpose of something
encode – v. to represent complex information in a simple or short way
*This article has been edited and reprinted from VOA Learning English with permission from Voice of America (VOA) for use in English language materials.