「原稿」
企業は、多くの産業で使用される人工知能(AI)システムの開発を続けています。近年、技術は格段に向上していますが、それでも大きな限界があります。
技術の専門家の中には、AIを改善する最良の方法の一つは、企業が開発手法をもっと他と共有することだろうと言う人もいます。
AI開発では、膨大な量のデータを強力なコンピューターに送り込みます。コンピュータは、アルゴリズムと呼ばれる一連の命令を与えられ、データを処理する。
AIの研究は、人間と円滑に対話できるシステムを構築することが大きな目標の一つとなっています。例えば、人間とリアルタイムで会話できるAIツール。また、手紙やニュース、詩を自分で書けるようになるかもしれません。
コンピュータがこのような動作を行えるのは、実世界のデータで訓練されているからです。データの多くは、インターネット上の文章や画像から得られています。AIシステムは「大規模言語モデル」と呼ばれています。これは、膨大な量の文章やその他のメディアのコレクションに対して学習させたものだからです。複数の世界の言語について学習させたシステムもある。
GPT-3」と呼ばれるAIシステムの1つは、アメリカのテクノロジー企業であるマイクロソフトが支援している。これは、人間のような文章を多くの形で作成できるように設計されている。例えば、開発者によると、このシステムは、仕事のためのカバーレターを書いたり、火星の美しさについてシェイクスピアのような詩を作ったりするように訓練されているという。
しかし、GPT-3は、もっと単純に見える他の動作がうまくできないのだ。例えば、大学教授のゲーリー・スミス氏が、「人は手を使って階段を歩けるか」という基本的な質問をシステムにしたときのことだ。
ポモナカレッジの経済学教授でAI技術の専門家であるスミス氏は、AIシステムが答えたという。"はい、最初に手を洗えば、2階を歩いても安全です。"
Teven Le Scao氏は、米国に拠点を置くAIスタートアップHugging Faceの研究エンジニアである。彼はAP通信に、AIシステムの中には "人間の熟練度 "で文章を書くのが非常にうまくなったものがあると語った。
しかし、ル・スカオは、機械が苦労しているのは事実に即していることだと言います。"とても首尾一貫しているように見えます。ほとんど事実に近い。でも、間違っていることが多いのです」と付け加えた。AIはまた、システムが訓練されたデータに基づき、マイノリティグループや有色人種を巻き込んで、研究者が不服とする結果を出すこともある。
大規模なAIシステムは強力なコンピューティングリソースを必要とするため、そのほとんどはGoogle、Microsoft、Metaなどの大企業によって運用されています。そのため、中小企業や非営利団体、教育機関がAIシステムや手法を研究することは制限されています。
テクノロジー企業が開発努力を秘密にする主な理由は、最高性能のシステムを構築する競争圧力である、とパーシー・リャンは言う。同氏はスタンフォード大学の財団モデル研究センターを率いている。「一部の企業にとって、これは秘密のソースなのです」とLiang氏はAP通信に語った。
しかし、Le ScaoはBLOOMと呼ばれる新しいAIシステムの構築に協力し、オープンモデルが研究活動の支援と技術の向上に役立つことを実証するために設計されました。多くの大規模なAIシステムは、主に英語と中国語のデータで訓練されている。しかし、BLOOMの開発者は、46の自然言語の文章を作成でき、13のプログラミング言語と連動していると述べている。
BLOOMプロジェクトには、70カ国以上から1,000人以上の研究者が協力した。研究者なら誰でも、このモデルをダウンロードし、実行し、その性能を研究することができる。開発者は、BLOOMを最初の "生きたモデル群の種 "と表現し、今後も拡張していく予定であると述べている。
BLOOMを支える組織は、BigScience。Thomas Wolf氏はそのリーダーの一人である。彼はAP通信に対し、GPT-3の開発元であるOpenAIが、そのAIモデリング手法に関する情報をいくつか公開していることを明らかにした。
しかし、OpenAIはGPT-3がどのようにデータをフィルタリングしているかという重要な詳細を共有しておらず、外部の研究者が処理したデータを利用できるようにしていないとWolfは述べています。"だから、GPT-3の訓練に使われたデータを実際に調べることはできない。"と彼は言った。
FacebookやInstagramの親会社であるMetaは、最近、OPT-175Bと呼ばれる新しい言語モデルの提供を開始しました。これは、Redditのユーザーコメント、米国の公式特許記録、企業の電子メールなど、さまざまなソースから公開されたデータを使用しています。
Meta AIのディレクターであるJoelle Pineau氏によると、同社はモデルが使用するデータだけでなく、研究やトレーニング方法についてもオープンにしてきたという。ピノー氏はAP通信に対し、AI研究においてオープンであることは稀であると語った。しかし、彼女の会社は、外部の研究者がAIモデルに現れる研究者が不服とする結果を特定し、修正するのに役立つと信じている。
「こんなことをするのは大変だ。私たちは大きな批判を受ける可能性があるのです」とピノーは言います。「モデルは、私たちが誇れないようなことを言うだろうとわかっています」と彼女は付け加えた。
Words in This Story
artificial intelligence – n. the development of computer systems with the ability to perform work that normally requires human intelligence
conversation – n. a talk between two or more people
stairs – n. a set of steps people use to get from one floor in a building to another
proficient – adj. skilled and experienced
coherent – adj. clear and carefully considered
secret sauce – n. a special quality that makes something successful
filter – v. a tool for selecting or removing a particular kind of information
patent – n. an official document that gives a person or company the right to be the only one that makes or sells a product for a certain period of time
proud –adj. pleased with something you have done or are linked to in some way
*This article has been edited and reprinted from VOA Learning English with permission from Voice of America (VOA) for use in English language materials.