Kaede

作成日: 2023-08-27

生成 AI の回答精度は今後低下するという予測

この記事には予測が含まれる

生成 AI (Generative AI) は主にインターネット上から収集したデータを元に学習し、ユーザーの入力に対して出力 (回答) を返す。今後、利用可能な学習元の数と精度が低下し、生成 AI の回答精度も低下する可能性がある。なお、この記事における生成 AI とは主に、テキスト系生成 AI (OpenAI の ChatGPT、Google の Bard など) と画像系生成 AI (Stability AI の Stable Diffusion など) を指す。

そもそも、生成 AI は入力に対してそれっぽい出力 (回答) を返しているだけであり、そこに正確性や精度を求めること自体が間違っている可能性もある。

生成 AI の出力から学習する生成 AI

2023 年 3 月、ChatGPT が出力した文章を元に Bard が誤った回答を生成したと見られる事案が発生した。生成 AI の出力で生成 AI を学習させた場合、回答精度は低下すると予測できる。

今後、生成 AI が出力したコンテンツが増加すれば、学習元に生成 AI の出力が多く含まれるようになり、生成 AI の回答精度は低下すると予測できる。

法律の整備

各地で法律が整備されるにつれ、利用可能な学習元が減り、生成 AI の回答精度は低下すると予測できる。

信頼できる学習元の低下

例えば、コストをかけて事実を調査し記事として掲載しているニュースサイトは、閲覧者から広告やサブスクリプションなどの形で記事作成にかかったコストを回収する必要がある。学習元として利用され、生成 AI が同じ内容を回答するようになれば閲覧者が減り、コストを回収できなくなる。ニュースサイトは様々な方法 (ペイウォール、robots.txt、法的手段など) で自分たちが学習元として利用されないよう対策し、信頼できる情報で学習できない生成 AI の回答精度は低下すると予測できる。

信頼できない学習元の増加

政府、企業など生成 AI に自分たちにとって都合のよい回答をさせたい団体や個人が存在すると考えられる。これら団体や個人が、学習元として利用させるためにインターネット上にコンテンツを掲載し、これを元に学習した場合、生成 AI の回答精度は低下すると予測できる。