言語AI時代に企業が取り組むべき2つの課題

公開日

2023.03.09

更新日

2026.06.17

ChatGPTが話題になったおかげで、自然な言語で質問したり、自然な言語でコンピューターを操作することの便利さに、多くの人が気づいてしまった。これからの製品、サービスのUI（ユーザーインターフェース、人間と機械の情報のやり取りの形）は、自然言語になることだろう。まずはほとんどすべてのWebサイトに、高性能のチャットボットが標準装備されるようになるのだと思う。

残念ながら今のチャットボットのほとんどは、使い勝手が全然よくない。知りたいことにすぐに答えてくれることはまれ。人間のサポート係なら一瞬で教えてくれそうな答えに辿り着くまでに、チャットボット相手なら何往復もやり取りを繰り返さなければならない。何往復もやり取りを繰り返した挙句、何の答えも得られないことだってよくある話だ。

ChatGPTは、その答えにはウソが混じるという決定的な欠陥があるものの、質問者の意図をすぐに汲み取って回答してくれることは、非常にすばらしいと思う。

GPTのような大規模言語モデルを基盤にすることで、これからのチャットボットは大きく進化し、すべてのウェブサイトに搭載されることになるのだと思う。

ただそのためにクリアしなければならない課題が2つある。1つは、チャットボットが学習するデータセットを企業側が整備しないといけないということだ。ChatGPTの回答にウソが混じるのは、GPTがTwitterなどのSNSを含むネット上の一般的な情報を学習しているから。

チャットボットに正確な回答をさせるためには、正確なデータセットで学習させなければならない。チャットボットのために正確なデータセットを整備することが企業にとっての重要な仕事の1つになるだろう。

もう一つは、チャットボットを質問の「揺らぎ」に対応させること。「揺らぎ」とは、同じ質問をするにしても、人によって表現が異なる。こうした表現の振れ幅のことを揺らぎという。

Google検索が他の検索エンジンと比較して圧倒的に人気が高いのは、「揺らぎ」に強いからだ。質問者が検索キーワードに間違ったスペルや漢字を入力しても、「もしかして」と正しい表現を推測してくれる。Googleホームは以前、標準語のアクセントで話しかけないと質問の意味を理解してくれなかったが、最近は大阪弁で話しかけても正確に回答してくれる。発音やアクセントの「揺らぎ」に対応できるようになったわけだ。

ChatGPTやStableDefusionnといった生成系AIの周辺で最近使われ始めた言葉に「プロンプトエンジニアリング」というものがある。ユーザーが望むような回答や絵を生成系AIが出力できるように、ユーザー側でプロンプト（質問文、命令文）を工夫すること、というような意味だ。うまくプロンプトできないと思い通りの結果が出ないので、プロンプトの仕方を学ぶプロンプトエンジニアリングのオンラインコースなるものも登場している。

しかしユーザー側でプロンプトを工夫しないといけないようでは、チャットボットは一般消費者に広く受け入れられることはないだろう。一般消費者の表現の揺らぎに強くならなければいけないのだ。

そのためには、実際に表現の揺らぎをチャットボット自身が学習していくしかない。

今後、教育や法務、ヘルスケアなど、いろいろな領域に特化したチャットボットが無数に登場してくることだろう。1つの領域に複数のチャットボットが出てくるだろうが、その中で頭角を表してくるのは揺らぎに強いチャットボットになる。揺らぎに強ければ使い勝手がよいので、ユーザーが増える。ユーザーが増えれば増えるほど、いろいろな揺らぎを学習できる。いろいろな揺らぎを学習できれば、ますます使い勝手がよくなる。使い勝手がよくなればさらにユーザーが増える。この正のスパイラルにいち早く入ったチャットボットが、その業界のナンバーワンのチャットボットになって、最終的には一人勝ちの状態になる。

インターネットの入り口とも言える検索エンジンで一人勝ちの状態になったことで、Googleは大きく成長した。今後、それぞれの業界で一人勝ちするチャットボットが出てくることになる。そのチャットボットを作った企業が成長への鍵を手にすることは、想像に難くない。

先手必勝の戦いが、いろいろな領域で始まろうとしているわけだ。