削除記事の中に書かれていたOpenAI重要情報
一般公開記事「削除記事が示すChatGPTの行手に広がる暗雲」の中では言及しなかったが、削除された記事の中には重要な情報がいくつか記載してあったので、改めてコミュニティ会員限定記事の中で紹介したい。
▼AIの反応が速く、利用料金が値下げになる・・・はずだった
まずOpenAIの今後の開発計画で最重要ポイントが、最新モデルのGPT-4をより速く、より安く提供するということ。これまで他のモデルに比べるとGPT-4は反応が遅く、利用料金がかなり割高だった。なので用途によってはGPT-4ではなく、一つ前のモデルであるGPT-3.5の利用を社員に推奨する企業もあったようだ。
OpenAIは、年内に反応速度を改善し、利用料を値下げする計画だったが、半導体不足で、どの程度実現するのか分からない状況になってきたようだ。
▼六法全書の中身について質問できる・・・はずだった
また削除されたインタビュー記事の中には、コンテクストウィンドウを100万トークンにまで引き上げたいという発言もあった。コンタクトウィンドウとはAIに質問する前にAIに与えることのできる情報量のこと。トークンとは、テキストを最小単位に分割したもの。1つの英単語が約1トークンと考えていいだろう。
AIに文章を翻訳させたい場合、コンタクトウィンドウが小さければ数ページ程度の文章しか一度に翻訳できないが、コンタクトウィンドウが大きければ本一冊分を一度に翻訳できる。現在GPT-4は3万2000トークンしか読み込めない。今のところの業界最大のコンタクトウィンドウを持つAIモデルは、OpenAIを辞めた技術者たちが立ち上げたAnthropicというAIベンチャーが作ったClaudeというAIモデル。同社が10万トークンの情報を読めるようになったと発表したときには、業界に激震が走った。
10万トークンだと六法全書を全部読んで、その内容に関して質問に答えられるようになったり、企業の年次報告書を元に戦略的リスク分析ができるようになると言われている。また何百ページもの開発者向けドキュメントを読み、ユーザーからの質問に答えられるようになるという。
OpenAIが目指すのは、100万トークンなので、その10倍。かなりの長文を読み込んで記憶できるようになる。膨大な資料を全部読んで理解しなくても、ピンポイントで回答してくれるようなAIができれば、いろいろな用途に使えそうだ。
OpenAI年内にそれを達成する計画だったが、半導体不足で一旦頓挫しそうだ。
▼画像検索が可能になる・・・はずだった
GPT-4が発表されたときにマルチモーダルのデモが公開された。マルチモーダルとは複数のモード(データの種類)を処理できるということ。これまでは文章で質問してAIが文章で答えるいう1つのモードだったが、GPT-4からは文章で質問して、画像で回答するということが可能になった。デモでは「〇〇の画像を検索して」というと、その画像を表示していたが、自分のChatGPT有料版でGPT-4を選択して画像を検索しようとすると「私はAIであり、画像や動画を検索・表示する能力はありません」という答えが返ってくる。
これは半導体不足で、すべての有料ユーザーに対してマルチモーダルの機能がまだリリースされていないからだという。
▼API接続でプラグインが利用できるようにはならない
ChatGPT有料版はプラグインが搭載されているので、格段に便利になっている。プラグインとは、スマートフォンで言うところのアプリのようなもの。スマホのアプリストアの中に無数のアプリが登録されているので、スマホがとても便利になった。同様にChatGPT有料版にも、いろいろなプラグインが搭載されてきているので、使い勝手が大きく向上してきている。現時点で400個以上のプラグインが登録されている。個人的には、ニュース検索のプラグインや、PDFの論文を要約して質問に答えてくれるプラグインを重宝している。
削除されたインタビュー記事の中で、OpenAIのCEOのSam Altman氏は、プラグインをAPI接続のクライアントに提供する考えのないことを明らかにした。
OpenAIの言語モデルを利用するには、ChatGPTにサインインして利用する方法と、OpenAIの開発者向けページにアクセスして各種モデルにAPI接続する方法の2つがある。例えると、ChatGPTは一般消費者に商品を販売する小売店のようなもので、API接続は小売店に商品を卸す問屋のようなものだ。
その問屋的なサービスにおいて「プラグインの仕組みを提供する考えはない」とAltman氏は明言したわけだ。
プラグインはOpenAIのAIモデルの利用価値を格段に向上させるものなのに、なぜAltman氏はAPI接続上でプラグインの仕組みを提供しないのか。
削除された記事の中で同氏は「各プラグインの精度に責任を持てないから」というような内容の発言をしていた。
ChatGPTはOpenAIにとって実験的なサービスで、同社にとっての本業はクライアント企業にAPI接続を通じてAI機能を提供すること。本業で、実験的な仕組みを提供するのは無責任という考え方だ。例えて言えば、工場の敷地内にある直売店で新製品の試作品を発売して消費者の反応を見ているだけ。未完成な商品を問屋として小売店に卸すわけにはいかない、というような理由だ。
またAltman氏は、「チャットボットに専門的なプラグインを搭載するのではなく、専門的なサービスにチャットボット機能を搭載するというのが、これから主流になりそうだから」とも語っていた。
確かに多くの一般企業は、なんでもできるチャットボットを作りたいのではなく、自社サービスや自社サイト上にチャットボット機能を搭載したいだけなのかもしれない。
ただテック大手は、検索エンジンの代わりになるような、なんでもできるチャットボットを提供しようとしている。MicrosoftとGoogleはそれぞれのチャットボット上でプラグインを提供すると発表している。
OpenAIは、一般企業に対しては問屋の役割を維持しながらも、MicrosoftやGoogleといったテック大手に対しては、なんでもできるチャットボットという小売の領域で戦っていくつもりなんだろうと思う。