ChatGPTへの逆襲が始まった ニュースダイジェスト 05-10-2023
◎オープンソースの逆襲
世界を席巻し続けている言語AIモデルChatGPT。Googleなどの競合を寄せ付けない勢いで利用者を増やしているが、ここにきてそれを阻止しようという動きが顕在化してきた。
1つがオープンソースの動きだ。Meta(Facebook)のAIモデルがオープンソース化され、世界中の開発者が寄ってたかって改良し始めたのだ。このままでは性能や機能面でChatGPTなど企業の持つAIモデルを大きく超えそうな雲行きになってきた。
もはやどの企業でもOpenAIのモデルを使わなくても、オープンソースの基盤モデルを低コストで改良することで、独自のAIモデルを開発できる時代にはいった、という意見が増えてきた。
参考記事 基盤モデル + チューニングはどんな企業でも可能に
2つ目が、Amazonなどのテック大手の動きだ。AmazonはOpenAI以外の有力AIベンチャーをすべてAWSに搭載してきたし、Googleも次々と打ち手を発表してきている。
OpenAIの天下は、意外と三日天下で終わるかも?
◎食べログがChatGPTのプラグイン
プラグインはスマホで言うところのアプリのようなもの。プラグインを利用するのにはwaiting listに登録しないといけなくて、まだ一部の人しか利用しないもよう。恐らく使い方としては、ChatGPTに対して「汐留周辺で人気のラーメン屋を教えて」と話かければ、食べログのサイトから情報を検索してきて、自然な言葉で教えてくれる。これからいろいろなプラグインが登場してくると思う。
https://prtimes.jp/main/html/rd/p/000000903.000001455.html
◎Meta(Facebook)からマルチモーダルAI
今は言語AIがブームだけど、Metaのルカン先生はマルチモーダルの研究にご熱心。マルチモーダルって、マルチモード、つまりいろんな種類のデータを一緒に学習させるって話。
どんな種類かと言うと、テキスト、イメージ、音声、深度、温度、IMU(加速度系やジャイロスコープを使って、傾きなどを計測)といったデータ。
今の生成系AIって、テキストを入力するとイメージを自動生成したりするけど、イメージとともに音も生成できるようになるわけ。ロボットなどの制御も、自然言語でできるようになるんだろうな。
Google検索って、テキストしか検索できない。イメージ検索もあるけど、それは別モデル。このMetaのモデル(ImageBindという名前)だと、テキスト、イメージ、音声、どれででも検索できる。それに音声や字幕のついた映像データを入力して検索すれば、1つのモードで検索するよりも、より求めている情報にたどりつけるはず。
でも実社会で、この技術を使えばどんなことができるようになるのか。今はまったく想像もできない。
https://imagebind.metademolab.com/
◎複数の言語モデルを使い分けて、利用コストを下げる技術登場
GPT-4は利用料が高いという話を耳にする。なので1つの言語モデルだけを使わないで、このタスクは簡単なんで料金の安いこのモデルで、このタスクは高度な処理能力が必要なのでこのモデルで、という使い分けを自動でやってくれる技術が登場した。
◎ChatGPTにGPT-4 with browsing機能
ChatGPTの一部ユーザーにGPT-4 with browsing機能が搭載され始めたらしい。ブラウザ機能がつけば、どんなことができるのか。
すごい結果を出したプロンプトの例が紹介されている。
(1)今週のAI関連のニュース、トップ10をリストアップして。それをURLとともに表にして。
(2)このニュースレターを要約して、関連情報のリンクを10個リストアップして
(3)ハワイのマウイ島の、観光客に知られていないようなすばらしいスポットを教えて
(4)バンクーバーで、いいレビューをゲットしているカフェを3つ教えて
(5)今週もっともパフォーマンスが優れてた株、トップ10を教えて
Google is in trouble.
— Rowan Cheung (@rowancheung) May 7, 2023
I got early ‘Alpha’ access to GPT-4 with browsing and ran some tests.
Here are 8 crazy things I found: pic.twitter.com/ndxKGSqlL0
◎日本でもAI戦略会議
AIの急速な進化で、社会はどう変化するのか?生成AIを使ってウソの情報を作成されるリスクは?簡単に武器が作られるようにはならないか?教育はどうなる?・・・。世界中が大慌てで議論している。日本はどちらかと言えば、AIを使って経済を再生したいAI利用積極派だけど、やはり世界と足並みを揃えてAIのリスクもしっかりと考えないといけない時期に入ってるんだと思う。
https://www.asahi.com/articles/ASR596J0RR59ULFA013.html
◎個人向けAI
LinkedInのホフマンとDeepMindのムスタファが立ち上げたパーソナルAIのpi(パイと発音)がローンチ。過去の会話を記憶して、一人一人に最適化されたAIになっていくらしい。デザインがなかなかオシャレ。まだ日本語は使えないみたい。