自律エージェントの今 ニュースダイジェスト 2023-06-02
◎自律エージェントの現状
シリコンバレーで人気の自律エージェントBabyAGIを開発した中島洋平さんのTwitter投稿から。自律エージェントとは「テック系のニュース原稿を書くために、最新技術の動向をTwitterやYouTubeから探してきて」と命令すると、何をすべきかを自分で判断して、自分で定めたタスクを次々とこなし、自分で最高のAIモデルに進化しくことができるAIモデルのこと。
現時点では、どんなことでもできる自律エージェントは無理。まだまだタスクリストが少ないし、使えるツールも少ない。
なので今は、人間の開発者が必要になりそうなタスクやツールをあらかじめ用意するしかない。次に、特定の分野に特化した自律エージェントが登場してくるだろう。どんなことでもできる汎用型の自律エージェントが登場するのは、多分「1週間から1000週間の間」。突然すごい技術が出てくるかもしれないけど、そうでなけらばまだまだ先、ということ。
◎松尾先生の頭の中
日本のAI研究の第一人者と言われる松尾豊教授って、世界の状況にも詳しいので、松尾先生が今のAIの進化をどう見ているのかは興味があるところ。
ひろゆき氏、川上量生氏、松尾先生を対談動画を見た。松尾先生の発言にしか興味がないので、松尾先生の発言で気になるところを幾つかピックアップした
①Microsoftは巨大AIを進化させるより、特化型の小さなAIをいっぱい作っていく
「Microsoftは、これから先、学習済みの基盤モデルを「蒸留」して軽いモデルし、それをいろんなユースケースに向けて安く提供するというところに力を入れてくる。そういう風な技術をこれから作っていくのだと思う」
②プロンプトエンジニアリングはなくならない
人間のインターフェースが言語である限り、なくならない。AIのほうから人間の意図をある程度汲み取るようにはなるだろうけど、完全には汲み取れないので、言語でAIとコミュニケーションしなければならない状況は変わらない。
③LangChainとLlmaIndexの2つがあればほとんどなんでもできる
LangChainは、検索機能やデータベースなどの機能やデータをみんなで持ち寄っている格納している図書館のようなサイト。ChatGPTなどの言語AIで、その図書館の中から必要な機能やデータを借りてくることができる。
一方のLlmaIndexは、自分の持っているクローズドな書類やデータにインデックスをつけて検索しやすくし、検索したあとにその書類の内容を把握して、ChatGPTなどの言語モデルから寄せられた書類の内容に対する質問に対して回答する機能を持っているツール。一般公開のデータはLangChainで取得し、非公開の社内データはLlmaIndexで取得する。もちろん非公開の他社のデータにはアクセスできないけど、ChatGPTがこの2つのツールを使うこと社内外のほとんどのデータにアクセスできるようになる。
③AIは映像の生成が苦手
映像は非常に高次元のデータで、1つの動画は数千から数百万のピクセルから成りたっている。それぞれのピクセルは色情報を持っており、時間軸に沿って動く。これら全てのピクセルを適切に制御するためには、大量の計算能力と高度なモデリング技術が必要だから。
④AIの進化でどのようなリスキリングが必要か
ひろゆき氏の「AIが賢くなるんだったら学校教育いらなくなるのでは」という質問に対して松尾先生の回答がいまいち分かりづらい。「学校教育で教わるスキルが要らなくなるということと、それを社会が要らないと認定することはまた別だと思う」。電卓があるので暗算は不要だけど「暗算ができる人がすごいと思われる。社会ってそういうところで富の再分配が決まる」と松尾先生は言う。
恐らく松尾先生は「社会に役立っている人がお金を稼げるのではなく、いい大学を出たということだけでいい給料をもらえているのが現状。社会はそういうもの」と考えているんだと思う。確かに今の日本社会ではその通り。でもアメリカ社会って、もっと実力主義だし、日本も実力主義になっていくと思うので、学校教育のあり方は変わるべきだと僕は思うけどなあ。
◎Chat-GPTって今ごろ幻滅期に入ると思ってたんだけど、いまだにイノベーションが続いているのは、Chat-GPTのおかげでエンジニアの生産性が10倍になったからなんだろうな。
言語AIのおかげでもっとプログラミングが簡単になり、非エンジニアでもどんどん開発できるようになったら、イノベーションが加速度を増すんだろうな。
まじでシンギュラリティまで一気に進むかもしれないって思うようになってきた。