DXコラム > ノウハウ記事 > AI > 【2024年10月版】GoogleのLLM「Gemini」とは?最新モデルの性能にも注目

【2024年10月版】GoogleのLLM「Gemini」とは?最新モデルの性能にも注目

OpenAIのGPTシリーズと比較されることも多いGoogleのGemini。2023年12月のバージョン1.0に続き、2024年2月にはバージョン1.5が公開されました。この記事では大手メディアや専門メディアの記事から、Geminiの最新動向を紹介します。

この記事を読むことで、Geminiの概要や主要機能について理解することができます。また、Googleの利用者にとっては、他のGoogleアプリやサービスとの便利な連携機能を知り、より効率的に日常生活や日々の業務をおくることができるようになります。ぜひ、ご確認ください。

Geminiとは

Geminiは、Google DeepMindが開発した大規模言語モデルです。発表されたのは2023年12月で、2024年2月にはGoogleのAIチャットサービス「Bard」を統合しています。Geminiは、テキストだけでなく画像や音声も理解できるマルチモーダルなAIで、高度な推論能力を持ち合わせているのが特徴です。

2024年5月現在、Geminiには4つのモデルが存在します。

  • Gemini 1.0 Ultra
    2023年12月6日にリリースされた旗艦モデル。
  • Gemini 1.5 Pro
    2024年2月15日にリリース、5月14日にアップデートされた中型モデル。100万トークン(※)のコンテキストウィンドウを持つ。性能は1.0 Ultraと互角。
  • Gemini 1.5 Flash
    2024年5月14日にリリースされた高速モデル。100万トークンのコンテキストウィンドウを持つ。
  • Gemini 1.0 Nano
    2023年12月6日にリリースされた軽量モデル。Google Pixelをはじめとするモバイルデバイス上で実行可能。

※ アップデートにより200万トークンへ拡大予定

これらのうち最新モデルのGemini 1.5 Proは、有料サービスのGemini Advancedで利用可能です。この記事ではGemini 1.5に関する最新のニュースを中心に紹介していきます。

ChatGPT活用の企業向け生成AIサービス【無料トライアル受付中】
exaBase 生成AI の資料をダウンロード

グーグル 検索サービスに生成AI 文章入力で調べられる機能発表

Googleは2024年5月14日に開発者向けの会議を開催しました。NHKによると、基調講演で登壇したスンダー・ピチャイCEOがGemini最新モデルを発表するとともに、生成AIを同社の検索サービスに本格導入するということを進めているようです。これまでGoogleの検索エンジンは、ユーザーが知りたいことを伝えるスニペットや検索結果のページが表示されていました。

しかし、生成AIの実装によって、調べたいことの答えやページが単に表示されるだけでなく、よりわかりやすくその現状や対策、注意点などまで要約した回答が表示されるようになっています。これまで以上に検索した際のニーズを満たす回答が得られるようになることが予想されます。

そのほかにも、生成AIを導入した検索サービス「AIオーバービュー」や、テキストから解像度の高い動画を生成する「Veo」などの実装も公開されました。例えば「壊れた家電」の写真・動画を入力することで、修理する動画を結果に表示するなどが可能になると期待が高まっています。

参考:グーグル 検索サービスに生成AI 文章入力で調べられる機能発表

「Gemini 1.5 Pro」の新機能と高速版「Gemini 1.5 Flash」を発表

5月14日の会議のなかで特に注目を集めたのは、Gemini 1.5 Proの機能強化と、Gemini 1.5 Flashの発表です。
ケータイWatchによると、Proは翻訳やコーディングなどの品質向上と、100万トークンから200万トークンへのコンテキストウィンドウ拡大が大きな注目を集めているとのことです。

一連の品質が向上したことでこれまで以上の高速処理や、パフォーマンスにつながる活用に期待が集まっています。
ただし、アップデートされたProと新たに追加されたFlashを利用するには有料となります。すでに200以上の国と地域でプレビュー版が公開されており、6月に一般提供される予定です。

参考:グーグル、独自生成AI「Gemini 1.5 Pro」新機能と高速版「Gemini 1.5 Flash」を発表 – ケータイ Watch

チャットや音声でのやりとりが可能になる「Gemini Live」

「Gemini Live」は友人とチャットでやりとりするのと同じように、「Gemini」とチャットや音声で質問を投げかけられる機能です。ケータイWatchによると、最新の音声モデルを活用しているため、人間に近いような自然な音声で応答することが確認されています。

Open AIが2024年5月に発表したGPT-4oも音声処理が飛躍的に向上していることが注目されていますが、Geminiも引けを取らないほどの処理や品質を誇るといわれています。各社で音声の出入力機能の実装が進むだけでなく、品質が向上することが予想されるため、ますます目が離せないと言えるでしょう。

「Gemini Live」は、2024年の夏頃から「Gemini Advanced」契約者向けに提供が開始される予定です。

参考:Googleの生成AI「Gemini」最新アップデート、会話形式でやりとり可能になる「Live」など – ケータイ Watch

「Gemini Advanced」に3つの新機能が追加

開発者向けの会議内で、数ヶ月以内にGoogle Advancedへ追加される機能として、大きく分けて以下の3つがあることがZDNET Japanの取材によりわかっています。

  1. Googleドライブ経由(もしくは直接)のファイルアップロード
  2. Gemini 1.5 Proの200万トークンへの拡大
  3. よりカスタマイズ可能な旅行プラン作成機能

これらは高性能なGemini 1.5 Proが搭載されたことで、画像認識能力が向上し、より高度なデータ解析が実現できるようになっているようです。これによって、ユーザーが撮影した写真を読み込んで料理のレシピを作成したり、なかには方程式などの問題を解くこともできるとわかっています。

それだけでなく、今後はよりカスタマイズ可能な旅行プラン作成機能が追加され、「Gmail」や「カレンダー」など、他のGoogleアプリと統合することも可能になると発表されています。日常的に使うメールやカレンダーと結びつくことで、より最適な旅程表などの提案が可能となり、本格的なAIアシスタントとしての実装に期待が高まるでしょう。

参考:「Gemini Advanced」に3つの新機能が追加–LLMも「Gemini 1.5 Pro」へ – ZDNET Japan

GmailなどのGoogle WorkspaceでもGeminiの利用が可能に

Gmailやドキュメント、MeetsなどのGoogle Workspace内のツールで、Geminiを活用する「Gemini for Google Workspace」に新機能が追加されました。
Impress Watchによると、GmailやGoogleドキュメントなどのサイドパネルに表示されるGeminiがGemini 1.5 Proになり、100万トークンのコンテキストウィンドウや高度な推論機能を活用できるようになったことがわかっています。

例えば、Gmaiで溜まったメールの中から、特定のメールを探したり、内容を要約したり、返信内容の提案をしたりすることができます。メールの要約は6月から実装予定で、その他機能も7月以降に順次実装予定です。ただし、対応言語の拡大は今後予定しているとのことで、日本におけるビジネスシーンでの日常的な活用は少し先になることが予想されています。

参考:Gemini for Google Workspace、Gemini 1.5 Proなど3つの新機能 – Impress Watch

「Googleフォト」でも「Gemini」によって高度なAI検索が可能に

GeminiはGoogleフォトとも連携することができるようになります。CNET Japanによると、新しい機能では「自然な言葉で写真を検索できる」ほか、AIによって各写真についての短い説明を得られるということがわかっています。

Googleフォトではこれまでも特定の写真を検索する機能はありましたが、これまで以上に複雑なクエリを処理することができるとわかっています。単に「ペットの写真を探して」という質問だけでなく、「ペットの〇〇が大きくなったときの写真を見せて」といった複雑な問いかけにも対応できるようになっています。昨今のAIアシスタントや音声の出入力機能の向上を考えると、今後は言葉で話しかけることでより高度な索引などが可能になると期待できるでしょう。

参考:「Googleフォト」、「Gemini」による高度なAI検索が可能に – CNET Japan

GeminiなどのAIによるハルシネーション問題は課題であるも改善の兆しがある

Gemini 1.5が発表された際、Googleの共同創業者であるセルゲイ・ブリン氏の発言にも大きな注目が集まっています。
CNET Japanによると、ブリン氏はGeminiについて「本当にすごい。驚きすら覚える」と話していることがわかっています。ブリン氏はGeminiをコーディングに使うことが多いといい、汎用性の高さを特に評価しています。

しかし、事実とは異なる情報を生成してしまうハルシネーションについては大きな問題と考えているとのこと。「実際に新しくバージョンアップされたその他の生成AIでも、ハルシネーション問題についてはまだ改善の余地があるものが多い。しかし、アップデートを重ねるごとに改善傾向は見られており、中には今後の技術進歩で飛躍的に精度が向上する可能性も少なくない」と話しています。

実際に、生成AIが大々的に話題に上がってから目に余る進化を遂げているため、大きな改善によってさらに精度が向上する可能性も十分に考えられるでしょう。

参考:グーグル共同創業者に聞く–往年の「Google Glass」、最新の「Gemini」 – CNET Japan

まとめ

GPTシリーズに並ぶ知名度と人気を誇るGemini。Google製品らしく、他のGoogleアプリやサービスとの親和性の高さが大きな強みになっています。5月に発表されたバージョンアップではコンテキストウィンドウの数が200万に増え、今後ますます性能に磨きがかかることでしょう。特にGoogleユーザーにとっては見逃せない生成AIと言えそうです。


株式会社エクサウィザーズでは、日進月歩で進化する生成AIの可能性と活用について、業界でいち早く取り組みながら、AIを活用した経営課題の解決を支援しています。生成AIの活用や社内人材の育成、AIを活用したDX推進などにご興味のある方はぜひエクサウィザーズにご相談ください。

ChatGPT活用の企業向け生成AIサービス【無料トライアル受付中】
exaBase 生成AI の資料をダウンロード