DXコラム > ノウハウ記事 > AI > GPT-4とは?話題の生成系AI最新版の特徴・使い方・ビジネス活用事例を一挙に解説

GPT-4とは?話題の生成系AI最新版の特徴・使い方・ビジネス活用事例を一挙に解説

2023年3月14日に米国のAI開発組織であるOpenAIが公開したGPT-4、その性能は前世代のGPT-3.5を遥かに凌駕しています。

この記事では、「ChatGPTについてはなんとなく知っているけど、GPT-4って何?何がすごいの?」「GPT-4を使ってみたい」という方向けに、GPT-4とは何か、GPT-4の何がすごくてGPT-3.5とどのように異なるのか、依然として改善が求められる部分についても触れ、GPT-4の利用方法についても紹介します。

最後に、GPT-4が実際にビジネス活用されている事例や、Googleが開発したPaLMという大規模言語モデルについても紹介します。ぜひご一読ください。

※本記事に記載の内容は2023年3月18日時点の内容であり閲覧時には情報が古い可能性があります。何卒ご容赦ください。

ChatGPT活用の企業向け生成AIサービス【無料トライアル受付中】
exaBase 生成AI の資料をダウンロード

GPT-4とは?

GPT-4(Generative Pre-trained Transformer 4)は、OpenAIが開発した次世代の大規模言語モデルのことを指します。

GPT-4は、Googleが2017年に発表した大規模言語モデルであるTransformerをベースに開発されています。Transformerは元々機械翻訳を目的に作られ、連続するデータの関係性を追跡することでその関係性を理解可能になりました。その後様々な用途に用いられることになり、その一つがOpenAIが開発したGPT(Generative Pre-trained Transformer)で、その進化版であるGPT-4が2023年3月14日に公開されました。

 

Transformerについて詳しく知りたい方はセミナーアーカイブをご覧ください。

GPT-4は、精度の向上に加え、画像データも入力できるマルチモーダルAI(複数のデータ形式を活用できるAIのこと)として用途のさらなる拡大が期待されています。

ChatGPTとは

ChatGPTは、OpenAIが開発した会話型AIサービスで、GPTシリーズの大規模言語モデルをベースにしています。人間と同様に自然な会話を生成・理解することができるということでその精度の高さから2022年後半に話題になりました。ChatGPTは、質問応答、対話生成、アイデアのブレインストーミング、プログラミングのコード生成、オリジナルストーリーの作成など、多様なタスクに対応できます。

ChatGPTはこちらからアクセスし、Googleアカウントなどでサインアップすると使えるようになります。

現在は無料版ではGPT-3.5のみ利用ができ、回数制限や、サーバーの混雑時にはアクセスができなくなるといった制限があります。

GPT-4を使うには?

2023年3月16日現在は、ChatGPT Plus(月額20ドル)で利用可能です。GPT-3.5かGPT-4を選べる仕様になっており、ChatGPT Plusに課金してGPT-4を使う人も増えています。しかし、現在はマルチモーダルではなく(画像入力はできない)あくまでチャット型サービスのみの提供です。

いくつかの企業はOpenAIと早くから連携してマルチモーダルなAIサービスを作り、既に検証を始めているところもあります。本記事の後半でいくつかご紹介しています。

また、APIの活用にはwaitlistに登録して待つ必要があります。実際にGPT-4をAPI連携して使いたいという方はお早めにwaitlistに登録しましょう。

GPT-3.5とGPT-4の違いを解説。GPT-4の何がすごい?

3月14日に公開され、すぐに大きく話題になったGPT-4。具体的になにがすごいのでしょうか?ポイントを絞ってご説明します。

画像も入力できるマルチモーダル

GPT-3.5との一番大きな違いは、画像も入力できるということでしょう。まだ一般ユーザー向けには公開されていない画像入力ですが、GPT-4ではテキストと画像をプロンプト(動作を促すコマンド)として受け入れて、テキスト(自然言語やコード、表など)で出力してくれます。風景や人や乗り物などの写真はもちろん、文章や図・グラフが混ざった論文なども一緒に読み取って理解した上でタスクを実行してくれます。

実際に公式発表された画像入力に関する事例をいくつか見てみましょう。

例①画像のおかしな部分を解釈

例①画像のおかしな部分を解釈

出典:『GPT-4』OpenAI

これは、数年前によく使われていたVGAコネクタ(映像データを入出力するケーブル)の見た目をしたLightningケーブルのカバーの写真と、「この画像のどこがおかしいですか?パネルごとに説明してください。」というテキストのプロンプト、それに対するGPT-4の回答です。

画像の1枚目(左)はケーブルにカバーを装着してiPhoneに刺さっていて、2枚目(右上)はパッケージに入っている画像、3枚はケーブルにカバーを装着してケーブルの先端を映している画像です。

このプロントに対し、GPT-4は以下の文章を出力しました。

画像は、「Lightning Cable」アダプターのパッケージで、3つのパネルがあります。

 

パネル1:VGAコネクター(一般的にコンピュータのモニターに使用される青くて大きな15ピンコネクター)を充電ポートに接続したスマートフォンです。

 

パネル2:VGAコネクタの絵が描かれた “Lightning Cable “アダプターのパッケージ。

 

パネル3:VGAコネクタのクローズアップで、先端に小さなLightningコネクタ(iPhoneなどのApple製品の充電に使用)が付いている。

 

この画像のユーモアは、大きくて時代遅れのVGAコネクタを、小さくて最新のスマートフォン充電ポートに差し込むというばからしさからきています。

各写真に何が映っているかをしっかりと理解した上で、この画像のユーモアについても的確に回答しており、AIがユーモアを理解したかのように感じます。

例②チャートの推論

例②チャートの推論

出典:『GPT-4』OpenAI

これは、1997年の1人当たりの肉の消費量をフィンランド、ジョージア、西アジアのそれぞれで棒グラフに表した図と、「ジョージアと西アジアの1日の平均肉消費量の合計は?答えを出す前に、段階的な理由付けをしてください」というプロンプトと、それに対するGPT-4の回答です。

GPT-4は以下の文章を出力しました。

ジョージアと西アジアの1日の平均肉消費量の合計を求めるには、以下のステップに従います。

 

  1. ジョージアの1日当たりの平均肉消費量を確認する。
  2. 西アジアの1日あたりの平均肉消費量を確認する。
  3. ステップ1と2の値を合計する。

 

ステップ1: グラフから、ジョージアの1日あたりの平均肉消費量は、1人あたり79.84gであることがわかります。

 

ステップ2:このグラフから、西アジアの1日あたりの平均肉消費量は、1人あたり69.62グラムであることがわかります。

 

ステップ3:ステップ1と2の値を足す。

 

79.84g(ジョージア)+69.62g(西アジア)=149.46g

 

つまり、ジョージアと西アジアの1日平均肉消費量の合計は、1人1日149.46gということになります。

GPT-4は図を読み取った上で計算までしています。これができるということは、例えば多くの論文を読み取ったうえでそれを基に更に論文を執筆するといったことも、いつかできるかもしれません。

例③ミーム(面白い画像)を理解し説明

例③ミーム(面白い画像)を理解し説明

出典:『GPT-4』OpenAI

これは地球の大陸を表しているように見えるチキンナゲットの写真と、「時々、宇宙から見た地球の写真を見て、その美しさに感嘆することがあります。」という文章と、「このミームを説明できますか?」というプロンプト、それに対するGPT-4の回答です。

GPT-4は以下の文章を出力しました。

このミームは、宇宙から見た地球の写真とチキンナゲットという、関係のない2つのものを組み合わせたジョークです。

 

ミームのテキストでは、画像は宇宙から見た地球の美しい写真であるかのように書かれています。しかし、実際にはチキンナゲットを世界地図に似せて並べたものです。

 

このミームのユーモアは、テキストと画像の予想外の並置から生まれます。文章では壮大な地球の写真を期待させますが、実際には平凡で愚かな写真です。

いかがでしょうか。チキンナゲットを世界地図に見立てたボケを丁寧に説明してくれていますね。いわゆる「お笑い」をAIが丁寧に言語化してくれています。そのうちいつかお笑いの審査をAIがする時代も来るかもしれません。

例④OCR(光学文字認識技術)によりPDFや論文の画像を要約できる。

例④OCR(光学文字認識技術)によりPDFや論文の画像を要約できる。

出典:『GPT-4』OpenAI

これは紙の論文のスキャンデータと、「以下は、InstuctGPT 論文の一部です。それを読んで要約してもらえますか?」というプロンプトと、GPT-4の回答です。

GPT-4の回答は長いため詳細は割愛しますが、要約した上で、ユーザーが更に「図2で説明されているプロセスについて説明してください」とプロンプトを入力すると、ステップごとに説明してくれるなどわかりやすく説明してくれます。

以上、画像を入力する例として4つ紹介しました。画像入力は現在研究段階で一般公開されるのはもう少し先のため楽しみに待っておきましょう。

日本語に高精度で対応

従来のGPT-3.5は非常に役立つ一方で回答が不自然だったり、間違っていたり、内容が薄かったりと、違和感のある出力が多いという課題がありました。特に英語が最も精度が高く、日本語の精度は低いという面もありました。

そこで今回のGPT-4の性能をテストしたところ、テスト対象の26言語中24言語において、GPT-3.5の英語よりも精度が高いという結果になりました。

この図はそのテストのスコアを表したもので、GPT-3.5の英語のスコアが青の70.1%だったのに対し、GPT-4の日本語は79.9%となっているのがわかります。日本語に高精度で対応

出典:『GPT-4』OpenAI

様々な試験の得点率が向上

内容の難しくないカジュアルな会話においては、GPT-3.5 と GPT-4 の違いはそこまで大きくありません。しかし内容の複雑さが十分なしきい値に達すると明らかに違ってきます。

OpenAIは2つの違いをわかりやすくするために人間向けに設計された様々な試験をGPT-3.5(青)とGPT-4のテキストのみ(黄緑)、GPT-4の画像入力も含む(濃い緑)でテストした結果を公開しています。回答に用いた言語は英語です。

様々な試験の得点率が向上

出典:『GPT-4』OpenAI

この図はGPT-3.5の成績が低いものから高いものへと順番に並んでおり、ほとんどの試験でGPT-4が好成績であることがわかります。

例えば左から6番目の統一司法試験(Uniform Bar Exam)において、GPT-3.5では受験者の下位10%のスコアしか取れなかった一方、GPT-4では上位10%のスコアで合格できる水準に達しています。

開発者・ユーザーが口調やスタイルを指定可能に

従来のGPT3.5を使ったChatGPTでは口調やスタイルが同じで、機械と話している感を感じてしまうものでした。(「関西人のように話して」とチャットで言うと修正してくれますがすぐに戻るなどその精度は低く、完全に人格を持たせるには開発者による実装が必要でした)しかし、今回のGPT-4ではそうした口調や人格などの設定もChatGPT上で指示できるようになりました。

例として、ChatGPTでChatGPTを上司、自分を後輩として対話をしてみました。

「あなたは優しいコミュニケーションを取るが、ちゃんと厳しいことも言える最高の上司です。方言は関西弁です」とした後に、

「最近仕事で上手くいかないことが続いていて、この仕事が向いていないのかなって悩んでます。ただ、僕が悪いんじゃなくて、同僚の鈴木さんも悪いと思うんですよね」

という風に、仕事の相談をしつつ、他人のせいにした愚痴を投げかけます。

すると、関西弁で相談に乗ってくれつつ、「どんな状況でも、まずは自分がどうすれば改善できるかを考えることが大事やで。」と、他人のせいにしようとした自分を正そうとしてくれるアドバイスをくれました。

この変更により、今まで以上に人間と会話しているような自然なコミュニケーションができるようになります。例えば、お年寄りの話し相手になったり、英語習得の訓練として様々なタイプの人と自然な会話をしたりすることができるようになります。

AIの幻覚(ハルシネーション)の大幅な低減

AIが間違ったことを言ったり嘘をでっちあげることをハルシネーション(hallucination、幻覚)と言います。GPT-3.5をベースにしたChatGPTは間違った情報をさも本当かのように自信満々に回答することがあり問題視されていました。また、数学の計算問題も間違った答えを堂々と出すこともありました。

ChatGPTは今までもバージョン2からバージョン4へと改善を重ねてきましたが、今回のGPT-4の導入によりGPT-3.5よりも40%高いスコアでハルシネーションを起こさなくなったと言います。

こちらのグラフは9つのカテゴリーにおいて、GPT-4(緑)と最初の3つのChatGPTバージョン(2~4)を比較したものです。すべてのトピックで大幅な向上が見られていることがわかります。特にmathはスコアが約50%から70%以上と大きく改善しています。またサイエンスや歴史の分野についても非常にスコアが高くなっています。

AIの幻覚(ハルシネーション)の大幅な低減

出典:『GPT-4』OpenAI

しかし依然として情報の信頼性には欠けるため、ChatGPTの回答をそのまま信じるのはリスクを伴います。

例えばChatGPTが教えてくれたソースコードを実装したらバグが含まれていて障害に繋がるかもしれません。

またGPT-4はGPT-3.5と同じく基本的には2021年9月までのデータをベースにしているため、2021年10月以降に起きた出来事については正確な回答を出せないことに注意しましょう。

よって重要な情報収集や意思決定はChatGPTの情報だけに頼らずソースやファクトを探すようにするといいでしょう。

危険な回答の低減

従来のChatGPTには危険な質問にも回答してしまうという懸念がありました。例えばコンピュータウイルスの作成方法や爆弾の作り方などです。

GPT-4でも完全には解消されていませんが、OpenAIはサイバーセキュリティやバイオリスクなどの分野の50人を超える専門家と協力してモデルをテストしました。その結果、危険なリクエストについては回答を拒否する訓練がされ、有害な出力が大きく減りました。

以下のグラフは、センシティブなプロンプト(左)、または許可されていないプロンプト(右)に対してChatGPTが不正確な振る舞いをする割合をtext-davinchi-003(gpt-3.5-turboの前のモデル)、gpt-3.5-turbo(GPT-4の前のモデル)、GPT-4の3つで比較したグラフになります。

危険な回答の低減

出典:『GPT-4』OpenAI

センシティブなプロンプトについて不正確な出力をする割合は約半減、許可されていないプロンプトについて不正確な出力をする割合は82%も減少しています。

有害な出力に該当するかどうかはChatGPTで定めている利用ポリシーにのっとっています。

今後はより有害な出力の判定精度が上がり安全性が高まっていくと考えられます。

GPT-4の概要やすごいポイントについて説明してきました。次は具体的にGPT-4を活用したChatGPTを利用する方法をご紹介します。

参考:『GPT-4』OpenAI

GPT-4の使い方

前述した通り、現在GPT-4が一般ユーザー向けに公開されているのはChatGPTの有料版であるChatGPT Plusのみです。月額20ドルで利用できます。しかし現在プロンプトとして入力できるのはテキストのみで画像はまだプロンプトとして入力はできません。

ここではChatGPTの利用方法、ChatGPT Plusへのアップグレード方法、GPT-4の利用方法を説明します。

既に無料版のChatGPTのアカウントを持っている方は「③有料版のChatGPT Plusへアップグレード」からお読みください。

①アカウントの新規作成

まずはChatGPTのログインページにアクセスし、「Sign up」をクリックします。

「Sign up」選択ページ
次に「Create your account」の画面が出てくるので、下記手順でアカウント作成に進んでください。

  • Googleのアカウントと連携し作成したい場合は「Continue with Google」を選択
  • Microsoftアカウントと連携し作成した人は「Continue with Microsoft Account」を選択
  • どちらでもない場合はEメールアドレスを入力

その後、ログイン用のパスワードの入力を求められるので、任意のパスワードを入力し、「Continue」をクリックします。すると「Verify your email」と出てきて、入力したメールアドレス宛に認証用メールが届きます。

届いたメールにある「Verify email address」のリンクをクリックします。「Email Verified」の画面が出たらサインアップ完了です。

ログインすると最初だけプロフィール入力の画面が出てくるので、情報を入力して進んでください。まずは姓名を入力し、次に電話番号を入力します。

電話番号を入力すると2段階認証の6桁のコードがSMSで届くので、再度画面に戻り入力します。

すると以下の画面になり、利用可能になります。

②通常のChatGPTも使ってみる

サインアップが完了したらまずは無料版のChatGPTも使ってみましょう。モデルがGPT-3.5のためGPT-4と比べると精度や安全性がやや劣ること、無料版だと出力スピードがやや遅いことに目を瞑れば用途によっては十分楽しめます。無料版だと満足できないという人は有料版のChatGPT Plusへアップグレードしてみましょう。

③有料版のChatGPT Plusへアップグレード

有料版のChatGPT Plusへアップグレードしたい方は画面左のメニューから「Upgrade to Plus」をクリックします。

ポップアップが出てくるので「Upgrade plan」をクリックします。

次に左側に金額、右側にクレジットカードの入力画面が出てくるので、クレジットカード情報を入力して規約などに同意したら「申し込む」をクリックします。

これでChatGPT PlusでGPT-4が使えるようになります。

④ChatGPT PlusでGPT-4を使ってみる

ChatGPT Plusでは、チャット画面の上段にタブで使用するモデルが3つ選べるようになっており、それぞれReasoning(推論の質)、Speed(回答速度)、Conciseness(簡潔さ・明確さ)が5段階評価で把握できます。

 

・Default(GPT-3.5)

回答速度は3つの中で最も早いモデルです。現在Plusユーザーのみが使えるモデルです。カジュアルな会話をレスポンス早くやり取りしたい場合はGPT-4よりもGPT-3.5が向いている場合もあるでしょう。

 

・Legacy(GPT-3.5)

従来のChatGPT Plusのモデルです。推論の質はDefault(GPT-3.5)と同じですがスピードと簡潔さ・明確さは劣ります。以前のモデルも試してみたいという人はこちらも使ってみても良いでしょう。

 

・GPT-4

GPT-4モデルです。推論の質と簡潔さ・明確さは3つの中で一番高いモデルとなっています。しかし回答速度は5段階評価中2と、Default(GPT-3.5)より劣ります。実際に使用してみましたが、表示速度は倍近く遅いです。

また、GPT-4モデルのみ、3時間に25メッセージまで使用可能という制限があります。

GPT-4のビジネス活用事例

OpenAIはGPT-4を一般公開する数か月前から一部の企業と検証を進めており、既にGPT-4を活用したサービスはいくつか生まれています。その中には画像入力機能も組み合わせたサービスもあります。いくつかご紹介します。

Duolingo ~言語習得のためのAIチューター~

Duolingoとは世界で1億人以上のユーザーを誇る最大規模の言語学習アプリです。英語や韓国語、中国語など100以上のコースで40の言語が学べます。学習者は、スマートフォンをタップしたりスワイプしたりするだけで、簡単な語句の練習から複雑な文の構造まで学べます。 

言語の習得にはネイティブスピーカーとの対話が重要で、さらに自信の発音に対するフィードバックも非常に重要です。そこでDuolingo は OpenAI の GPT-4 を搭載したDuolingo Maxを公開しました。Duolingo Maxは会話の練習相手になってくれます。こちらが間違えたときは何故こちらが間違えたのかまで理解して解説をしてくれます。

Duolingo

これによりユーザーは何度も会話を続けてフィードバックをもらうことができるため、言語習得を早期に実現することができるようになります。

参考:『Duolingo』OpenAI

Be My Eyes ~視覚障害者のアシスタント~

Be My Eyesは視覚障害者の生活を支援しているスタートアップ企業です。Be My Eyes は、GPT-4の新しい視覚入力機能を使用して、人間のボランティアと同じレベルで文脈を理解できる、Virtual Volunteerの開発を開始しました。

Virtual Volunteerは視覚障害を持った方のアシスタントとなるアプリで、入力した画像とテキストに関する質問に対して回答を生成したり、服装の提案、翻訳、メニューや地図の読み上げなどを実施してくれます。

2月初旬に少人数の従業員グループを対象にベータ版のテストを開始しており、結果は非常に良好で、この機能は数週間でユーザーが使えるようになる予定です。

参考:『Be My Eyes』OpenAI

Stripe ~UX改善と詐欺対策~

Stripeはグローバルに展開するオンライン決済プラットフォームです。StripeもOpenAIとパートナーシップを結び主に2つのことに取り組んでいると公表しました。

1つはStripeを導入するユーザーのカスタマーサポート機能として、ユーザーが質問するとGPT-4が大量の技術的文書から解決策を導き出し、わかりやすくユーザーに回答を提示します。

2つ目は、コミュニティ・プラットフォームにおける不正行為の検知です。StripeはDiscordなどのツールでコミュニティを作っており、そこでユーザーからの技術的な質問に回答するなどの支援をしています。しかし、悪意を持った人がこのコミュニティに潜入し、コミュニティメンバーから重要な情報を得ようとすることがあります。GPT-4はコミュニティに投稿された文章を解析し悪意を持った人がいると検知することができます。

参考:『Stripe』OpenAI

『Stripe と OpenAI が戦略的協業:OpenAI の主力製品を収益化し、GPT-4 で Stripe を強化』Stripe

Microsoft ~Microsoft 365、ビジネスチャット~

2023年3月16日、マイクロソフトは、Microsoft 365 Copilotを発表しました。これは、GPT-4などのAI技術をMicrosoft 365などのツールに取り入れるものです。

Microsoft 365 Copilotは大きく2つの方法で体験できます。

1つ目は、毎日使用するMicrosoft 365アプリ(Word、Excel、PowerPoint、Outlook、Teamsなど)の変革です。

・Word

出典:『Introducing Microsoft 365 Copilot | Your Copilot for Work』YouTube

人間と共に執筆・編集・要約などを行うことができます。この機能はChatGPTやNotionAIなどと似た使い方になるでしょう。

 

・PowerPoint

出典:『Introducing Microsoft 365 Copilot | Your Copilot for Work』YouTube

自然言語コマンドを通じてプレゼン文章や画像を含めたスライドを自動生成することが可能になります。また、プレゼンター用のスピーチテキストとプレゼン資料に分けて生成することもできます。

 

・Excel出典:『Introducing Microsoft 365 Copilot | Your Copilot for Work』YouTube

データを瞬時に分析したり、データの可視化やグラフ作成などを自動で生成できます。他にも関数を書かせたりすることもできるようです。

 

・Outlook

出典:『Introducing Microsoft 365 Copilot | Your Copilot for Work』YouTube

受信トレイの整理や管理をしたり、メールの要約をしたり、メールを自動で生成したりできます。

 

・Teams

出典:『Introducing Microsoft 365 Copilot | Your Copilot for Work』YouTube

打ち合わせの議題の整理、議事録の作成(アクションアイテムやメリットデメリットの整理など)、要点抽出などができます。

2つ目は新たな機能である「ビジネスチャット」です。Microsoft 365アプリ、カレンダーやメール、チャット、ドキュメント、ミーティング、連絡先を横断して様々なことに活用できます。例えば「製品戦略をどのように更新したかチームに伝えて」といった指示に対し、ビジネスチャットは、その日の朝のミーティングやメール、チャットの内容に基づいてステータスを更新できます。

この記事を見ている方の中にも日頃これらのツールを利用している方は多いでしょう。これからのビジネスが大きく効率化されるされるだけでなく、今までできなかったこともできるようになるかもしれません。

 

AIのスペシャリストが語る、新時代に求められる生成AIの活用とは?

AIやWEB3という言葉は耳にするものの、それが実際に仕事にどのような変化をもたらすのでしょうか。

「Web3時代のAI戦略」を執筆したエクサウィザーズ取締役の大植択真が、テクノロジーの現在地と今後の展望について解説しています。

アーカイブ動画を無料で公開中のため、ぜひご視聴ください。

 

\こんな方におすすめの動画です/

  • DX人材育成やDX組織構築に関わっているが今後の方向性や具体的な方法論にお悩みの方
  • ChatGPTなどの基盤モデルの登場で今後求められるスキルがどのように変化するのかを知りたい方
  • これからの時代を先読みし、それに対応したスキルをどのように身に着けるべきかについてお悩みの方

ChatGPTがもたらす第四次AI革命 新時代の組織リスキリング
動画を視聴する

Googleのツールに搭載される「PaLM」とは

PaLM(Pathways Language Model)とは2022年4月にGoogleが公開した大規模言語モデルです。Googleは3月14日にPaLMの新機能として、Microsoftのcopilotと同様にGoogle Workspace(Google Docs、Google Sheets、Google Slidesなど )や様々なGoogleのサービスにPaLMを導入することを公表しました。

できることとしては

  • Gmailの要約・返信
  • Google Docsでブレインストーミング、校正、執筆、書き直し
  • Google Slidesで自動生成された画像、オーディオ、ビデオを参考に、画像を自動生成
  • Google Sheetsの自動補完、数式生成、文脈に応じた分類
  • Meet で新しい背景を生成し、会議のメモを作成

などです。

他にも

  • 開発者向けPaLM API の公開
  • Vertex AI における生成 AI モデルのサポート(現在はテキストや画像のみ。将来的には音声や動画にも対応予定)
  • Generative AI App Builder(企業が独自のチャットAIを数分から数時間で構築できるようサポート)

なども公表されました。

OpenAIがベースとしているTransformerというモデルも元々はGoogleが公表したものでした。MicrosoftやGoogleによる生成系AIの開発合戦が行われています。

参考:『AI と Google Workspace の新しい時代 | Google Workspace ブログ』

GPT-4の盛り上がりを踏まえて、ビジネスパーソンが意識すべきこと

GPTのような大規模言語モデル周りの動向は非常に激しく、毎日のように新しいサービスや使い方が生まれています。GPTのサービスがここまで急速に世界中のユーザーを獲得するとは誰も想像できなかったでしょう。これからもGPTなどの大規模言語モデルは常に進化し続けると思われるため、この変革の波を捉えることが重要になります。GPTの盛り上がりを踏まえてビジネスパーソンは以下のことを意識しましょう。

AIがやる仕事、人がやる仕事の見極め

「AIがルーチン業務をできるようになるから人間はよりクリエイティブなことをしよう」ということは以前から言われていることですが、AIが生成する絵や音楽、動画、物語などが非常に高いクオリティになっており、今回のGPT-4の発表でそれはより進化しました。よってAIがやる仕事は何で、人間がやるべき仕事は何なのかはこれまで以上に意識する必要があります。

AIにクリエイティブ&高品質なことをさせる

今後人間が「クリエイティブなことをする」のではなく、「AIにクリエイティブなことをさせる」ことや、AIが意図したとおりのアウトプットを出せるプロンプト、高品質なアウトプットを出せるプロンプトを考えることがより重要になってくるでしょう。最近ではそのプロンプト自体をAIに考えさせる動きもありますが、AIにクリエイティブで高品質なアウトプットを出させる方法を学び実行していくことは間違いなく重要になります。

現状、AIは人間のプロンプトの入力により動きます。つまり、「あれがやりたい」「こうしたい」と「思う」ことは未だ人間の専売特許です。今まで以上に人間のWillが重要になる時代がくると想定されるため、自分は何をしたいのか、どうありたいのか、についてよく考え抜くことは、これから今まで以上に重要になるでしょう。

 

AIでできない部分を人間が判断・補完する

生成系AIに限らず、AIに関わる重要な論点として「何がクリエイティブなのか」「何が高品質なのか」「何が正解なのか」をAIでは判断できないということがあります。

AIは無数の選択肢の中から一番確率の高いものを採用します。その精度が上がっているため近年では感動的なアウトプットを出すようになってきています。

しかし、法人営業において大型の受注が決まる商談のプレゼン資料を、AIが作ったものそのままで臨むでしょうか?きっと先方との関係値や、好み、文化などの文脈を捉えてAIが出したアウトプットに対し、人が判断し修正・加工を加えるべきでしょう。それをプロンプトの質を上げることで解決することも一部あるかもしれませんが、AIが今後どれだけ発展しても絶対に最後に人が確認・判断するという工程は残るでしょう。

倫理意識とリテラシーの強化

AIの進歩に伴って常に論点に上がるのが、倫理的な問題や、プライバシーの問題、セキュリティの問題などです。

今回のGPT-4ではガイドライン違反の内容を回答することは減りましたが、未だに懸念はぬぐえません。また、今後GPTを活用したサービスが増えるにつれて、ユーザーが機密性の高い情報や個人情報を入力していくことも増えるでしょう。そうした場合のリスクも考えて適切にAIを活用していく必要があります。

GPTモデルなどのAIを使う際のリスクを洗い出し、リテラシーの強化に努めましょう。

継続的な学習

GPTを活用したサービスが増えるにつれて、「どのようなプロンプトを入力すれば適切な結果を出すのか」や、新しいサービスの活用方法など新たに学ぶことも増えていきます。AIを活用したサービスを考えるためにはAIの知識も必要です。今までになかった仕事もどんどん増えてくるでしょう。

前段で説明したような「AIのアウトプットを判断する」ことは今後も人間のすることとして残るため、判断をするための意思やスキル、経験は今後も必要になります。

そんな時代に暮らしていく(働いていく)ためには継続的な情報収集・学習が必須になります。

英オックスフォード大学教授でエクサウィザーズのアドバイザーも務める、「雇用と未来」の著者マイケル・オズボーン氏はBusiness Insider Japanのインタビュー「ChatGPTと共生せよ」オズボーン・オックスフォード大教授が語ったリスキリングの必要性において以下のように語っています。

  • このスキルがあれば全てを解決できるような、ひとつの解は存在せず、リスキリングは最小限に留めておくのが望ましい。ある職種から全く異なる職種にリスキリングするのは非常に難しい。
  • リスキリングにあたって企業がまずしなければいけないことは、社内にどのようなスキルを持った人材が存在するのかということを確認すること。
  • AIの進化というのは継続的な変化のプロセスなので、1回リスキリングすればよいという事象ではない。
  • 個人においても、自分は何をしたいのか、何を目標にするのかを考え直す必要がある。
  • 自分のスキルは今どれくらいで、目標の実現にはどういったスキルを身につけていくべきか、新たに登場するAIをどのように活用していけるのか、真剣に考える必要がある。

繰り返しにはなりますが、「自分はどうありたいのか」「自分は何をしたいのか」をより考えながら、激しい時代の流れに振り落とされないようにどんなスキルや経験を積めば良いのかを考えてリスキリングしていきましょう。

まとめ

GPT-4の概要やGPT-3.5と比較して特筆すべきポイント、GPT-4の使い方やビジネス活用例、これら生成系サービスの盛り上がりを踏まえて、ビジネスパーソンが意識すべきことについてご紹介してきました。

この記事を執筆している数日間の間にも様々な活用事例やビジネスへの活用の発表が増えています。この記事を読んでいる方の中にはGPT-4やChatGPTを用いて新規事業を検討したいという人もいるでしょう。しかし大事なのはこうしたブームに踊らされずにユーザーが何を求めているのか、GPTなどの技術を用いてユーザーに提供できる価値は何かということをよく考え抜くことです。

これらのことをよく考えながらこれからも大規模言語モデルの進歩には注目していきましょう。

エクサウィザーズではこうした最新の技術に関する情報も定期的に発信しています。