こんにちは、マーケティング部のおさいです。

ChatGPTの最新AI「GPT-4o」(ジーピーティー・フォー・オー)は、まるで人と話しているかのような、感情豊かな会話ができるようになりました!
下の動画でデモ映像が見られます。

▼ 感情豊かに話すAIの映像

  • 10:10

    大げさに深呼吸するふりをすると、
    「もっとゆっくり呼吸して。マーク、あなたは掃除機じゃないんだから」と、
    AIがツッコミを入れる(笑)。

  • 12:31

    AIに物語を語ってもらう。

  • 12:36

    もっと感情豊かに話すようにダメ出しすると、感情豊かに話してくれる。

  • 12:54

    ロボットっぽい口調で話すように指示。

  • 13:14

    歌うような語り口で話すように指示。

さらに、歌まで歌えるようになりました!しかも、別々のAI同士が連携して歌います。

▼ 感情豊かに歌うAIたちの映像

  • 4:21

    この時点までにAIと会話した内容を歌にして歌うように指示。

  • 4:38

    2つのAI同士で交互に歌うように指示。

  • 4:54

    一回ごとに歌詞を一行だけ歌うように指示(そのつづきを、もう片方のAIが歌う)。

  • 5:07

    男性の声のAIの歌がヘタだったので、ダメ出し(笑)。

  • 5:13~

    2つのAI同士が交互に歌い始める。

このように、「GPT-4o」は、「まるで人と話しているかのような、感情豊かな会話ができるAI」です。

(※この記事で紹介している動画は、英語の動画ですが、日本語字幕を表示させることができます。
 ※スマホのYouTubeアプリの場合は、映像の上をタップして、右上の歯車のアイコンを押してから、「字幕」→「自動翻訳」→「日本語」を選択すると、日本語字幕が表示されます。
 ※パソコンの場合は、映像の右下にある「字幕」アイコンを押してから、歯車のアイコン(「設定」)を押して、「字幕」→「自動翻訳」→「日本語」を選択すると、日本語字幕が表示されます。)

GPT-4oってなに?

GPT-4o(ジーピーティー・フォー・オー)というのは、かんたんに言うと、2024年5月14日に公開された、「最新かつ最高性能を誇るChatGPTの新バージョン」です。音声情報や、視覚情報、文字情報など、複数の種類の情報をすばやく処理して回答することができます。

※「GPT-4o」というのは、「GPT」という生成AIの「バージョン4」の「omni」(オムニ)という意味です。「omni」(オムニ)とは、「すべて」や「全方位」という意味の言葉です。ここでは、「GPT-4oは、いろいろな種類の情報を処理できる」ということをあらわす言葉として、「オムニ」(すべて)という言葉が付けられているようです。

ジョークを言うAI!?

GPT-4oは、いろいろすごいのですが、個人的に、一番おどろいたのは、自然な会話のなかで、GPT-4oがユーモアのある返しをしていることでした。GPT-4oの発表の場でGPT-4oをつかった実演がなされている場面や、そのほかのデモ映像でも、GPT-4oとの会話のなかで、「GPT-4oがユーモアのある回答をして、それを聞いた人間の側に笑いが起こる」という場面が何度もありました。

GPT-4oのおもしろデモ映像

▼ GPT-4oの発表の場でのデモ映像
(※下の動画は、冒頭で紹介した動画と同じものです。)

  • 10:10

    大げさに深呼吸するふりをすると、
    「もっとゆっくり呼吸して。マーク、あなたは掃除機じゃないんだから」と、
    AIがツッコミを入れる(笑)。

  • 12:31

    AIに物語を語ってもらう。

  • 12:36

    もっと感情豊かに話すようにダメ出しすると、感情豊かに話してくれる。

  • 12:54

    ロボットっぽい口調で話すように指示。

  • 13:14

    歌うような語り口で話すように指示。

  • 14:12

    紙に書いた方程式を見せて、ヒントをもらいながらその問題を解く。

  • 17:20

    「アイ・♡(ラブ)・ChatGPT」と書いた紙を見せて、AIを喜ばせる。

  • 19:07

    プログラミングコードを見せて、内容を解説してもらう。

  • 20:37

    グラフを見せて、内容について質問する。

  • 22:33

    イタリア語で話す人の言葉を英語に翻訳してもらう。

  • 24:01

    顔の表情を見せて、どんな気持ちなのか推測させる。

(※上の動画で話をしている女性は、OpenAIのCTO(最高技術責任者)の、ミラ・ムラティさんです。)

▼ 2つのAI同士を会話させる
(※下の動画は、冒頭で紹介した動画と同じものです。)

  • 1:34

    2つのAI(スマホ)を用意して、AI同士で会話をさせる。男性の声のAIに部屋の様子を見せて音声で実況してもらい、それを女性の声のAIが聞いたうえでそれについて質問をして、男性の声のAIがその質問に答える。

  • 2:57、3:38

    話の途中で、背後で女性がいたずらをする。
    3:38で、「今、なにか変わったことはなかった?」と聞くと、男性の声のAIがそのいたずらについて説明する。

  • 4:21

    この時点までにAIと会話した内容を歌にして歌うように指示。

  • 4:38

    2つのAI同士で交互に歌うように指示。

  • 4:54

    一回ごとに歌詞を一行だけ歌うように指示(そのつづきを、もう片方のAIが歌う)。

  • 5:07

    男性の声のAIの歌がヘタだったので、ダメ出し(笑)。

  • 5:13~

    2つのAI同士が交互に歌い始める。

(※上の動画で話をしている男性は、OpenAIの社長で、共同創業者の、グレッグ・ブロックマンさんです。)

▼ 撮影現場の様子をAIに見せて、「これから何をするか」を推測させる。

▼ 英語の話し手と、スペイン語の話し手との間の通訳。

▼ テーマを与えたり、歌い方を指定して、歌を歌ってもらう。

▼ 犬派と猫派の人たちの議論に加わってもらって、最後に総括をしてもらう。

▼ 息子に数学を教える手伝いをしてもらう。

▼ モノを見せて、スペイン語でそれらをなんと言うか質問する。

▼ 遊び方を提案してもらって、じゃんけん勝負を盛り上げてもらう。

▼ 速度やスタイルを変えて歌ってもらう。

▼ 面接に臨む際のアドバイスをしてもらう。

▼ 飼い犬をAIに紹介する。

▼ 目が見えない人がAIにサポートされながら街を散策する。

▼ AIに誕生日を祝ってもらう(バースデーソングを歌ってもらう)。

▼ おもしろいジョークが言えているかAIにチェックしてもらう。

▼ いろいろな速度で数をかぞえてもらう。

▼ 早押しクイズ勝負の出題と審判をしてもらう。

どのくらい性能がアップしたの?

イロレーティング(Elo rating)という、AIのランキングによると、GPT-4oは、他のAIを大きく引き離すほどの高い性能があるそうです。下のサム・アルトマンのXのポストに掲載されているグラフが、イロレーティングのグラフです。2つあるグラフのうち、上のほうのグラフは「全体的な性能」を示すグラフで、下のほうのグラフは「プログラミングコーディングの性能」を示すグラフです。

それぞれのグラフの左端にある「im-also-a-good-gpt2-chatbot」というのは、GPT-4oの別名(発表日前の呼び名)です。どちらのグラフでも、「im-also-a-good-gpt2-chatbot」(GPT-4o)が、他の有力な生成AIを置き去りにして、ぶっちぎりの左上に位置していることがわかります。(これらのグラフでは、有力な生成AIである、Googleの「Gemini 1.5 Pro」も、Anthropicの「Claude 3 Opus」も、Metaの「Llama 3」も、すべて、GPT-4oからかなりの遅れをとっていることになります。)

  • 音声でのやり取りで、感情や、笑いや、歌を表現する能力が向上。
  • 英語以外の言語の能力が大幅に向上。(日本語に関する性能も向上。)
  • 既存のGPT-4 Turbo(API)よりも、動作が2倍速く、料金は50%安く、扱える情報量は5倍に。(下記のXポスト参照)

サム・アルトマンがGPT-4oと、「ChatGPTが目指す先」について語っている記事

サム・アルトマンが、GPT-4oについて語っている記事が、彼のブログで閲覧できます。(こちらのリンクで、その記事の日本語訳の文章を読むことができます(Google翻訳を使用)。(原文はこちら

(※サム・アルトマンは、ChatGPTの開発元であるOpenAIのCEOです。)

その記事では、「ChatGPTが目指す先」についても語られていて、今、全世界の注目を浴びているサム・アルトマンが考えていることの一端が垣間見えるので、もし興味があれば見てみてください。

(下のサム・アルトマンのXのポストで、その記事が紹介されています。)

映画『her』のように、AIと恋愛するようになるかも!?

冒頭で紹介した「GPT-4oの発表イベントの映像」では、女性の声をしたAIが、まるで人と話しているかのような自然な会話をしている様子が見られます。その様子を見て、映画『her/世界でひとつの彼女』を思い浮かべた人も多いようです。この映画は、女性のAIと恋愛関係になる男性の物語です。GPT-4oがここまで自然に会話できるようになると、AIと恋愛関係になる人があらわれてもおかしくないかもしれません。

実際、サム・アルトマンは、GPT-4oの公開にあわせて、下のXポストのように、「her」という言葉を投稿しています。(おそらく、かるい冗談だとおもいます(笑))。この投稿は、おそらく、映画『her/世界でひとつの彼女』のことを指しているのだと思います。

ちなみに、ネット民のみなさんは、サム・アルトマンのこの投稿に反応して、さっそく、映画『her/世界でひとつの彼女』のポスターと、サム・アルトマンの顔を合成したジョーク画像をつくったりしているようです(笑)。

AIと会話できる時代を見据えて

GPT-4oの登場によって、AIと自然な会話ができるようになりました。会話どころか、そう遠くない将来、AIと恋愛する人も増えていくことでしょう。そのような未来を見据えたうえで、あなたはどんなふうに行動しますか?この機会に、そうしたことを考えみるのもいいかもしれません。