2024年5月に行われたOpenAIのリリースイベントの発表内容をまとめて紹介します。
【目次】
イベント前の発表内容の予測・憶測
以下はイベント前の予測でした。外れたものは線を引いています。
Appleとの契約。Siri搭載?- 会話ができる音声アシスタント、Voice-To-Voiceリアルタイム会話APIおよびChatGPT機能
- GPT-4の進化
GPTモデルの名称変更。これからはGPT-5とかではなく単純にAdvancedと呼ばれるように?ChatGPTのGoogle Drive や OneDriveとの連携機能
発表内容
今回の発表内容は大きく3つでした。
- ChatGPTのデスクトップアプリ登場 & UIデザインの大幅改善
- 新たなモデル “GPT-4o” の発表。より賢く、より早く、より自由に。
- GPT-4oがChatGPTの無料ユーザーにも開放
ChatGPTのデスクトップアプリの発表
ChatGPTのデスクトップアプリが発表されました。
新たなモデル GPT-4o の発表
新たにGPT-4oというモデルが発表されました。誤字ではなく、”GPT-4o”(ジーピーティー・フォーオー)です。
この “o” は “Omnimodel” の ”o” のようです。
GPT-4oモデルの特徴は以下の通りです。
- より賢い応答
- より速い応答
- APIとしては、GPT-4-turboと比較して価格が1/2に下がり、応答速度も2倍に向上。
- リアルタイムのあまりにも自然な音声会話
- 動画を瞬時に認識してそれについてリアルタイムな音声の会話
音声会話については説明するよりも以下のデモ動画をご覧ください。大げさではなく、ヤバいです。
↓この動画では、自然なリアルタイムの会話を実演しています。応答が早すぎてびっくりです。
この動画では、ChatGPTアプリでカメラを起動し、写している映像と会話をしています。動画の認識が正確なのと高速すぎるのとで驚きます。
また、この音声会話機能を使えばリアルタイムの翻訳ツールとしても機能します。
なお、GPT-4oは、特にコーディングにおいて他のモデルとかなり差を付けてすごいスコアになっています。