OpenAIは、2024年5月14日、新たな大規模言語モデルとして GPT-4o を発表しました。
なお、GPT-4oの読み方は「ジーピーティー フォー オー」です。
GPT-4 Turboに続く新たなモデルとして、性能が上がっただけでなく、価格も50%下がっていて、人気になることが予想されます。
【目次】
- GPT-4oとは
- GPT-4oの特徴、できること
- 無料ユーザーでも使える
- 2倍の速さで応答できる
- リアルタイムで自然な音声会話
- 動画を認識できる
- 使い方
- 無料プランに加入している場合
- 有料プランに加入している場合
- 料金(ChatGPTで使う場合の料金)
- 料金(APIで使う場合の料金)
- GPT-4oはコーディングの性能が向上
- Azure OpenAIでのAPI利用
GPT-4oとは
GPT-4oは、OpenAIが公開した新たなAIモデル(大規模言語モデル、LLM)です。
GPT-4oの特徴は以下の通りです。
- ChatGPT無料ユーザーでも使える
- 2倍の速さで応答できる
- 性能が向上(=より賢くなった)
- リアルタイムで自然な音声会話ができる
- 動画を認識できる
- APIの価格が50%下がる
以上の特徴をそれぞれ解説していきます。
GPT-4oの特徴、できること
無料ユーザーでも使える
これまでGPT-4モデルはChatGPT Plus以上のユーザー、つまり有料プランに加入しているユーザーだけが利用できましたが、今はもう無料ユーザーでもGPT-4を使えるようになりました。(GPT-4oはGPT-4シリーズの最新版)
最新で最高のAIが無料で開放されるというのは嬉しいですね。会社で導入するにも全員分のサブスクリプションを課金するのはなかなかハードルが高かったでしょうが、これなら「多く使う人だけ有料プランで使う」といった柔軟な使い方ができます。
2倍の速さで応答できる
ChatGPTを使っていると、応答の遅さが気になることは多いでしょう。とくにGPT-4のような高性能なモデルになればなるほど応答は遅くなるものです。
しかし、GPT-4oはその速度の問題を解決しました。
下記の動画ではGPT-4oの応答を実演していますが、やはり速いですね。
リアルタイムで自然な音声会話
音声会話については以下の動画をご覧ください。
まず、この動画では一般的な会話をおこなっています。かなり自然ですし、何より反応が非常に早いことにも注目です。
次の動画ではリアルタイムな翻訳に対応しています。
動画を認識できる
動画に何が映っているか、どんな表情か、何の文字が記されているか、といったかなり細かい点まで認識できます。
そして、その映っている動画を元に自然な音声会話ができます。
この機能に関しては、デモ動画を見るのが1番わかりやすいので、以下より紹介していきます。
まず、下記の動画はGPT-4oに犬を見せた時のリアクションです。犬を認識するだけでなく、まるで人間のようなリアクションをしています。認識能力だけでなく、この会話の自然さにも驚かされます。
また、下記の動画は視力が低い人の目になってくれるアプリの紹介です。このアプリにはGPT-4oが搭載されています。このような使い方もできるのはスゴイの一言です。見えているものをかなり細かく正確に説明できています。
使い方
ChatGPTでGPT-4oを使う方法を紹介します。
無料プランに加入している場合
ChatGPTの無料プランの場合には、何もしなくても自動でGPT-4oが適用されます。
そして、一定の制限を超えると自動的にGPT-3.5にダウングレードされたモデルが応答するようになります。なぜかユーザーには分からないようになっているようです。
有料プランに加入している場合
有料プランに加入している場合には、下記画像のように画面の左上からモデルを選択すると使ええます。
料金(ChatGPTで使う場合の料金)
ChatGPTで、GPT-4oは無料プランでも使えます。
無料プランで利用する際には、自動的にGPT-4oが適用されています。制限回数(非公開の模様)を超えると、GPT-3.5に自動的にダウングレードされたモデルが応答します。
また、無料プランでは「画像生成」ができません。利用する方は多くないでしょうが、そこだけ注意しておきましょう。
料金(APIで使う場合の料金)
GPT-4oはAPIとしても提供されています。APIとは、開発者が既存のシステムに組み込んで利用するもので、一般ユーザーには関係ありません。
GPT-4oのAPIは、これまでのGPT-4 Turboと比べて半額の安さで利用できます。
モデル | 入力 | 出力 |
gpt-4o | $5 / 1M tokens | $15 / 1M tokens |
gpt-4-turbo | $10 / 1M tokens | $30 / 1M tokens |
これまでのGPT-4はあまりにも高いため使うのに躊躇するレベルでしたが、このくらいなら使いやすくなったと言えるでしょう。
GPT-4oはコーディングの性能が向上
価格だけでなく性能も改善していますが、特にコーディングでは性能がかなり向上したようです。
画像では右にずらっと他社のモデルが並んでいますが、やはりGPTシリーズが最高なのですね。
Azure OpenAIでのAPI利用
GPT-4oはすでにAzure OpenAIに対応していますが、日本リージョンには対応しておらず、日本語でのドキュメントもまだ用意されていません。(2024年5月18日現在)
参考