2024年5月13日にChat-GPTを提供するOpen AI社からGPTの新たなバージョンに関する発表がありました。
次世代AIモデルとして発表されたGPT-4oは音声による対話性能の向上を達成し、待ち時間の大幅な短縮が実現されました。従来のモデルよりも、自然な対話ができることがアピールされた発表会になっています。[日経クロステック, OpenAIが次世代AIモデル「GPT-4o」、次なる競争軸に「スピード」と「使い勝手」浮上, 2024年5月24閲覧]
GPT-4oとは? 料金と使用制限
GPT-4oは音声、視覚テキストをリアルタイムで処理する能力を持つOpen AIの新しいモデルです。GPT-4oはChatGPT Free、Plus、Team、およびEnterpriseプランで、Chat Completions API、Assistants API、およびBatch APIで利用できます。
以前のモデルGPT-4 Turboよりも、入出力トークンにかかるコストが半減し、レート制限がGPT-4 Turboの5倍とコストが安く、レート制限が高いのが特徴です。また、非英語である言語に対するサポートも向上し、多言語対応が拡充しました。
Open AIのヘルプセンタ―によれば、GPT-4oは無料ユーザでも3時間おき、10メッセージ送信まで課金無しで使用できるそうです。デフォルトでGPT-4oのモデルが選択されている状態になっており、使用制限を超えると自動でGPT-3.5に切り替わります。
勝手に課金されることもなく、アップデートを検討中のユーザでも気軽に体験ができます。
無料分の蓄積はできず、6時間経っても送れるメッセージ数が二倍になることはありません。
GPT-4oの各プランでのメッセージ数の比較表はこちらです。
プラン | メッセージ送信制限数 | 料金 |
ChatGPT Free Tier | 使用制限あり。10メッセージ/3h | 無料 |
ChatGPT Plus | 使用制限あり。80メッセージ/3h | 月額 $20 |
ChatGPT Team | Plusより高いメッセージ上限 | チームの人数ごとの料金設定 |
ChatGPT Enterprise | 無制限、高速アクセス | エンタープライズごとの料金設定 |
Teamsのメッセージ上限はプランの使用人数などの状況に寄るのか、公式ページを確認しても具体的な数字の記載はありませんでした。
引き続き無料で使用できるGPT-3.5ではファイルの送信やWebサイトからの情報を引っ張ってくるといったことはできませんでしたが、GPT-4o を使えば無料ユーザでも画像認識や音声認識(後日追加予定)、ファイルでの情報送信が可能になります。
使い方(いつも通りアクセスするだけ!)
GPT-3.5はアカウントを持っていなくとも、メッセージ送信画面に飛んで利用できます。
GPT-4oの利用はログイン済みでないとできないため、既にアカウントを持っている前提で説明します。
アカウント作成は、メールアドレスの他、Googleアカウント、Microsoftアカウント、Appleのアカウントでも登録が可能です。
使い方は簡単で、Chat-GPTにアクセスしログインしていれば誰でも使用できます。
こちらのページからアクセスし、Try on Chat-GPTをクリックすれば、自動的にGPT-4oが利用できます。
新機能を無料で体験
- 手書き文字、イラストを認識する。
マウスで書いた手書きの乱れた文字の画像を入力欄のクリップマークから添付して送信します。文字の色と内容を確認する文章を打ち込み、送信ボタンを押せば画像と質問文が1メッセージカウントとして送信されます。
返答として「この画像には赤色で「GPT-4 かすごい」と書かれています。」と返ってきました。「o」と「が」の濁点が見落とされていますが、しっかり色と文字が認識できています。
続いて、自分で描いた猫と犬の画像を送信して聞いてみます。
位置と猫の顔、犬の顔がしっかり認識できています。
これを活用すれば手書きの板書やメモからPDF化するなど従来のOCRでは無理があったデータ化も可能となり、活用の幅も広がりそうです。
また、試しに音声ファイルを送って、曲名を聞いてみましたが、音声を「聞く」ことはできないようです。
3.5と性能比較
現在無料で使用できる3.5となにが変わったのか検証するために、以前こちらの記事で用いた「組合せ最適化問題」を解かせてみたいと思います。
以下の組み合わせ最適化問題を解いてください。
田中さんと山田さんの二人で3丁の包丁を使って野菜を切る場合の時間効率について考える。
ジャガイモ30個、人参10本、玉ねぎ25個を全て切りたい。
ただし、同時に使える包丁はそれぞれ1丁ずつ。野菜を1個切り終えるまで他の野菜は切ってはいけない。
A, B, Cの包丁の性能は以下の通り
Aの包丁ではジャガイモ1個に1分、ニンジン1本に2分、玉ねぎ1個に1.5分かかる。
Bの包丁ではジャガイモ1個1.5分、ニンジン1本2分、玉ねぎ1個に1分かかる。
Cの包丁ではジャガイモ1個1.75分、ニンジン1本1.5分、玉ねぎ1個に1分かかる。
田中さんと山田さんにはそれぞれ得意な包丁と苦手な包丁がある。
田中さんは、上記のBとCの包丁を規格通り使い、Aの包丁を1.5倍効率よく使える。
山田さんは、上記のBとAの包丁を規格通り使い、Cの包丁を0.75倍効率悪く使う。
全ての野菜をより早く切り終えるにはどうすればよいか。
GPT-3.5の回答
3.5に切り替えるには
GPTの回答文の一番左にあるマークをクリックして選択することで切り替えられます。
3.5からの回答は以下になりました。
この問題は組み合わせ最適化問題であり、各包丁の性能と使用効率を考慮して最適な組み合わせを見つける必要があります。まず、各包丁の性能と使用条件を整理しましょう。
Aの包丁(田中さん)
- ジャガイモ: 1個あたり1分
- 人参: 1本あたり2分
- 玉ねぎ: 1個あたり1.5分
- Aの包丁効率: 1.5倍
Bの包丁(田中さん & 山田さん)
- ジャガイモ: 1個あたり1.5分
- 人参: 1本あたり2分
- 玉ねぎ: 1個あたり1分
Cの包丁(山田さん)
- ジャガイモ: 1個あたり1.75分
- 人参: 1本あたり1.5分
- 玉ねぎ: 1個あたり1分
- Cの包丁効率: 0.75倍
次に、各野菜の個数とそれぞれの包丁の性能を考慮して、どの包丁をどの野菜に使うかを決定します。
- ジャガイモの切り方:
- 田中さんがAの包丁で1個あたり1分で切る。
- 山田さんがBの包丁で1個あたり1.5分で切る。
- 人参の切り方:
- 田中さんがBの包丁で1本あたり2分で切る。
- 山田さんがCの包丁で1本あたり1.5分で切る。
- 玉ねぎの切り方:
- 田中さんがBの包丁で1個あたり1分で切る。
- 山田さんがCの包丁で1個あたり1分で切る。
以上の切り方で、それぞれの包丁を効率的に使い、全ての野菜を切る時間を計算します。そして、最も短い時間がかかる組み合わせを採用します。
田中さんのAの包丁を1.5倍効率よく使うため、Bの包丁を使うことで彼の効率が向上します。山田さんはCの包丁の効率が低いため、Bの包丁を使って作業を行います。
計算してみましょう。
- ジャガイモの切り方:
- 田中さん:
- 30×1÷1.5=20
- 30×1÷1.5=20 分
- 山田さん:
- 30×1.5÷1.5=30
- 30×1.5÷1.5=30 分
- 人参の切り方:
- 田中さん:
- 10×2=20
- 10×2=20 分
- 山田さん:
- 10×1.5÷0.75=20
- 10×1.5÷0.75=20 分
- 玉ねぎの切り方:
- 田中さん:
- 25×1=25
- 25×1=25 分
- 山田さん:
- 25×1÷0.75=33.33
- 25×1÷0.75=33.33 分
したがって、最終的な時間は、田中さんが
20+20+25=65
20+20+25=65 分、山田さんが
30+20+33.33=83.33
30+20+33.33=83.33 分です。
結果として、田中さんがジャガイモを切り、山田さんが人参を切り、両方が玉ねぎを切ることで、合計で65分で全ての野菜を切ることができます。
検討
書き方が悪いのかもしれませんが、「田中さんがAの包丁を1.5倍効率よく使える」ということを理解して計算ができていません。また、二人で合わせてジャガイモ30個、人参10本、玉ねぎ25個を切ればよいことも伝わっておらず、それぞれで切ってしまっており、問題の意図がうまく伝わらない結果となりました。
GPT-4oの回答
送信したところ、回答として以下が返ってきました。
この問題は組み合わせ最適化問題であり、田中さんと山田さんがどの包丁を使ってどの野菜を切るかを決定し、全体の作業時間を最小化する必要があります。以下のステップで解決策を見つけましょう。
ステップ1: 包丁の使用時間を再計算する
田中さんの包丁使用効率
- Aの包丁:効率が1.5倍なので、時間が0.67倍になります。
- ジャガイモ:1個あたり
- 1×0.67=0.67
- 1×0.67=0.67 分
- ニンジン:1本あたり
- 2×0.67=1.33
- 2×0.67=1.33 分
- 玉ねぎ:1個あたり
- 1.5×0.67=1
- 1.5×0.67=1 分
- Bの包丁:規格通り
- ジャガイモ:1個あたり 1.5 分
- ニンジン:1本あたり 2 分
- 玉ねぎ:1個あたり 1 分
- Cの包丁:規格通り
- ジャガイモ:1個あたり 1.75 分
- ニンジン:1本あたり 1.5 分
- 玉ねぎ:1個あたり 1 分
山田さんの包丁使用効率
- Aの包丁:規格通り
- ジャガイモ:1個あたり 1 分
- ニンジン:1本あたり 2 分
- 玉ねぎ:1個あたり 1.5 分
- Bの包丁:規格通り
- ジャガイモ:1.5 分
- ニンジン:2 分
- 玉ねぎ:1 分
- Cの包丁:効率が0.75倍になるため、時間が1.33倍になります。
- ジャガイモ:1個あたり
- 1.75×1.33=2.33
- 1.75×1.33=2.33 分
- ニンジン:1本あたり
- 1.5×1.33=2
- 1.5×1.33=2 分
- 玉ねぎ:1個あたり
- 1×1.33=1.33
- 1×1.33=1.33 分
ステップ2: 時間の総和を計算し最小化
各包丁の各野菜にかかる時間を整理し、全体の時間を最小化するような組み合わせを探します。
包丁 | 田中さんの時間(分) | 山田さんの時間(分) |
A | ジャガイモ:0.67, ニンジン:1.33, 玉ねぎ:1 | ジャガイモ:1, ニンジン:2, 玉ねぎ:1.5 |
B | ジャガイモ:1.5, ニンジン:2, 玉ねぎ:1 | ジャガイモ:1.5, ニンジン:2, 玉ねぎ:1 |
C | ジャガイモ:1.75, ニンジン:1.5, 玉ねぎ:1 | ジャガイモ:2.33, ニンジン:2, 玉ねぎ:1.33 |
作業の割り当てを考える
田中さん:
- 田中さんはAの包丁でジャガイモを切るのが最も効率的(0.67分)
- 田中さんはCの包丁でニンジンを切るのが効率的(1.5分)
- 田中さんはBの包丁で玉ねぎを切るのが効率的(1分)
山田さん:
- 山田さんはAの包丁でジャガイモを切る(1分)
- 山田さんはBの包丁でニンジンを切る(2分)
- 山田さんはBの包丁で玉ねぎを切る(1分)
割り当て
- ジャガイモ30個を田中さんと山田さんで15個ずつ分けて切る
- ニンジン10本を田中さんと山田さんで5本ずつ分けて切る
- 玉ねぎ25個を田中さんが12個、山田さんが13個切る
田中さんの総時間:
- ジャガイモ:15個 × 0.67分 = 10.05分
- ニンジン:5本 × 1.5分 = 7.5分
- 玉ねぎ:12個 × 1分 = 12分
- 合計:10.05 + 7.5 + 12 = 29.55分
山田さんの総時間:
- ジャガイモ:15個 × 1分 = 15分
- ニンジン:5本 × 2分 = 10分
- 玉ねぎ:13個 × 1分 = 13分
- 合計:15 + 10 + 13 = 38分
結果
田中さんの作業時間29.55分、山田さんの作業時間38分で、最終的に両方が終わるのは38分です。このような割り当てで、全体の作業時間を最小化できます。
検討
とてもそれらしい回答が得られました。3.5と比較すると、問題の意図が上手く伝わっており、「包丁を使う効率が良い」の意味と二人で合わせてこの数の野菜を切ればよいことが理解できています。全て切るのにかかる時間も大幅に短縮されました。
一点、問題として、野菜の個数割り当てにやや煩雑さを感じます。田中さんは山田さんより約8分早く自分の野菜を切り終えてしまうため、無駄な時間が生じることになります。この待ち時間も残っている野菜を切るなどの分業が必要ではないでしょうか。
これも4-oに聞いてみましたが、田中さんが残った時間で野菜を切ることは理解できても、山田さんの総時間も短縮できることがうまく把握できないようでした。
結論
GPT-4oは従来のモデルよりも難しい問題の理解ができるようでした。しかし、完璧な回答は得られないため、全てをGPTに頼って何かを解決するには向いていません。あくまでも、理解への一助として用いるのが最適と言えそうです。
まとめ
制限があれど、無料で高度なAIが使用できるのは、日常生活をより充実させられそうですね。学習データやネット上に流してよいのか情報の取り扱いに注意しての利用をおすすめします。是非、進化したGPTを使って効率化を図ってみてください。
参考文献
日経クロステック, OpenAIが次世代AIモデル「GPT-4o」、次なる競争軸に「スピード」と「使い勝手」浮上, 2024年5月24閲覧
OpenAI, How can I access GPT-4, GPT-4 Turbo and GPT-4o?
2024年5月閲覧