Chat GPT、Gemini、Claude、各生成AIのAPI料金を比較しやすいようにまとめました。
モデル | 入力料金(単位) | 出力料金(単位) |
---|---|---|
OpenAI GPT-4o | $2.50 / 1M tokens | $10.00 / 1M tokens |
OpenAI GPT-4o mini | $0.15 / 1M tokens | $0.60 / 1M tokens |
Claude 3 Opus | $15.00 / 1M tokens | $75.00 / 1M tokens |
Claude 3.5 Sonnet | $3.00 / 1M tokens | $15.00 / 1M tokens |
Claude 3.5 Haiku | $0.25 / 1M tokens | $1.25 / 1M tokens |
Gemini 1.5 Pro | $1.25 / 1K文字 | $3.75 / 1K文字 |
Gemini 1.5 Flash | $0.01875 / 1K文字 | $0.075 / 1K文字 |
tokensについて
トークン数と日本語の文字数の関係は、使用する文字の種類(漢字、ひらがな、カタカナ)や文脈によって変動します。一般的な目安としては以下の通りです。
日本語の場合:
- 1トークン ≈ 1.5〜2文字
- つまり、1文字 ≈ 0.5〜0.7トークン
具体例:
Copy「こんにちは」 - 5文字(約3トークン)
「吾輩は猫である」 - 7文字(約4〜5トークン
)
ただし、これは非常に大まかな目安で、実際には以下のような現況があります。
- 漢字は文字あたりのトークン数が多くなる傾向
- ひらがなやカタカナは文字あたりのトークン数が少なくなる傾向
- 句読点や特殊文字も1トークンとしてカウントされることがある
- 文脈やモデルによってトークン化の方法が異なる
そのため、正確なトークン数を知りたい場合は、各モデルが提供するトークンカウンターを使用することをお勧めします。
注意点
質問を重ねる場合は、過去のやり取りを送信するため、その分の料金がかかります。
例:
user「こんにちは」
assistant「こんにちは!何かお手伝いできることはありますか?」
user「1+1の答えを教えて?」
assistant「こんにちは!何かお手伝いできることはありますか?」
user「1+1の答えを教えて?」
といったやり取りをする場合、以下のようにtokenを消費します。
1回目の入力: 6token
user「こんにちは」(6token)
1回目の出力:26token
assistant「こんにちは!何かお手伝いできることはありますか?」(26token)
2回目の入力:47token
user「こんにちは」(6token)
assistant「こんにちは!何かお手伝いできることはありますか?」(26token)
user「1+1の答えを教えて?」(15token)
user「こんにちは」(6token)
1回目の出力:26token
assistant「こんにちは!何かお手伝いできることはありますか?」(26token)
2回目の入力:47token
user「こんにちは」(6token)
assistant「こんにちは!何かお手伝いできることはありますか?」(26token)
user「1+1の答えを教えて?」(15token)
過去の会話を送信するかどうかは、開発者側の判断です。会話を重ねるようなシステムを開発する場合、一定回数で会話をクローズさせる必要があります。
その他
DALL·E 3(OpenAI の 画像生成)
1024×1024 | $ 0.04 |
---|---|
1024×1792 or 1792×1024 | $ 0.08 |
正方形と長方形で料金が違います。画像生成は料金が高いので、使い過ぎには注意が必要です。
gpt-3.5-turbo fine tuning(OpenAI の トレーニングデータ使用)
– | 入力 1000 token | 出力 1000 token | 学習 1000token |
---|---|---|---|
gpt-3.5-turbo fine tuning | $ 0.003 | $ 0.006 | $0.008 |
トレーニングデータについては、GPT 4 はまだ使えないようです。