スポンサーリンク
Contents
スポンサーリンク
概要
OpenAIは競合他社に対抗するため、Flex processingという新しいAPIオプションを開始した。
これは応答速度を遅くし、リソースの利用不可も許容する代わりに、AIモデルの利用コストを半額に抑える仕組みである。
Flex processingはベータ版として最近リリースされたo3とo4-miniの推論モデル向けに提供されており、低優先度や評価・データ強化・非同期処理などの非実稼働タスクに適しているとされる。
コスト削減効果はモデルごとに異なり、o3では入力トークン5ドル/1百万トークン、出力トークン20ドル/1百万トークンから半額の価格設定となった。
o4-miniでは、Flex適用後に入力トークンは0.55ドル/1百万トークン、出力トークンは2.20ドル/1百万トークンに低下した。
この Flex導入の背景には、先端AIの価格高騰と、Googleなどの競合がコスト効率の良い新モデルを次々とリリースしている状況がある。
Googleは最近、より低コストな推論モデルのGemini 2.5 Flashも展開しており、性能も同等または上回るとされる。
OpenAIはFlex価格の告知とともに、利用者のID認証を義務付け、特にティア1-3の利用者はID検証を完了しなければo3や他のモデルの利用に制限がかかると明示した。
これらの認証は、悪意ある行為者の利用を抑止し、利用ポリシー違反を防止する目的も含まれている。
ポイント
- OpenAIはFlex処理を導入し、AIモデルの使用料金を半額に引き下げた。
- Flex処理は低優先度のタスク向けで、応答時間が遅くなる可能性がある。
- 利用者は新たなID確認プロセスを経てo3モデルにアクセス可能になる。
詳しい記事の内容はこちらから
参照元について
スポンサーリンク
スポンサーリンク


