OpenAIがFlex処理を発表、AIモデル利用料を半減し競争力強化へ

Contents

概要
ポイント
詳しい記事の内容はこちらから
- 参照元について

概要

OpenAIは競合他社に対抗するため、Flex processingという新しいAPIオプションを開始した。
これは応答速度を遅くし、リソースの利用不可も許容する代わりに、AIモデルの利用コストを半額に抑える仕組みである。
Flex processingはベータ版として最近リリースされたo3とo4-miniの推論モデル向けに提供されており、低優先度や評価・データ強化・非同期処理などの非実稼働タスクに適しているとされる。
コスト削減効果はモデルごとに異なり、o3では入力トークン5ドル／1百万トークン、出力トークン20ドル／1百万トークンから半額の価格設定となった。
o4-miniでは、Flex適用後に入力トークンは0.55ドル／1百万トークン、出力トークンは2.20ドル／1百万トークンに低下した。
この Flex導入の背景には、先端AIの価格高騰と、Googleなどの競合がコスト効率の良い新モデルを次々とリリースしている状況がある。
Googleは最近、より低コストな推論モデルのGemini 2.5 Flashも展開しており、性能も同等または上回るとされる。
OpenAIはFlex価格の告知とともに、利用者のID認証を義務付け、特にティア1-3の利用者はID検証を完了しなければo3や他のモデルの利用に制限がかかると明示した。
これらの認証は、悪意ある行為者の利用を抑止し、利用ポリシー違反を防止する目的も含まれている。