スポンサーリンク
Contents
スポンサーリンク
概要
今週のテクノロジーメディア「TechCrunch」では、イーロン・マスクのAIスタートアップxAIが最新のAIモデル「Grok 3」を発表しました。
このモデルは約20万のGPUでトレーニングされ、数学やプログラミングのベンチマークで他の主要モデルを上回っています。
しかし、これらのベンチマークが本当に何を示すのかについては疑問が残ります。
多くのAI企業は自己報告によるベンチマーク結果を提供しており、その信頼性が問われています。
ウィートン大学のイーサン・モリック教授は、より良いテストと独立した評価機関の必要性を指摘しています。
AIの評価基準については、経済的影響や実用性に基づく新たな提案がなされており、議論は続いています。
また、OpenAIは「知的自由」を重視したAI開発への転換を図っており、元CTOのミラ・ムラティは新たなスタートアップを立ち上げています。
さらに、中国のAI企業Stepfunが多言語に対応した音声生成モデル「Step-Audio」を発表しました。
AI業界は急速に進化しており、今後の動向に注目が集まります。
ポイント
- Elon MuskのAIスタートアップxAIが新モデルGrok 3を発表し、性能が向上。
- AIのベンチマークは標準化された測定法だが、実用性に乏しいとの指摘あり。
- 新たなAIベンチマークSWE-Lancerが登場し、AIのコーディング能力を評価。
詳しい記事の内容はこちらから
参照元について
スポンサーリンク
スポンサーリンク