スポンサーリンク
Contents
スポンサーリンク
概要
Metaの幹部は、同社の新しいAIモデルが特定のベンチマークで優れた成績を残すためにトレーニングされ、その弱点を隠しているとの噂を否定しました。
メタの生成AI担当副社長アハマド・アルダーレは、Xに投稿し、Llama 4 MaverickおよびLlama 4 Scoutモデルが「テストセット」でトレーニングされたというのは「単なる嘘だ」と述べました。
AIのベンチマークにおいて、テストセットはモデルのパフォーマンスを評価するためのデータ集であり、これに基づいてトレーニングすることは、モデルのスコアを実際以上に膨らませる可能性があります。
週末に広まったこの根拠のない噂は、Metaのベンチマーキングプラクティスに抗議して辞職したと主張するユーザーが中国のSNSに投稿したことから始まったようです。
MaverickとScoutが特定のタスクでパフォーマンスが低いとの報告や、メタがMaverickの実験的な未発表バージョンを使用してLM Arenaでのベンチマークスコアを向上させた決定も、噂に拍車をかけました。
アルダーレは、一部のユーザーがMaverickとScoutの「混合品質」を体験していることを認めました。
「モデルを準備が整い次第公開したため、すべての公共実装が整うまで数日かかると予想しています。バグ修正やパートナーのオンボーディングに取り組んでいきます。」と彼は語りました。
ポイント
- Metaの幹部は、AIモデルが特定のベンチマークで良好に見えるよう訓練されたとの噂を否定した。
- 噂は、Metaのベンチマーク手法に抗議して辞職したユーザーから始まった。
- 一部のユーザーは、MaverickとScoutの品質にばらつきがあると報告している。
詳しい記事の内容はこちらから
参照元について
スポンサーリンク
スポンサーリンク