概要
スタンフォード大学とワシントン大学のAI研究者たちは、クラウドコンピュートクレジットを利用して、わずか50ドル以下でAI「推論」モデルを訓練しました。このモデル「s1」は、数学とコーディング能力を測定するテストで、OpenAIのo1やDeepSeekのR1といった最先端の推論モデルと同等の性能を発揮します。s1モデルはGitHubで公開されており、訓練に使用したデータとコードも提供されています。研究者たちはオフ・ザ・シェルフのベースモデルから出発し、他のAIモデルから推論能力を抽出する蒸留と呼ばれるプロセスを通じて微調整を行いました。このアプローチは、バークレーの研究者が450ドルで推論モデルを作成した方法と同じです。s1は、GoogleのGemini 2.0 Flash Thinking Experimentalから蒸留されています。小規模な研究チームが少額でAIモデルを再現するこの手法は、大規模AI研究所から反発を受けていますが、AIモデルのコモディティ化について新たな議論を呼んでいます。
ポイント
- スタンフォード大学とワシントン大学の研究者が、50ドル以下でAI「推論」モデルを訓練成功。
- s1モデルは最先端の推論モデルと同等の性能を発揮し、GitHubで公開されている。
- s1は蒸留を用いてGoogleの推論モデルから微調整された。
詳しい記事の内容はこちらから
情報の信ぴょう性
プロフィール
TechCrunchは、2005年6月にマイケル・アーリントンとキース・ティアーによって設立されたテクノロジーニュースサイトです。
本社はカリフォルニア州サンフランシスコにあります。
TechCrunchは、主にスタートアップやハイテク企業に関するニュース、レビュー、インタビューなどを提供しています。
2010年にはAOLによって買収され、その後、2021年にはApollo Global ManagementがTechCrunchを含むベライゾンメディアの資産を買収しました。
TechCrunchは、毎年世界各地で開催される「TechCrunch Disrupt」というイベントでも知られています。
信ぴょう性
TechCrunchは、信頼性の高い情報源とされていますが、一部の批判もあります。
Ad Fontes Media(※1)によると、TechCrunchは「信頼できる」情報源として評価されており、中立的な報道を行っているとされています。
ただし、一部の記事にはバイアスが見られることもあるため、常に複数の情報源を参照することが重要です。
※1
Ad Fontes Mediaは、2018年にヴァネッサ・オテローによって設立された非営利団体で、メディアの信頼性と偏見を評価することを目的としています。彼らは「メディア偏見チャート」を提供しており、これはメディアの政治的偏見と信頼性を視覚的に示すものです。