概要

Laude Instituteは木曜日に、人工知能(AI)の科学と実践を進展させることを目的としたSlingshotsグラントの第1回目を発表しました。

このプログラムは研究者向けの加速器として、学術的な環境では手に入らない資源(資金、コンピューターパワー、製品およびエンジニアリングサポート)を提供します。その見返りとして、受賞者はスタートアップやオープンソースのコードベース、その他の成果物を作成することが求められます。

初回の対象は15のプロジェクトで、特にAIの評価問題に焦点を当てています。既知のプロジェクトには、コマンドラインのコーディングベンチマークであるTerminal Benchや、長年続いているARC-AGIプロジェクトの最新バージョンが含まれています。

その他、AIエージェントの最適化能力を評価するFormula Codeや、ホワイトカラーAIエージェントの包括的なベンチマークを提案するBizBenchなど、新しいアプローチを取るプロジェクトもあります。

CodeClashプロジェクトを率いるJohn Boda Yangもその一員です。CodeClashは、競争ベースの動的フレームワークでコードを評価することを目指しています。Yangは、第三者ベンチマークでの評価が進展を促すと考えつつ、企業固有のベンチマークに依存する未来に懸念を示しています。

ポイント

  1. Laude InstituteはAI研究を支援する「Slingshots grants」の初期グループを発表。
  2. 受賞者はAI評価に関する困難な問題に取り組む15のプロジェクト。
  3. CodeClashなど、新しい競争ベースのAI評価手法が導入される予定。

詳しい記事の内容はこちらから

参照元について

『TechCrunch』のプロフィールと信ぴょう性についてここでは『TechCrunch』の簡単なプロフィール紹介と発信する情報の信ぴょう性についてまとめています。 記事を読む際の参考にし...