コヒアの多言語モデル「タイニー・アイヤ」の概要

エンタープライズAI企業のコヒアが、インドAIサミットで新しい多言語モデルファミリー「タイニー・アイヤ」を発表しました。
このモデルはオープンウェイトであり、70以上の言語をサポートし、インターネット接続なしでラップトップなどの日常的なデバイスで動作します。
コヒア・ラボが開発したこのモデルは、ベンガル語、ヒンディー語、パンジャーブ語、ウルドゥー語、グジャラート語、タミル語、テルグ語、マラーティー語などの南アジア言語にも対応しています。
ベースモデルは33.5億のパラメータを持ち、ユーザーコマンドへの追従性を高めた「タイニーアイヤ・グローバル」や、地域特化型の「タイニーアイヤ・アース」(アフリカ言語)、「タイニーアイヤ・ファイア」(南アジア言語)、「タイニーアイヤ・ウォーター」(アジア太平洋、西アジア、ヨーロッパ言語)も提供されます。
これらのモデルは、エヌビディア製H100 GPU64基を使用した比較的小規模なコンピューティングリソースで学習されており、ネイティブ言語話者を対象としたアプリケーション開発に最適です。
デバイス上で直接動作するため、オフライン翻訳などの用途にも活用でき、従来のモデルよりも少ない計算能力で済みます。
インドのような言語的多様性の高い国では、常時インターネット接続なしで多様なアプリケーションやユースケースが可能になります。
モデルはハギングフェイスやコヒアプラットフォームで利用可能で、開発者はローカル展開のためにダウンロードできます。
同社は学習および評価データセットも公開し、技術レポートも発表する予定です。
コヒアのCEOは、同社が「まもなく」株式公開する計画であることを示唆しており、2025年末には年間経常収益2億4000万ドルを達成しました。




オフライン対応の70言語モデル注目ポイント

  1. コヒア社が発表した「タイニー・アイヤ」は、70言語以上に対応し、オフラインでも動作するオープンウェイトモデルです。
  2. 南アジア言語に特化したモデルや、地域別のモデルも展開され、各コミュニティに合わせた自然なAI体験を目指しています。
  3. NVIDIA H100 GPU 64基で学習され、研究者や開発者がネイティブ言語話者向けのアプリ開発に活用しやすいのが特徴です。

AI多言語モデルのオフライン活用分析・解説

コヒア社が発表した「タイニー・アヤ」は、オープンウェイトで70以上の言語に対応し、オフラインでも動作する多言語モデル群です。
特に南アジア言語への対応は、インドのような言語的多様性を持つ地域でのアプリケーション展開を加速させるでしょう。
NVIDIA H100 GPU 64基という比較的 modest な計算資源で学習された点は、リソース効率の良さを示唆しています。
これにより、開発者はデバイス上で直接動作するオフライン翻訳などの機能を容易に実装できるようになります。
将来的に、地域特化型モデルのさらなる進化や、より多くの言語への対応が期待されます。
この技術は、グローバルな情報アクセスとローカルコミュニティのエンパワーメントの両方に貢献する可能性を秘めています。

※おまけクイズ※

Q. コヒア社がインドAIサミットで発表した、70以上の言語をサポートし、インターネット接続なしでラップトップなどの日常的なデバイスで動作する新しい多言語モデルファミリーは何と呼ばれていますか?

ここを押して正解を確認

正解:タイニー・アイヤ

解説:記事の概要部分で、コヒア社が新しい多言語モデルファミリー「タイニー・アイヤ」を発表したと述べられています。




詳しい記事の内容はこちらから

参照元について