Stability AIとArmが提携、AI音声生成モデルをモバイル向けに最適化

Contents

概要
ポイント
詳しい記事の内容はこちらから
- 参照元について

概要

AIスタートアップのStability AIは、チップメーカーArmと提携し、AIモデル「Stable Audio Open」をモバイルデバイス向けに提供します。このモデルは音声効果を生成できるもので、Armチップを搭載したデバイス上で動作します。

現在、多くのAI音声生成アプリはクラウド処理に依存しているため、オフラインでは利用できません。また、一部の音声生成モデルは著作権で保護されたコンテンツを使用しており、知的財産権のリスクを伴います。しかし、StabilityはStable Audio Openがロイヤリティフリーの音声データのみで訓練されていると主張しています。

Stable Audio Openは、テキストから音声を生成でき、例えば「夕暮れ時の穏やかな海の波」といった説明から音を作り出します。Armとの共同作業により、生成時間を30倍短縮し、11秒の音声を約8秒で生成できるようになりました。

なお、最適化されたStable Audio Openは現時点ではダウンロードできませんが、将来的には消費者向けアプリやデバイスへの展開を目指すことが示唆されています。StabilityのCEOは、生成AIがクリエイティブの生産プロセスを支えるために、より多くの場でモデルとワークフローが利用可能であることの重要性を強調しました。

さらに、StabilityはArmと協力してStable Audio Openのモバイル向けの最適化を進めています。最近、Stabilityは新しいCEOを任命し、キャメロン監督を取締役に迎え、新たな画像生成モデルも公開しました。