ElevenLabsが新たに音声認識モデル「Scribe」を発表、99言語に対応した革新技術とは

Contents

概要
ポイント
詳しい記事の内容はこちらから
- 参照元について

概要

ElevenLabsは、1億8000万ドルの資金調達を行ったAIスタートアップで、音声生成技術で知られています。

同社は初のスタンドアロン音声認識モデル「Scribe」を発表し、音声検出分野に進出しました。

評価額33億ドルのこの企業は、豊富な音声ライブラリを活用し、他社に音声認識サービスを提供してきましたが、GladiaやOpenAIのWhisperなどと競争する意向を示しています。

Scribeは99以上の言語をサポートし、25言語以上で5%未満の単語誤り率を達成しています。

英語の精度は97%とされ、フランス語やドイツ語、日本語なども高精度で認識可能です。

同社は、Google Gemini 2.0 FlashやWhisper Large V3をFLEURSおよびCommon Voiceのベンチマークテストで上回ったと報告しています。

CEOのマティ・スタニゼフスキ氏は、音声認識モデルの改善に取り組んでおり、データの注釈付けを行う社内チームを持つことで、より良いモデルを構築できると述べています。

Scribeは、話者の識別や正確な字幕のためのタイムスタンプ、観客の笑い声などの自動タグ付け機能を備えています。

現在、Scribeは録音された音声にのみ対応しており、リアルタイム版も近日中にリリース予定です。

価格は1時間の音声転写で0.40ドルと競争力がありますが、他社はより低価格で提供している場合もあります。

ポイント

ElevenLabsは新たに音声認識モデル「Scribe」を発表し、99言語をサポート。
Scribeは複数言語で高精度を誇り、Google GeminiやWhisperと比較して優れた性能を示す。
同社は競争力を高めるために、リアルタイムバージョンの開発を計画している。

詳しい記事の内容はこちらから

TechCrunch

ElevenLabs is launching its own speech-to-text model | TechCrunch

https://techcrunch.com/2025/02/26/elevenlabs-is-launching-its-own-speech-to-text-model/

ElevenLabs, an AI startup that just raised a $180 million mega-funding round, has been primarily known for its audio-generation prowess. The company took

参照元について

『TechCrunch』のプロフィールと信ぴょう性についてここでは『TechCrunch』の簡単なプロフィール紹介と発信する情報の信ぴょう性についてまとめています。記事を読む際の参考にし...

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

ElevenLabsが新たに音声認識モデル「Scribe」を発表、99言語に対応した革新技術とは

概要

ポイント

詳しい記事の内容はこちらから

参照元について

【衝撃】AIで市場調査が激変！短期間で安価に得られるデータの秘密とは？

Google、AI向けに自然言語で公的データ活用を促進するMCPサーバーを発表

AIバブルは本当に起こるのか？データセンター建設の遅れと需要の不確実性

ソフトウェアの耐用年数と5年ルール：実際の運用・税制・最新事例を徹底解説

『TechCrunch』のプロフィールと信ぴょう性について

AI創薬の新潮流、Latent Labsが自然を超えるタンパク質を創造

ソフトウェアの耐用年数と償却方法を徹底解説。会計処理の最新実務と具体例

【悲報】Facebook Messengerデスクトップアプリが2025年末にサービス終了！大移行へ

【衝撃】メタ、AI投資の裏で2万人超のレイオフか？ザッカーバーグCEOの賭け

【警告】AIチャットボットが妄想を加速？精神疾患リスク者への影響が専門家から提言

【速報】タイ・カンボジア国境で発見！詐欺組織の全貌と125億ドル規模の闇

【衝撃】SNS無限スクロールは“薬物”？内部告発者が暴く中毒性のメカニズム

【速報】プライムビデオ料金が4.99ドルに！広告なし「ウルトラ」新機能も、NBA放映権投資は？

概要

ポイント

詳しい記事の内容はこちらから

参照元について

【衝撃】AIで市場調査が激変！短期間で安価に得られるデータの秘密とは？

Google、AI向けに自然言語で公的データ活用を促進するMCPサーバーを発表

AIバブルは本当に起こるのか？データセンター建設の遅れと需要の不確実性

ソフトウェアの耐用年数と5年ルール：実際の運用・税制・最新事例を徹底解説

『TechCrunch』のプロフィールと信ぴょう性について

AI創薬の新潮流、Latent Labsが自然を超えるタンパク質を創造

ソフトウェアの耐用年数と償却方法を徹底解説。会計処理の最新実務と具体例

【悲報】Facebook Messengerデスクトップアプリが2025年末にサービス終了！大移行へ

【衝撃】メタ、AI投資の裏で2万人超のレイオフか？ザッカーバーグCEOの賭け

【警告】AIチャットボットが妄想を加速？ 精神疾患リスク者への影響が専門家から提言

【速報】タイ・カンボジア国境で発見！詐欺組織の全貌と125億ドル規模の闇

【衝撃】SNS無限スクロールは“薬物”？内部告発者が暴く中毒性のメカニズム

【速報】プライムビデオ料金が4.99ドルに！広告なし「ウルトラ」新機能も、NBA放映権投資は？

【警告】AIチャットボットが妄想を加速？精神疾患リスク者への影響が専門家から提言