Google AI音声入力のニュース概要

グーグルは、iOS向けにオフライン優先の音声入力アプリ「グーグルAIエッジ・エロクエント」をリリースしました。
このアプリは、ウィスパー・フローやスーパーウィスパーなどの競合製品に対抗するものです。
無料でダウンロードでき、ジェマをベースとした自動音声認識(ASR)モデルをダウンロードすれば、すぐに音声入力を開始できます。
アプリ内ではリアルタイムの文字起こしを確認でき、一時停止すると「えー」や「あー」といったフィラーワードが自動的に削除され、テキストが洗練されます。
テキストの下部には、「要点」「フォーマル」「短縮」「拡張」といった変換オプションがあります。
クラウドモードをオフにすれば、ローカル処理のみで使用することも可能です。
クラウドモードがオンの場合、アプリはクラウドベースのジェミニモデルを使用してテキストのクリーンアップを行います。
グーグルAIエッジ・エロクエントは、必要に応じてGmailアカウントから特定のキーワード、名前、専門用語をインポートできます。
また、カスタムワードをリストに追加することも可能です。
アプリは文字起こしセッションの履歴を表示し、すべてのセッションを検索できます。
過去のセッションで発言された単語、1分あたりの単語数、発言された総単語数などを確認できます。
グーグルは、このアプリを「自然な会話とプロフェッショナルで使いやすいテキストとの間のギャップを埋めるように設計された高度な音声入力アプリ」と説明しています。
現在、iOSでのみ利用可能ですが、アプリストアの説明にはAndroid版についても言及されています。
将来的には、Androidシステム全体で利用できるデフォルトキーボードとして設定したり、ウィスパー・フローのようなフローティングボタン機能を使用したりできるようになる予定です。
AIを活用した文字起こしアプリの人気が高まる中、グーグルもこのトレンドに参入しました。
このテストが成功すれば、Androidの文字起こし機能も改善される可能性があります。



AI文字起こしの注目ポイント

  1. グーグルは、オフライン対応の音声入力アプリ「AI Edge Eloquent」をiOS向けにリリースし、競合他社に挑戦。
  2. GemmaベースのASRモデルを使用し、録音内容から「ウム」「アー」などのフィラーワードを自動で除去・整形。
  3. テキストの要約、フォーマル/カジュアル変換が可能で、Android版も計画中。システム全体で利用できるキーボードにも。




音声入力市場の分析・解説

このアプリの登場は、単なる音声入力ツールの進化ではありません。
AIによる文字起こし市場におけるGoogleの本格参入を意味し、プライバシーを重視するユーザー層への訴求が強まるでしょう。
オフライン処理を可能にした点は、セキュリティ意識の高い企業や、ネットワーク環境が不安定な場所での利用を促進すると考えられます。

特に注目すべきは、Gemmaという自社開発のAIモデルを活用している点です。
これにより、Googleは他社への依存度を下げ、独自の技術力をアピールできます。
また、Gmailとの連携機能は、ビジネスシーンでの利便性を高め、プロフェッショナルな利用を促進するでしょう。

今後は、Android版のリリースに加え、OS標準のキーボードへの統合が予想されます。
これにより、AIによる文字起こしがより身近な存在となり、音声入力の普及を加速させる可能性があります。
さらに、リアルタイムでのフィラーワード除去や、テキストの変換オプションは、他の追随を許さない差別化要因となるでしょう。

※おまけクイズ※

Q. グーグルAIエッジ・エロクエントのアプリ内で、テキストを変換できるオプションとして含まれないものは?

ここを押して正解を確認

正解:翻訳

解説:記事内では「要点」「フォーマル」「短縮」「拡張」の変換オプションが挙げられていますが、「翻訳」については言及されていません。




まとめ

【衝撃】AI文字起こしが進化!Google新アプリ、オフラインでも「えー」を消し去る!の注目ポイントまとめ

グーグルがiOS向けに、オフラインでも使える音声入力アプリ「AI Edge Eloquent」をリリースしました。フィラーワードの自動除去やテキストの言い換え機能が便利で、議事録作成などが効率化されそうです。プライバシーを重視する方や、ネット環境が不安定な場所での利用にも安心ですね。

まずはiOS版ですが、Android版も登場予定とのこと。今後のOS標準キーボードへの統合にも期待したいです。AIによる文字起こしが、もっと身近になる一日も近いかもしれません。

関連トピックの詳細はこちら