【朗報】AIのトークン消費を100分の1に!コスト削減の革命児エングラムが159億円調達
エングラムによるAIのトークン消費削減ニュース概要
米国のスタートアップ企業であるエングラムが、ステルス状態を脱却し、約159億円の資金調達を発表しました。同社は独自のカートリッジアーキテクチャを用いることで、最先端のAIモデルと同等の性能を維持しつつ、トークン消費量を最大100分の1に削減できると主張しています。企業向けAIにおいてトークン消費に伴うコストの高騰が深刻な課題となる中、この技術は効率的な運用を実現する新たな解決策として注目されています。
同社のアプローチは、推論時にゼロから情報を処理するのではなく、組織独自のデータ群に基づいて圧縮されたメモリ表現を事前学習させる仕組みです。これにより、従来の手法である検索拡張生成が抱えていた計算上の非効率性を回避できるとされています。既にマイクロソフトやノーションといった大手企業が提携し、その技術を検証中です。ただし、性能に関する主張は現時点で第三者による検証が行われておらず、今後の実証が待たれる段階です。
コスト削減を実現する新アーキテクチャの注目ポイント
- 米スタートアップのエングラムが159億円を調達し、独自技術「カートリッジ」でAIのトークン消費量を最大100分の1に削減できると発表しました。
- 同社の技術は、推論時に文書を再学習する従来の手法と異なり、組織固有のデータを事前に圧縮・学習したメモリを用いることでコスト効率を高めます。
- 現時点で性能の主張は第三者による検証を待つ段階であり、導入を検討する際は自社ワークロードでの慎重な実証テストが不可欠となります。
企業向けAIとメモリ効率化に関する分析・解説
エングラムの登場は、AI業界における「メモリ消費のアーキテクチャ革命」を予感させます。
従来の検索拡張生成(RAG)がクエリのたびに膨大な情報を再処理し、GPUリソースを浪費していたのに対し、同社のカートリッジ方式は「推論前の事前学習」というアプローチで計算コストを根本から断ち切ろうとしています。
これは単なる効率化を超え、AIモデルが組織固有の知識を固定化された「長期記憶」として保持する、真の企業向けエージェントを実現するための重要なパラダイムシフトと言えます。
今後、事態は「汎用モデルの性能競争」から「いかに効率的に組織のナレッジをモデルに定着させるか」という「メモリ効率の競争」へとシフトしていくでしょう。
短期的には、マイクロソフトやノーションでの実証実験を通じ、その主張が実用環境でも再現可能かどうかが焦点となります。
中長期的には、この技術が標準化されれば、現在GPUリソースを食い尽くしている企業向けAIの経済性が劇的に改善し、AI導入のハードルがさらに下がることが予測されます。
ただし、特化型ゆえの汎用性の低下というトレードオフを、企業がどこまで許容できるかが普及の鍵を握ることになるはずです。
※おまけクイズ※
Q. エングラムが発表した独自技術により、AIのトークン消費量は最大でどれほど削減できるとされていますか?
ここを押して正解を確認
正解:100分の1
解説:記事の序盤で言及されています。
まとめ

米スタートアップの「エングラム」が、AIのトークン消費を最大100分の1に削減する技術で約159億円を調達しました。独自のメモリ活用により、RAGの非効率さを解消する革新的なアプローチです。性能の真価は第三者検証を待つ必要がありますが、これが実現すれば企業AIのコスト構造は劇的に改善するはずです。汎用性との両立という課題はあるものの、AI導入のハードルを下げる新たな希望として、今後の実証結果に大いに期待したいところです。
関連トピックの詳細はこちら


