AIMPACT メッセージ、5月3日(UTC+8)、Sakana AIはハイブリッドアーキテクチャKAMEを発表しました。これにより、ほぼゼロ遅延を維持しながらリアルタイムでバックエンドのLLM知識を注入できます。このシステムは2つの非同期コンポーネントが並行して動作します:フロントエンドはMoshiアーキテクチャに基づくS2Sモジュールで、約80ミリ秒のサイクルで音声を処理し、即座に応答を生成します;バックエンドはSTTコンポーネントと完全なLLMから構成され、部分的な書き起こしを継続的に構築し、oracleストリームをフロントエンドに流し、より良いoracleが到達した場合には途中で応答を修正します。評価では、単独のMoshiが2.05点、KAME+gpt-4.1が6.43点、KAME+claude-opus-4-1が6.23点を獲得し、遅延はすべてMoshiと同等です;リーディングシステムのUnmuteは7.70点を獲得しましたが、遅延は2.1秒に達します。KAMEのバックエンドは独立しており、推論時にLLMを切り替えることができ、再トレーニングは不要です。
Sakana AIはKAMEシステムをリリースし、遅延をほぼゼロに抑えながらより深い知識注入を実現
AIMPACT メッセージ、5月3日(UTC+8)、Sakana AIはハイブリッドアーキテクチャKAMEを発表しました。これにより、ほぼゼロ遅延を維持しながらリアルタイムでバックエンドのLLM知識を注入できます。このシステムは2つの非同期コンポーネントが並行して動作します:フロントエンドはMoshiアーキテクチャに基づくS2Sモジュールで、約80ミリ秒のサイクルで音声を処理し、即座に応答を生成します;バックエンドはSTTコンポーネントと完全なLLMから構成され、部分的な書き起こしを継続的に構築し、oracleストリームをフロントエンドに流し、より良いoracleが到達した場合には途中で応答を修正します。評価では、単独のMoshiが2.05点、KAME+gpt-4.1が6.43点、KAME+claude-opus-4-1が6.23点を獲得し、遅延はすべてMoshiと同等です;リーディングシステムのUnmuteは7.70点を獲得しましたが、遅延は2.1秒に達します。KAMEのバックエンドは独立しており、推論時にLLMを切り替えることができ、再トレーニングは不要です。