Connect with us

LiveKit、ボイスAIインフラの熱狂を受け、100億ドルを超える評価額に到達

資金調達

LiveKit、ボイスAIインフラの熱狂を受け、100億ドルを超える評価額に到達

mm

LiveKitは、シリーズCラウンドで1億ドルを調達し、ボイスAIインフラ企業として100億ドルの評価額に到達したことを発表した。 この資金調達により、LiveKitは、ヘルスケアからカスタマーサポートまで、業界全体に広がるボイスAIアプリケーションの重要なピースとなった。

Index Venturesがラウンドを主導し、Salesforce Ventures、Hanabi Capital、および既存の投資家であるAltimeter CapitalとRedpoint Venturesが参加した。 この資金調達により、LiveKitの総資金調達額は1億8,300万ドルとなった。

LiveKitは、市場で最も注目度の高いAI製品の背後にあるリアルタイムオーディオとビデオインフラを提供している。 最も著名な顧客はOpenAIで、LiveKitの技術により、ChatGPTのAdvanced Voice Modeが可能になり、ChatGPTの800万以上の週間ユーザーがAIアシスタントと自然な会話を楽しむことができる。 その他の顧客には、xAI、Salesforce、Tesla、Meta、Spotify、911緊急オペレーター、メンタルヘルスケア提供者などが含まれる。

LiveKitが解決したWebRTCの問題

LiveKitの技術的な背景は、ボイスAI企業がなぜ顧客として現れるのかを説明している。 インターネット上でのリアルタイムオーディオ伝送には、低遅延通信用に設計されたWebRTCプロトコルが必要である。 ただし、WebRTCを直接実装するには、多くのAI企業が自分で解決したくない複雑さとスケーリングの課題が伴う。

LiveKitは、WebRTCの展開を簡素化するオープンソースインフラを構築した。 その後、会社は、声とビデオデータをルーティングするために最適化されたグローバルなデータセンターのネットワークに拡大し、毎年、声エージェントとユーザー間で、ウェブ、モバイル、電話チャネルを介して数十億回の通話を処理している。

OpenAIが2024年10月にRealtime APIを立ち上げたとき、会社はLiveKitと直接提携し、開発者がChatGPTの声機能と同じ技術を使用してアプリを構築するためのツールを提供した。 その提携により、LiveKitは、声AIアプリケーションを構築する開発者コミュニティ全体で認知度を高め、多くの場合、デフォルトのインフラストラクチャ選択肢となった。

ボイスAIのインフラストラクチャの瞬間

資金調達は、より広範なパターンを反映している。 AIアプリケーションが成熟するにつれて、それらを可能にするインフラストラクチャ企業が重要な資本を引き付ける。 Databricksは最近、1340億ドルの評価額で資金調達し、データとAIプラットフォームの強さを示した。 Cerebrasは、OpenAIと推論コンピューティングに関する100億ドルの契約に署名した。 LiveKitのユニコーン評価額は、同じ論理に従っている。 AIゴールドラッシュのためのピックとシャベル。

ボイスAI市場は、消費者向けチャットボットを超えて急速に拡大している。 金融サービス企業は、顧客認証とアドバイザリーサービスにボイスAIを使用している。 ヘルスケア提供者は、患者受け入れとトリアージにボイスAIを展開している。 小売業者は、ボイス対応のショッピングアシスタントを構築している。 それぞれの場合、基盤となるインフラストラクチャは、認識できない遅延でオーディオを提供する必要がある。 これは、LiveKitが専門とするものである。

LiveKitのエージェントフレームワークは、シリーズBと同時に2025年4月に立ち上げられ、ボイスAIエージェントの構築と展開のためのプラットフォームを提供している。 時期は偶然ではなかった。 ボイスAIは、ChatGPT内の機能から、業界全体にわたる数千のアプリケーションに急激に広がった。 LiveKitは需要を予測し、それを捉えるための開発者ツールを構築した。

次に何が起こるか

会社は、資金を使用して、コンピューティング、ストレージ、ネットワークサービスを拡大し、ボイスドリブンとコンピュータビジョンのアプリケーション向けのインフラストラクチャをスケーリングすることを計画している。 LiveKitは、2026年が、世界中の数千のユースケースでボイスAIが広く展開される年になると予測している。

その予測は、主要なAI研究所が向かっている方向と一致している。 OpenAIは、AIとの対話の主なインターフェイスとしてボイスを強調している。 GoogleのGeminiには、製品スイート全体にわたるボイス機能が含まれている。 Anthropicは、Claudeのボイス機能を構築している。 これらのモデルが改善されると、リアルタイムでその応答を提供できるインフラストラクチャの需要はさらに高まるだろう。

ボイスAIアプリケーションを構築する開発者にとって、LiveKitのユニコーン評価額は、インフラストラクチャ層が成熟していることを示している。 パンデミック時のZoom時代にオープンソースプロジェクトとして始まった会社は、今や展開されているボイスAI時代の重要なインフラストラクチャとなっている。

Alex McFarlandは、人工知能の最新の開発を探求するAIジャーナリスト兼ライターです。彼は、世界中の数多くのAIスタートアップや出版物と共同しています。