Connect with us

Finanzierung

AlphaGo-Erfinder sammelt Rekordsumme von 1 Milliarde Dollar, um KI ohne LLMs zu entwickeln

mm

David Silver, der Pionier des reinforcement learning, der die Entwicklung von AlphaGo bei Google DeepMind leitete, sammelt 1 Milliarde Dollar an Seed-Finanzierung für Ineffable Intelligence, ein in London ansässiges Startup, das auf der Prämisse basiert, dass große Sprachmodelle der falsche Weg zu Superintelligenz sind.

Der von Sequoia Capital geführte Deal wäre die größte Seed-Runde, die jemals von einem europäischen Startup abgeschlossen wurde, wenn er finalisiert wird. Nvidia, Google und Microsoft sind in Verhandlungen, um teilzunehmen, obwohl die Verhandlungen noch laufen und die endgültigen Bedingungen geändert werden könnten. Die Runde bewertet das Unternehmen mit 4 Milliarden Dollar vor Geld.

Silver, der als VP of Reinforcement Learning bei DeepMind tätig war, gründete Ineffable Intelligence im November 2025 stillschweigend und wurde im Januar 2026 zum Direktor ernannt. Die Mission des Unternehmens, wie Silver sie beschrieben hat, ist es, “eine endlos lernende Superintelligenz zu entwickeln, die die Grundlagen aller Kenntnisse selbst entdeckt”.

Diese Beschreibung enthält eine bewusste Provokation. In einer Branche, die Hunderte von Milliarden für die Skalierung von LLMs, die auf Internet-Texten trainiert werden, ausgibt, argumentiert Silver, dass der gesamte Ansatz ein Limit hat.

Der Fall gegen menschliche Daten

Silvers These zieht direkt aus der Arbeit, die ihn berühmt gemacht hat. 2017 veröffentlichten DeepMind-CEO Demis Hassabis und Silver AlphaGo Zero, eine Version von AlphaGo, die ausschließlich durch Selbstspiel mit null menschlichen Spiel-Daten lernte. Es besiegte das ursprüngliche, menschlich trainierte AlphaGo in 100 Spielen mit 0 Niederlagen.

Das Ergebnis schockierte die KI-Gemeinschaft. Ein System, das von Grund auf durch Interaktion und Belohnung allein lernte, erreichte nicht nur menschliches Wissen – es übertraf es so gründlich, dass die menschlich trainierte Version nicht ein einziges Spiel gewinnen konnte.

Silver erweiterte diesen Ansatz durch AlphaZero, das Schach, Shogi und Go von Grund auf meisterte, und MuZero, das lernte, ohne die Regeln des Spiels zu kennen, das es spielte. Jedes System bestätigte die gleiche Schlussfolgerung: Die beste Leistung kommt nicht von der Nachahmung von Menschen, sondern von Lernen durch Erfahrung.

In einem DeepMind-Podcast, der vor seinem Abschied aufgezeichnet wurde, beschrieb Silver zwei Epochen der KI: die aktuelle “Ära der menschlichen Daten” und eine kommende “Ära der Erfahrung”. Kontemporäre LLMs, so argumentierte er, hängen von menschlichen Daten und Feedback ab, was inhärente Einschränkungen schafft. Der Weg zu künstlicher Superintelligenz erfordert es, über menschliches Wissen hinauszugehen.

Dies ist die Philosophie der “Alberta-Schule” – benannt nach der University of Alberta, wo Silver unter dem Reinforcement-Learning-Pionier Rich Sutton studierte. Suttons einflussreicher Essay von 2019 “The Bitter Lesson” argumentierte, dass Methoden, die auf menschlichem Wissen basieren, letztendlich gegen Methoden verlieren, die Rechenleistung und Lernen skalieren. Silver baut ein ganzes Unternehmen auf diesem Prinzip auf.

Ein Wettlauf um Superintelligenz-Startups

Silver ist nicht der erste Elite-Forscher, der ein großes Labor verlässt und außergewöhnliche Summen für ein auf Superintelligenz fokussiertes Venture sammelt. Ilya Sutskever, der ehemalige Chef-Wissenschaftler von OpenAI, startete Safe Superintelligence 2024 mit einer ähnlichen These – dass ein fokussierter Einsatz außerhalb der Drucke eines Produkt-Unternehmens Superintelligenz schneller erreichen kann. SSI hat seitdem Milliarden bei einer Bewertung von über 30 Milliarden Dollar eingesammelt.

Der Vergleich ist aufschlussreich. Beide Forscher verließen Organisationen, die sie halfen definieren. Beide glauben, dass das aktuelle Paradigma – Skalierung von LLMs und Verkauf von Chatbot-Abonnements – ein Umweg ist. Und beide zogen massive Kapital aufgrund ihrer Reputation allein an, bevor sie ein Produkt produzierten oder Ergebnisse veröffentlichten.

Aber die Ansätze divergieren. Sutskever hat wenig öffentlich über die technische Richtung von SSI gesagt. Silver hingegen war explizit: Reinforcement Learning, Selbstspiel und Lernen aus ersten Prinzipien – nicht Sprachmodelle. Während die meisten KI-Labore diskutieren, wie man LLMs besser zum Reasoning bringt, fragt Silver, ob sie überhaupt die Grundlage sein sollten.

Die 1-Milliarde-Dollar-Seed-Runde spiegelt auch wider, wie dramatisch die KI-Finanzierungslandschaft sich verschoben hat. Anthropic näherte sich kürzlich einer Bewertung von 350 Milliarden Dollar. Der Wettbewerbsdruck in der Frontier-KI hat sich intensiviert, da OpenAI, Google und Anthropic neue Modelle in immer schnellerem Tempo ausliefern. Vor diesem Hintergrund ist eine Bewertung von 4 Milliarden Dollar vor Geld für ein vor-Produkt-Unternehmen unter der Leitung eines einzelnen Forschers das neue Normal.

Für Sequoia, die die Runde durch den Managing Partner Alfred Lin und den Partner Sonya Huang führt, ist die Wette einfach: Silver ist einer von vielleicht fünf Menschen, die einen glaubwürdigen Anspruch darauf haben, Systeme entwickelt zu haben, die tatsächlich menschliche Intelligenz in bestimmten Bereichen übertrafen. Wenn Reinforcement Learning der richtige Weg zu allgemeiner Superintelligenz ist, ist er derjenige, der es am wahrscheinlichsten finden wird.

Das Risiko ist ebenso klar. AlphaGo und AlphaZero waren in Bereichen mit klaren Regeln, perfekter Information und gut definierten Belohnungssignalen erfolgreich. Die reale Welt hat none dieser Eigenschaften. Die Skalierung von Selbstspiel über Spiele hinaus in offene Bereiche – Wissenschaft, Ingenieurwesen, Reasoning – ist ein ungelöstes Problem, an dem Silver selbst Jahre bei DeepMind gearbeitet hat, ohne einen definitiven Durchbruch zu erzielen.

Ineffable Intelligences Londoner Basis positioniert es auch als potenziellen Anker für Europas KI-Ambitionen. Der Kontinent hat weltklasse-KI-Forscher hervorgebracht, aber es ist ihm schwergefallen, sie zu halten, da amerikanische Labore höhere Vergütungen und schnellere Skalierungs-Infrastruktur bieten. Eine 1-Milliarde-Dollar-Seed-Runde in Europa, unterstützt von Silicon Valleys führendem Venture-Unternehmen, signalisiert, dass die Geographie der Frontier-KI-Forschung möglicherweise breiter wird – obwohl es zu beachten ist, dass Sequoia, Nvidia, Google und Microsoft alle amerikanische Investoren sind.

Silvers Wette ist, dass die Fixierung der Branche auf LLMs einen lokalen Maximalwert darstellt – beeindruckend, aber letztendlich begrenzt. Die Frage ist, ob Reinforcement Learning die kontrollierten Umgebungen, in denen es gedeiht, verlassen und in der chaotischen, mehrdeutigen realen Welt operieren kann. Eine Milliarde Dollar und eine Karriere, die darauf basiert, die Zweifler zu widerlegen, sagen, dass Silver denkt, es kann.

Alex McFarland ist ein KI-Journalist und Schriftsteller, der die neuesten Entwicklungen im Bereich der künstlichen Intelligenz erforscht. Er hat mit zahlreichen KI-Startups und Veröffentlichungen weltweit zusammengearbeitet.