Vordenker

Die Persönlichkeit Ihres KI-Systems ist ebenso wichtig wie dessen IQ — und wird den Erfolg der Unternehmensbereitstellung bestimmen

Published April 15, 2026

Andrew Missey, CTO & Cofounder, Convos

A woman and a man standing on a high-rise balcony looking at a glowing data visualization that blends sharp blue geometric lines with soft amber waves, symbolizing the balance between AI benchmarks and personality.

Die meisten Unternehmen wählen noch immer KI-Modelle auf der Grundlage von Benchmarks aus. In der Praxis ist das jedoch selten das, was darüber entscheidet, ob diese Systeme tatsächlich funktionieren.

Bisher haben die meisten Gespräche über große Sprachmodelle in Unternehmensumgebungen von Benchmarks dominiert werden. Teams neigen dazu, messbare Leistungen wie die Intelligenz, die Kodierstärke, die Genauigkeit bei der Zusammenfassung oder die mathematische Argumentation eines Modells zu bevorzugen.

Aber wenn Teams beginnen, über die Experimentierphase hinauszugehen und sich auf die tatsächliche Bereitstellung im großen Maßstab einzulassen, werden andere wichtige Faktoren, die von den meisten CEOs stark übersehen werden, sich schnell als ebenso entscheidend für den Erfolg eines Unternehmens erweisen.

Die Einsetzbarkeit von KI

Rohe Intelligenz und analytische Fähigkeit sind offensichtlich wichtig, aber die am meisten unterschätzte Variable bei der Bereitstellung von KI in Unternehmen ist die Persönlichkeit. Persönlichkeit bezieht sich im Kontext von großen Sprachmodellen auf die konsistente Stimme, den Ton und das Verhalten, das ein Modell in Interaktionen vermittelt. Es ist das, was ein KI-System kohärent und zuverlässig macht.

Wenn Unternehmen KI implementieren, müssen sie den gleichen Ansatz wie bei der Einstellung eines menschlichen Mitarbeiters verfolgen: Sie müssen nicht nur bewerten, wie gut ein Modell eine Aufgabe erledigen kann, sondern auch seine Einstellung zur Arbeit, seine Kommunikationsfähigkeit und seine Einpassung in den größeren Arbeitsablauf.

Die Fähigkeit eines Modells, Konsistenz zu wahren, angemessen zu reagieren und Nuancen in verschiedenen Kontexten zu handhaben, kann einen erheblichen Einfluss auf die Geschäftsergebnisse haben. Ein technisch brillantes KI-System, das langsam reagiert, im Ton schwankt oder nuancierte Interaktionen falsch handhabt, kann von Unternehmen falsch eingesetzt werden, was zu frustrierten Nutzern, geringerer Engagement und letztendlich geringerem Erfolg des KI-Systems und des Unternehmens führen kann.

Dies ist besonders wichtig in Branchen wie Kundensupport, politischer Ansprache oder interner Kommunikation, da subtile Veränderungen im Ton oder in der Formulierung zwischen Antworten Verwirrung stiften, Vertrauen untergraben und das Engagement verringern können. Wie bei Menschen gibt es kein einzelnes Traummodell, das in jeder Kategorie die Konkurrenz übertrifft. Einige Modelle sind besser darin, analytische Aufgaben wie Kodieren oder Mathematik zu erledigen, während andere bei konversationalem Schreiben und Zusammenfassung von Meetings viel besser abschneiden.

Aber für Teams, die auf diesen Systemen aufbauen, ist es eine Herausforderung, dass diese Eigenschaften nicht fest sind.

Ein sich bewegendes Ziel

Die KI-Landschaft entwickelt sich schneller, als die meisten Organisationen mithalten können. Neue Versionen werden häufig veröffentlicht, und die Leistungsmerkmale können von einem Update zum nächsten wechseln. Die Gemini-Modellreihe von Google ist ein aktuelles Beispiel.

Gemini 2.0 Pro wurde im Februar 2025 veröffentlicht und sofort als Flaggschiff-Modell für Entwickler und Unternehmen, die es für Kodieren und komplexe Anfragen weltweit nutzen, gefeiert.

Es kam mit dem, was zu diesem Zeitpunkt das größte Kontextfenster war, das Google je angeboten hatte, mit zwei Millionen Token, was es ermöglichte, umfassend große Mengen an Informationen auf einmal zu analysieren und zu verstehen, während es gleichzeitig in der Lage war, Tools wie Google Search zu nutzen und sogar Code zu schreiben.

Für Teams, die Systeme bauten, die große Datenmengen schnell und genau verarbeiten mussten, schien es die klare Wahl. Aber innerhalb weniger Wochen veröffentlichte Google Gemini 2.5 Pro, das sofort die Bestenlisten anführte und seinen Vorgänger übertraf mit Verbesserungen bei Kodieren, Mathematik und Wissenschaft.

Über Nacht war das Modell, das gerade noch die beste Option auf dem Markt war, bereits weniger als zwei Monate nach dem Start veraltet. Aber frühe Anwender bemerkten sofort, dass die Änderungen nicht nur inkrementell oder analytisch waren — die gesamte Persönlichkeit von Gemini war über Nacht geändert worden. Mehrere Entwickler gingen so weit, zu sagen, das KI-System sei nach seinem Update “lobotomisiert” worden.

Sie beschwerten sich, dass das KI-System buchstäblich “dümmer” wurde — es produzierte konsistent langsamere Antworten, weniger kohärente Ausgaben und zeigte Inkonsistenzen bei der Handhabung von Anfragen, mit denen es zuvor keine Probleme hatte, und Aufgaben, die einst flüssig waren, wurden plötzlich starr.

Und hier beginnt die Strategie eines Unternehmens bei der KI-Bereitstellung grundlegend zu ändern.

Jenseits der Benchmarks

Auf dem Papier sollte Gemini 2.5 Pro der klare Sieger mit seinen umfassenden Verbesserungen bei Fähigkeit und Sicherheit sein.

Aber in der Praxis änderten diese Änderungen vollständig, wie zuverlässig das Modell war, wie es sich verhielt, auf Anfragen reagierte und letztendlich Teams, die gerade viel Geld und unzählige Stunden in den Bau dieser Systeme investiert hatten, zurück zum Ausgangspunkt brachte, wenn die neuen Fähigkeiten des Modells nicht mit ihrer bestehenden Pipeline übereinstimmten.

Selbst kleine Veränderungen im Verhalten können Systeme, die auf Konsistenz und Vorhersehbarkeit aufbauen, stören. Dies schafft ein reales operatives Risiko, wenn ein Unternehmen eng an ein einzelnes Modell gekoppelt ist, da jedes Update sofort Instabilität in Teams verursachen kann, die auf diese Systeme angewiesen sind.

Um dies zu bekämpfen, haben viele fortschrittliche Unternehmen begonnen, eine Multi-Modell-Strategie umzusetzen, bei der sie verschiedene Aufgaben an die Modelle weiterleiten, die am besten für sie geeignet sind, anstatt sich auf ein Modell zu verlassen, um alles zu erledigen.

Dieser Ansatz verbessert nicht nur die Leistung, die auf jede Aufgabe zugeschnitten ist, sondern reduziert auch das Risiko, das mit der KI-Implementierung verbunden ist, da, wenn ein Modell nach einem Update verschlechtert wird, es das gesamte System, das von ihm abhängt, nicht mit sich in den Abgrund reißt, da es Backup-Optionen gibt.

Einfach ausgedrückt sind die Persönlichkeit und Zuverlässigkeit eines KI-Systems ebenso wichtig wie seine rohe Intelligenz, wenn es darum geht, das Modell in einer Arbeitsumgebung zur Erledigung verschiedener Aufgaben anzuwenden. Diese Veränderung im Denken stellt eine grundlegende Änderung dar, wie Unternehmen nicht länger nur ein “schlaues Werkzeug” kaufen, sondern ein ganzes digitales Infrastruktursystem aufbauen und verwalten.

Um nicht nur zu überleben, sondern in der heutigen Geschäftswelt zu gedeihen, müssen Teams Pipelines etablieren, die in der Lage sind, unterschiedliche Modelle je nach Aufgabe ein- und auszutauschen und ständig zu überwachen, wie Updates die Leistung und die Interaktionsqualität beeinflussen.

Letztendlich werden die Modelle selbst weiterhin mit einem Tempo evolvieren, das schwer zu verfolgen ist. Aber Unternehmen, die den Wandel planen, Redundanz aufbauen und KI als Werkzeug und Teammitglied behandeln, werden diejenigen sein, die diese schnellen Veränderungen in einen Wettbewerbsvorteil umwandeln.

Andrew Missey, CTO & Cofounder, Convos

Andrew Missey ist der Mitbegründer von Convos, früher PubSent, einer zweigleisigen, künstlicher Intelligenz-gesteuerten Textplattform, die politischen Strategen, Kampagnen, Non-Profit-Organisationen und Interessengruppen hilft, personalisierte, faktenbasierte Wählergespräche im nationalen Maßstab zu führen, wo er das Produkt und die Technik leitet. Vor Convos arbeitete Andrew als Software-Ingenieur für mehrere Unternehmen, darunter ein in Seattle ansässiges, von Risikokapitalgebern unterstütztes KI-Startup, das nationale Lebensmittel- und Einzelhandelsmarken wie Starbucks, Crumbl und Mod Pizza bedient. Zusätzlich spricht Andrew fließend Javascript, Python und Typescript.

Unite.AI

Die Persönlichkeit Ihres KI-Systems ist ebenso wichtig wie dessen IQ — und wird den Erfolg der Unternehmensbereitstellung bestimmen

Die Einsetzbarkeit von KI

Ein sich bewegendes Ziel

Jenseits der Benchmarks

You may like