Interviews
Phil Hall, Chief Growth Officer bei LXT – Interviewreihe

LXT Chief Growth Officer Phil Halle ist ein ehemaliger Appen-Manager und Forbes Technology Council Mitglied. In seiner Führungsrolle bei Appen leitete er eine Abteilung mit mehr als 1,000 Mitarbeitern und spielte eine Schlüsselrolle dabei, 17 Jahre in Folge ein Umsatzwachstum bei konstant hoher Rentabilität zu erzielen. In seiner aktuellen Rolle bei LXT arbeitet er mit einem handverlesenen Expertenteam zusammen, um ehrgeizige Wachstumsziele zu erreichen.
LXT ist ein aufstrebender Marktführer im Bereich KI-Trainingsdaten zur Unterstützung intelligenter Technologie für globale Organisationen, darunter die größten Technologieunternehmen der Welt. In Zusammenarbeit mit einem internationalen Netzwerk von Mitwirkenden sammelt und kommentiert LXT Daten über mehrere Modalitäten hinweg mit der Geschwindigkeit, dem Umfang und der Agilität, die das Unternehmen benötigt. Sie verfügen über eine globale Expertise, die mehr als 115 Länder und 750 Sprachregionen umfasst. LXT wurde 2010 gegründet und hat seinen Hauptsitz in Toronto, Kanada, sowie Niederlassungen in den Vereinigten Staaten, Australien, Ägypten, Großbritannien und der Türkei. Das Unternehmen beliefert Kunden in Nordamerika, Europa, im asiatisch-pazifischen Raum und im Nahen Osten.
Wann haben Sie zum ersten Mal entdeckt, dass Sie sich für Sprache begeistern?
Ich interessiere mich schon seit ich denken kann für Sprache, aber im Hinblick auf meine direkte Auseinandersetzung mit Sprache und Linguistik gab es für mich einen einzigen bedeutsamen Wendepunkt. Wir erkannten sehr früh, dass eines unserer Kinder Legastheniker war, und als wir mit ihrer Schule über zusätzliche Unterstützung sprachen, sagten sie, dass es zwar Programme gebe, auf die sie zugreifen könnten, es aber auch Dinge gäbe, die ich als Freiwilliger an der Schule tun könne, um uns zu helfen Tochter und andere Kinder. Es lief gut, und von da an studierte ich Linguistik und lehrte an zwei Universitäten hier in Sydney.
Sie haben Linguistik unterrichtet, bevor Sie in den Sprachdatenbereich eingestiegen sind. Was hat Sie dazu inspiriert, Ihren Schwerpunkt zu ändern?
Das in Sydney ansässige Unternehmen Appen vollzog gerade den Übergang von einem Betrieb, der von einem Gästezimmer in einem Heim aus betrieben wurde, zu einem vollwertigen kommerziellen Betrieb. Mir wurde gesagt, dass sie Linguisten suchten (genauer gesagt, einen Linguisten!) und ich wurde den Gründern Julie und Chris Vonwiller vorgestellt. Der Übergang erfolgte schrittweise und erstreckte sich über etwa zwei Jahre. Ich wollte den Unterricht nur ungern aufgeben – die Arbeit mit leistungsstarken Studenten war sowohl inspirierend als auch sehr unterhaltsam. Aber besonders in diesen Pionierjahren löste ich zusammen mit den weltweit führenden Experten für Sprachtechnologie schwierige Probleme, und die Aufregung war groß. Vieles, was heute selbstverständlich ist, war damals eine große Herausforderung.
Sie sind aus dem Ruhestand gekommen, um sich LXT anzuschließen. Was hat Sie dazu motiviert?
Das ist eine interessante Frage, da ich den Ruhestand auf jeden Fall genossen habe. Tatsächlich kam unser Mitbegründer und CEO Mohammad Omar Monate vor meiner Antwort auf seine erste Anfrage auf mich zu, da ich einen entspannten Lebensstil führte und nicht wirklich daran gedacht hatte, wieder Vollzeit zu arbeiten. Nachdem ich zugestimmt hatte, den ersten Anruf entgegenzunehmen, bei dem Mo nach der Möglichkeit fragte, bei LXT beizutreten, erwartete ich, dass ich nur höflich zuhören und ablehnen würde.
Aber am Ende war die Gelegenheit einfach zu groß, um ihr zu widerstehen.
Als ich mit Mohammad und den anderen Mitgliedern des LXT-Teams sprach, erkannte ich sofort die gemeinsame Leidenschaft für Sprache. Das Team, das Mohammad zusammengestellt hatte, bestand aus kreativen Denkern mit grenzenloser Energie, die sich voll und ganz der Mission des Unternehmens verschrieben hatten.
Als ich mehr über die Gelegenheit mit LXT erfuhr, wurde mir klar, dass ich mir diese Gelegenheit nicht entgehen lassen wollte. Hier war ein Unternehmen mit enormem Expansions- und Wachstumspotenzial in einem Bereich, der mir am Herzen liegt. Und da der Markt für KI weiterhin exponentiell wächst, ist die Gelegenheit, mehr Unternehmen dabei zu helfen, vom Experimentieren zur Produktion überzugehen, eine aufregende Gelegenheit, an der ich sehr gerne teilhaben darf.
Was sind einige der aktuellen Herausforderungen bei der Datenerfassung in großem Maßstab?
Die Herausforderungen sind so vielfältig wie die Anwendungen, die ihnen zugrunde liegen.
Aus praktischer Sicht gehören zu den Herausforderungen Authentizität, Zuverlässigkeit, Genauigkeit, Sicherheit und die Sicherstellung, dass die Daten für den Zweck geeignet sind – und das ohne Berücksichtigung der wachsenden Zahl rechtlicher und ethischer Herausforderungen, die mit der Datenerfassung einhergehen.
Beispielsweise erfordert die Entwicklung von Technologien zur Unterstützung autonomer Fahrzeuge die Erfassung extrem großer Datenmengen über eine Vielzahl von Szenarien hinweg, damit das Auto versteht, wie es auf Situationen in der realen Welt reagieren muss. Es gibt unzählige Randfälle, denen man beim Fahren begegnen kann. Daher benötigen die Algorithmen, die diese Fahrzeuge antreiben, Datensätze, die alles abdecken, von Straßen über Stoppschilder bis hin zu fallenden Objekten. Und wenn man das dann mit der Anzahl der Wetterereignisse multipliziert, die auftreten können, erhöht sich die Menge der benötigten Trainingsdaten exponentiell. Automobilunternehmen, die in den autonomen Bereich vordringen, müssen eine zuverlässige Datenpipeline aufbauen, und dies alleine zu tun, würde eine enorme Menge an Ressourcen erfordern.
Ein weiterer Anwendungsfall ist die Ausweitung eines bestehenden Sprach-KI-Produkts in neue Märkte, um Marktanteile und neue Kunden zu gewinnen. Hierzu sind zwangsläufig Sprachdaten erforderlich, und um Genauigkeit zu erreichen, ist es entscheidend, Sprachdaten von Muttersprachlern aus verschiedenen demografischen Profilen zu beziehen. Sobald die Daten erfasst wurden, müssen die Sprachdateien transkribiert werden, um die NLP-Algorithmen des Produkts zu trainieren. Dies für mehrere Sprachen und mit den für eine effektive Wirksamkeit erforderlichen Datenmengen durchzuführen, stellt für Unternehmen eine große Herausforderung dar, insbesondere wenn ihnen das interne Fachwissen auf diesem Gebiet fehlt.
Dies sind nur zwei Beispiele für die vielen Herausforderungen, die bei der Datenerfassung für KI im großen Maßstab bestehen, aber wie Sie sich vorstellen können, haben auch die Heimautomatisierung, die Erfassung mobiler Geräte und biometrische Daten jeweils ihre spezifischen Herausforderungen.
Auf welche Weise beschafft und kommentiert LXT derzeit Daten?
Bei LXT erfassen und kommentieren wir Daten für jeden Kunden unterschiedlich, da alle unsere Aufträge auf die Spezifikationen unserer Kunden zugeschnitten sind. Wir arbeiten mit einer Vielzahl von Datentypen, darunter Audio, Bild, Sprache, Text und Video. Bei der Datenerfassung arbeiten wir mit einem globalen Netzwerk von Auftragnehmern zusammen, um Daten in diesen verschiedenen Modalitäten zu sammeln. Die Erfassungen können von der Erfassung von Daten in realen Umgebungen wie zu Hause, im Büro oder im Auto bis hin zur Erfassung von Daten im Studio durch erfahrene Ingenieure im Falle bestimmter Sprachdatenerfassungsprojekte reichen.
Unsere Datenannotationsfunktionen umfassen auch mehrere Modalitäten. Unsere Erfahrung begann im Sprachbereich und in den letzten 12 Jahren sind wir in über 115 Länder und mehr als 750 Sprachregionen expandiert. Das bedeutet, dass sich Unternehmen jeder Größe darauf verlassen können, dass LXT ihnen dabei hilft, ein breites Spektrum an Märkten zu erschließen und neue Kundensegmente zu erobern. In jüngerer Zeit haben wir uns auf Text-, Bild- und Videodaten ausgeweitet und unsere interne Plattform wird verwendet, um unseren Kunden qualitativ hochwertige Daten bereitzustellen.
Ein weiterer spannender Wachstumsbereich für uns war unsere sichere Annotationsarbeit. Erst in diesem Jahr haben wir unsere ISO 27001-sichere Anlagenpräsenz von zwei auf fünf Standorte weltweit erweitert. Wir haben jetzt ein Playbook entwickelt, das es uns ermöglicht, innerhalb weniger Monate neue Einrichtungen einzurichten. Die Dienste, auf die wir uns in diesen sicheren Einrichtungen konzentrieren, sind derzeit die Annotation und Transkription von Sprachdaten, sie können jedoch für die Annotation vieler Datentypen verwendet werden.
Warum ist die Datenbeschaffung auf diese Weise eine überlegene Alternative zu synthetischen Daten?
Synthetische Daten sind eine spannende Entwicklung im Bereich der KI und eignen sich gut für bestimmte Anwendungsfälle, insbesondere für Randfälle, die in der realen Welt schwer zu erfassen sind. Der Einsatz synthetischer Daten nimmt zu, insbesondere in den frühen Stadien der KI-Reife, da sich Unternehmen noch im Experimentiermodus befinden. Allerdings unser eigenes Forschungsprojekte zeigt, dass Unternehmen, je ausgereifter ihre KI-Strategien sind und mehr Modelle in die Produktion bringen, mit größerer Wahrscheinlichkeit überwachte oder halbüberwachte Methoden des maschinellen Lernens verwenden, die auf von Menschen kommentierten Daten basieren.
Menschen sind einfach besser als Computer darin, die Nuancen zu verstehen, um die Daten zu erstellen, die zum Trainieren von ML-Modellen für eine hohe Genauigkeit erforderlich sind, und die menschliche Aufsicht ist auch entscheidend, um Verzerrungen zu reduzieren.
Warum sind diese Daten für die Sprache und die Verarbeitung natürlicher Sprache so wichtig?
Damit Sprach- und natürliche Sprachverarbeitungsalgorithmen in ihren Zielmärkten effektiv funktionieren, müssen sie mit großen Datenmengen trainiert werden, die von Muttersprachlern stammen, die über den kulturellen Kontext der Endbenutzer verfügen, die sie vertreten. Ohne diese Daten wird die Einführung von Sprach-KI erhebliche Einschränkungen haben.
Darüber hinaus muss bei der Erfassung von Sprachdaten die Umgebung berücksichtigt werden. Wenn die zu trainierende Sprach-KI-Lösung beispielsweise in einem Auto eingesetzt wird, gibt es unterschiedliche Straßen- und Wetterbedingungen, die sich auf die Sprache auswirken und berücksichtigt werden müssen. Dies sind komplexe Szenarien, bei denen ein erfahrener Datenpartner helfen kann.
Gibt es noch etwas, das Sie über LXT mitteilen möchten?
Zunächst möchte ich Ihnen für die Gelegenheit danken, unsere Geschichte zu teilen! Ich möchte hervorheben, dass sich unser Unternehmen dafür einsetzt, Unternehmen jeder Größe mit ihren KI-Initiativen zum Erfolg zu verhelfen. Wir konzentrieren uns seit über 12 Jahren auf die Bereitstellung hochgradig maßgeschneiderter KI-Daten für Unternehmen auf der ganzen Welt und würden uns freuen, mit jedem in Kontakt zu treten, der eine zuverlässige Datenpipeline zur Unterstützung seiner KI-Projekte erstellen möchte.
Vielen Dank für das tolle Interview, Leser, die mehr erfahren möchten, sollten vorbeischauen LXT.












