Interviews
Phil Hall, Chief Growth Officer bij LXT – Interview Serie

LXT Chief Growth Officer Phil Hall is een voormalig Appen-executive en Forbes Technology Council lid. In zijn leiderschapsrol bij Appen leidde hij een divisie van 1.000+ medewerkers en speelde hij een sleutelrol bij het behalen van 17 opeenvolgende jaren van omzetgroei met consistent sterke winstgevendheid. In zijn huidige rol bij LXT werkt hij met een door hem geselecteerd team van experts om ambitieuze groeidoelstellingen te behalen.
LXT is een opkomende leider in AI-trainingsdata om intelligente technologie voor wereldwijde organisaties te laten functioneren, waaronder de grootste technologiebedrijven ter wereld. In samenwerking met een internationaal netwerk van contributors verzamelt en annotatieert LXT data across meerdere modaliteiten met de snelheid, schaal en flexibiliteit die nodig is voor ondernemingen. Ze hebben een wereldwijde expertise die meer dan 115 landen en 750 taalgebieden omvat. Opgericht in 2010 is LXT gevestigd in Toronto, Canada met een aanwezigheid in de Verenigde Staten, Australië, Egypte, het VK en Turkije. Het bedrijf serveert klanten in Noord-Amerika, Europa, Azië-Pacifisch en het Midden-Oosten.
Wanneer ontdekte je voor het eerst dat je passie had voor taal?
Ik ben al zo lang ik me kan herinneren geïnteresseerd in taal, maar in termen van mijn directe betrokkenheid bij taal en linguïstiek, was er een enkel significant keerpunt voor mij. We realiseerden ons al vroeg dat een van onze kinderen dyslectisch was, en toen we met haar school praatten over extra ondersteuning, zeiden ze dat er programma’s waren die ze konden benutten, maar dat er ook dingen waren die ik als vrijwilliger op school kon doen om onze dochter en andere kinderen te helpen. Het ging goed, en van daaruit ging ik linguïstiek studeren en vond ik mezelf aan het lesgeven aan twee universiteiten hier in Sydney.
Je gaf eerder linguïstiek les voordat je je focus verlegde naar de spraakgegevensruimte, wat inspireerde je om je focus te verleggen?
Sydney-based Appen maakte net de overgang van een operatie die uit een spare room in een huis werd gerund naar een volledig commerciële operatie. Ik werd verteld dat ze op zoek waren naar linguïsten (misschien meer accurate, een linguïst!) en ik werd voorgesteld aan de oprichters Julie en Chris Vonwiller. De overgang was geleidelijk en strekte zich uit over ongeveer twee jaar. Ik was terughoudend om weg te lopen van het lesgeven – werken met hoog presterende studenten was zowel inspirerend als veel plezier. Maar vooral tijdens die pioniersjaren loste ik moeilijke problemen op naast de werelds toonaangevende taaltechnologie-experts, en de opwinding was hoog. Veel van wat vandaag vanzelfsprekend is, was destijds erg uitdagend.
Je kwam uit pensioen om bij LXT te joinen. Wat motiveerde je om dit te doen?
Dat is een interessante vraag, want ik genoot echt van mijn pensioen. In feite benaderde onze mede-oprichter en CEO Mohammad Omar me maanden voordat ik reageerde op zijn initiële verzoek, omdat ik een ontspannen levensstijl leidde en niet echt had overwogen om fulltime terug te keren naar het werk.
Maar uiteindelijk was de kans gewoon te goed om te weerstaan.
Terwijl ik met Mohammad en de andere leden van het LXT-team sprak, herkende ik onmiddellijk een gedeelde passie voor taal. Het team dat Mohammad had samengesteld, was gevuld met creatieve denkers met onbeperkte energie die volledig toegewijd waren aan de missie van het bedrijf.
Toen ik meer te weten kwam over de kans bij LXT, realiseerde ik me dat het een kans was die ik niet wilde missen. Hier was een bedrijf met een enorm potentieel om uit te breiden en te groeien in een gebied waar ik gepassioneerd over ben. En aangezien de markt voor AI exponentieel blijft groeien, is de kans om meer organisaties te helpen om van experimentatie naar productie over te stappen een opwindende kans waar ik erg blij mee ben om deel van uit te maken.
Wat zijn enkele van de huidige uitdagingen achter het verwerven van data op grote schaal?
De uitdagingen zijn zo gevarieerd als de toepassingen die ze aandrijven.
Vanuit een praktisch oogpunt omvatten uitdagingen authenticiteit, betrouwbaarheid, nauwkeurigheid, beveiliging en ervoor zorgen dat de data geschikt is voor het doel – en dat is zonder rekening te houden met het groeiende aantal juridische en ethische uitdagingen die inherent zijn aan gegevensverwerving.
Bijvoorbeeld, de ontwikkeling van technologie ter ondersteuning van autonome voertuigen vereist de verzameling van extreem grote volumes aan gegevens over een multitudes aan scenario’s, zodat de auto weet hoe hij moet reageren op echte wereldsituaties. Er zijn eindeloze aantallen randgevallen die je kunt tegenkomen bij het rijden, dus de algoritmes die deze voertuigen aandrijven, hebben datasets nodig die alles omvatten, van straten tot stopborden tot vallende objecten. En dan, als je dat vermenigvuldigt met het aantal weersgebeurtenissen dat kan optreden, neemt de hoeveelheid trainingsdata die nodig is exponentieel toe. Automobielbedrijven die de autonome ruimte betreden, moeten een betrouwbare gegevenspijplijn opzetten, en dat doen ze op eigen kracht zou een enorm aantal resources vergen.
Een ander gebruiksscenario is de uitbreiding van een bestaand voice AI-product naar nieuwe markten om marktaandeel en nieuwe klanten te veroveren. Dit vereist onvermijdelijk taalgegevens, en om nauwkeurigheid te bereiken, is het cruciaal om spraakgegevens te verzamelen van native speakers over een verscheidenheid aan demografische profielen. Zodra de gegevens zijn verzameld, moeten de spraakbestanden getranscribeerd worden om de NLP-algoritmes van het product te trainen. Dit doen voor meerdere talen en op de gegevensvolumes die nodig zijn om effectief te zijn, is extreem uitdagend voor bedrijven om dit alleen te doen, vooral als ze niet over de interne expertise in dit veld beschikken.
Dit zijn slechts twee voorbeelden van de vele uitdagingen die bestaan bij gegevensverzameling voor AI op grote schaal, maar zoals je je kunt voorstellen, hebben home-automatisering, mobiele apparaat- en biometrische gegevensverzameling elk hun specifieke uitdagingen.
Wat zijn de huidige manieren waarop LXT gegevens verzamelt en annotatieert?
Bij LXT verzamelen en annoteren we gegevens op een andere manier voor elke klant, omdat al onze engagements zijn aangepast om te voldoen aan de specificaties van onze klanten. We werken met een verscheidenheid aan gegevenstypen, waaronder audio, afbeeldingen, spraak, tekst en video. Voor gegevensverzameling werken we met een wereldwijd netwerk van contractors om gegevens in deze verschillende modaliteiten te verzamelen. Verzamelingen kunnen variëren van het verzamelen van gegevens in echte wereldinstellingen zoals huizen, kantoren of in de auto, tot in-studio met ervaren ingenieurs in het geval van bepaalde spraakgegevensverzamelingprojecten.
Onze gegevensannotatiecapaciteiten omvatten ook meerdere modaliteiten. Onze ervaring begon in de spraakruimte en in de afgelopen 12 jaar zijn we uitgebreid naar meer dan 115 landen en meer dan 750 taalgebieden. Dit betekent dat bedrijven van alle maten kunnen vertrouwen op LXT om hen te helpen nieuwe markten te betreden en nieuwe klantensegmenten te bereiken. Onlangs hebben we ons uitgebreid naar tekst-, afbeeldings- en videogegevens, en ons interne platform wordt gebruikt om hoogwaardige gegevens aan onze klanten te leveren.
Een andere spannende groeigebied voor ons is ons beveiligde annotatiewerk. Dit jaar alleen hebben we ons ISO 27001-beveiligde faciliteitenbestand uitgebreid van twee naar vijf locaties wereldwijd. We hebben nu een playbook ontwikkeld dat ons in staat stelt om nieuwe faciliteiten op te zetten in een kwestie van maanden. De diensten die we ons op deze beveiligde faciliteiten richten, zijn momenteel spraakgegevensannotatie en transcriptie, maar ze kunnen worden gebruikt voor annotatie over veel gegevenstypen.
Waarom is het bronnen van gegevens op deze manier een superieure alternatief voor synthetische gegevens?
Synthetische gegevens zijn een opwindende ontwikkeling in het veld van AI en zijn goed geschikt voor specifieke use-cases, vooral randgevallen die moeilijk te verzamelen zijn in de echte wereld. Het gebruik van synthetische gegevens neemt toe, vooral in de vroege stadia van AI-maturiteit, omdat bedrijven nog steeds in experimenteermodus zitten. Echter, ons eigen onderzoek toont aan dat wanneer organisaties hun AI-strategieën volwassen maken en meer modellen in productie brengen, ze veel meer geneigd zijn om gebruik te maken van begeleide of semi-begeleide machine learning-methoden die afhankelijk zijn van door de mens geannoteerde gegevens.
Mensen zijn eenvoudigweg beter dan computers in het begrijpen van de nuances om de gegevens te creëren die nodig zijn om ML-modellen te trainen om met hoge nauwkeurigheid te presteren, en menselijke toezicht is ook cruciaal om vooroordelen te verminderen.
Waarom is deze gegevens zo belangrijk voor spraak en Natural Language Processing?
Voor spraak- en natuurlijke taalverwerking algoritmes om effectief te werken in hun beoogde markten, moeten ze getraind worden met grote volumes aan gegevens afkomstig van native speakers die de culturele context van de eindgebruikers vertegenwoordigen. Zonder deze gegevens zal voice AI-adoptie ernstige beperkingen hebben.
Bovendien moet de omgeving worden meegenomen bij het verzamelen van spraakgegevens. Als de voice AI-oplossing die getraind wordt, bijvoorbeeld, in een auto wordt gebruikt, zijn er verschillende weg- en weersomstandigheden die van invloed zijn op spraak en die moeten worden meegenomen. Dit zijn complexe scenario’s waarin een ervaren gegevenspartner kan helpen.
Is er nog iets anders dat je zou willen delen over LXT?
Ten eerste wil ik je bedanken voor de kans om ons verhaal te delen! Ik wil graag benadrukken dat ons bedrijf zich inzet om organisaties van alle maten te helpen slagen met hun AI-initiatieven. We zijn ons de afgelopen 12 jaar gericht op het leveren van hoogwaardige AI-gegevens aan bedrijven over de hele wereld en we zouden graag contact opnemen met iedereen die op zoek is naar een betrouwbare gegevenspijplijn om hun AI-projecten te ondersteunen.
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten bezoeken LXT.












