Connect with us

Thought leaders

Vier factoren voor succes met ML-modellen

mm

Door Jason Revelle, CTO, Datatron

Experts, analisten en mensen met eerste-hand ervaring met de implementatie van machine learning (ML) prijzen ML de hemel in, waardoor een toenemend aantal bedrijven ML gaat gebruiken voor verschillende doeleinden. De reden hiervoor is dat het de menselijke cognitie zou computeriseren en digitale transformatie verder mogelijk maken. Echter, ondanks de grote beloften van ML, is er een nadeel: voor de teams die het in productie moeten beheren, kan het werk een moeilijke strijd worden.

Bedrijven implementeren ML voor allerlei taken, zoals het classificeren van gezondheidsrisico’s, het verwerken van documenten, het voorspellen van prijzen, het detecteren van fraude, preventief onderhoud en meer. Teams trainen en evalueren modellen op historische gegevens totdat ze voldoen aan de prestatie- en nauwkeurigheidscriteria. Bedrijven zijn erg enthousiast over het behalen van de hoge waarde die ML belooft door toekomstige resultaten te voorspellen, te classificeren of voor te schrijven – en op basis van die voorspellingen te handelen.

Al deze bedrijfswaarde komt echter wel tegen een hoge operationele kosten. Zodra een model “klaar” is, creëert de automatisering via betrouwbare leveringsmechanismen operationele complexiteiten en risico’s die vigilante vereisen. Om deze projecten efficiënt en effectief te maken, moeten de leverings- en operationele teams het ML-levenscyclus holistisch beheren. De gegevens moeten beschikbaar en van de verwachte kwaliteit zijn in vergelijking met wat gebruikt werd voor training.

Het wordt al snel duidelijk dat dit niet zo is als andere engineeringsinspanningen, en je moet beginnen met na te denken over de uitdagingen op nieuwe manieren om echt een AI-georiënteerd bedrijf te worden. Hier zijn vier dingen om te overwegen voor succes met machine learning, en specifiek met ML-modellen.

1. Hoe je snel meerdere versies achter de schermen kunt implementeren

Machine learning-modellen vereisen een iteratief proces dat afhankelijk is van echte productiegegevens. Maak gerichte investeringen om implementatie-doelen te hebben die kunnen draaien en resultaten kunnen loggen zonder dat productiesystemen of klanten die resultaten zien. Je hebt de mogelijkheid nodig om dit gemakkelijk en vloeiend te doen totdat je het model hebt dat je leuk vindt. Op lange termijn is het veel effectiever en economischer om aan te nemen dat er veel afstemming van je modellen zal zijn, evenals een behoefte om huidige versies te vergelijken met nieuwe kandidaten die betere resultaten beloven.

2. Begrijp dat wat je team belooft, meestal niet past binnen traditionele, applicatie-georiënteerde “goedgekeurde software”-beleid.

Terwijl ML snel groeit en diversifieert, heeft het een steeds grotere lijst van technologieaanbieders, zowel groot als klein. Het is een gegeven dat IT de juiste ondersteuning, beveiligingsscans en controles voor je operationele omgevingen moet behouden. Maar wees gewaarschuwd: het toepassen van dezelfde controles en processen voor het beheren van operationele of producthostingtechnologie op je ML-praktijk zal waarschijnlijk je potentieel rendement aanzienlijk verminderen voordat je überhaupt de startlijn bent gepasseerd.

Het is ook belangrijk om op te merken dat datawetenschappers erg gewild zijn. Het is niet moeilijk voor hen om een andere baan te vinden als ze het gevoel hebben dat ze onder druk worden gezet om betere en betere resultaten te leveren zonder de technologie te veranderen die ze gebruiken of hoe ze die kunnen gebruiken.

3. Begrijp dat de ML-modelontwikkelingslevenscyclus niet hetzelfde is als een software-ontwikkelingslevenscyclus

Software-ontwikkeling en het creëren van ML-modellen zijn heel verschillende processen; het behandelen van de laatste als de eerste is een recept voor rampen. Bedrijven die modellevering behandelen als een gewone software-uitgave, eindigen met gaten in cross-cutting capaciteiten zoals monitoring en analyse, en hoge overhead voor kennisoverdracht tussen creators en operators, met sequentiële, verlengde tijdslijnen. Specialists die je modellen implementeren en ondersteunen, moeten begrijpen hoe het model en de gegevens werken, niet alleen triage-servicebetrouwbaarheid en foutcodes. De juiste talenten, hybride teams bestaande uit data- en operationele specialisten, evenals de juiste tools, zullen je in staat stellen om te testen en te interpreteren of de software niet alleen wordt uitgevoerd, maar ook hoe accuraat en uitlegbaar de antwoorden zijn.

Het is ook belangrijk om een succes-gebaseerde aanpak te hanteren bij het auditen van machine learning-modellen, omdat ze kwetsbaar zijn. Als je wilt dat je bedrijfsdatawetenschappers hun machine learning-modelvoorspellingen vertrouwen, zelfs als dingen misgaan (beseffend dat dit zal gebeuren), dan moet het ML-auditproces zijn ontworpen op een manier die machine learning-modellen in staat stelt om te worden geïtereerd en verbeterd.

4. Plan voor schaal.

Je hebt machine-intelligentie-instrumenten nodig met een geautomatiseerd implementatiesysteem zoals Kubernetes of Docker Swarm. Dit zal je helpen om meerdere doelen te bereiken. Je kunt machine learning-werklasten dynamisch opstarten en taken automatisch over clusters controleren op fouten met behulp van AI-algoritmen – operators waarschuwen voor potentiële problemen voordat ze zich voordoen. Je kunt ook analytics-rapporten van meerdere bronnen consolideren in één centraal dashboard om ervoor te zorgen dat machine learning-modellen naar verwachting presteren.

De leercurve beheersen

Voordat je een ML-project begint, is het cruciaal om te begrijpen dat ML-modellen, hoewel ze enorm veel voordelen en efficiëntie voor je organisatie kunnen bieden, een eigen leven kunnen gaan leiden als ze niet goed worden beheerd. Ken de risico’s en de operationele complexiteiten vanaf het begin, met de bovenstaande vier tips in gedachten. Met een solide fundament op zijn plaats, kun je ML-modellen creëren en gemakkelijk veranderen, zodat ze je bedrijfsdoelen dienen.

Jason is de hoofdingenieur bij Datatron, hij is een technisch leider met hybride productmanagementervaring in het creëren van oplossingen en platforms, via een verscheidenheid aan ingenieurs- en ontwikkelingsrollen, variërend van kleine technologiebedrijven tot grote ondernemingen, waaronder Boeing en MasterCard.