Stumm Off-the-shelf vs Custom Machine Learning Modeller? - Unite.AI
Connect mat eis

AI 101

Off-the-shelf vs Custom Machine Learning Modeller?

mm

publizéiert

 on

Aus dem Regal vs personaliséiert Modeller

Wéini ass et besser ze bauen wéi eng off-the-shelf Léisung ze kafen?

Firme kënnen a verschiddenen Approche fir Modellentwécklung engagéieren. Vu voll geréiert ML Servicer, de ganze Wee bis op personaliséiert Modeller. Ofhängeg vu Geschäftsbedéngungen, verfügbar Expertise, a Planungsbeschränkungen, musse se e Choix maachen: solle se personaliséiert Léisunge vun Null entwéckelen? Oder solle se en off-the-shelf Service wielen?

Fir all Etappe vun der ML Aarbechtslaascht muss eng Entscheedung getraff ginn iwwer wéi déi verschidde Puzzlestécker zesumme passen. Vun Datensammlung, Virbereedung a Visualiséierung, de ganze Wee bis zur Feature-Ingenieur, Modellausbildung an Evaluatioun, stellen d'Maschinn Léieringenieuren sech ëmmer erëm déi selwecht Fro: Wäert et eng personaliséiert implementéiert Léisung sinn, geschriwwe an aus Schrack entwéckelt? Oder wäert et en off-the-shelf Service sinn?

Awer wéini ass et besser ze bauen wéi eng off-the-shelf Léisung ze kafen? D'Haaptdifferenzéierungsfaktoren tëscht den zwou Approchen: Virveraarbechtungsefforten, Entwécklungsgeschwindegkeet an déi erfuerderlech Expertise.

Saachen fir ze berücksichtegen wann Dir bestëmmt fir off-the-shelf oder personaliséiert Maschinnléiere Modeller ze benotzen?

Preprocessing Efforten

ML Projete sti fir all Zorte vun Erausfuerderungen, awer vläicht déi gréissten Erausfuerderung ass d'Disponibilitéit vun Trainingsdaten. De Mangel u Trainingsdaten kann e Projet stoppen ier et iwwerhaapt ufänkt. Ier e Projet iwwerhaapt ufänkt, kann et bedeitend Virveraarbechtungskäschte konfrontéieren fir Daten ze sammelen, Labeldaten, Botzen a Virveraarbechtungsefforten. Dëst ass déi bekannte Fal, an där vill ML Projete feelen: Virveraarbechtung hëlt endlech 80% vun de Ressourcen, déi allokéiert sinn, wärend wéineg Ressourcen iwwreg sinn fir déi aktuell Modellausbildung an Evaluatioun.

Off-the-shelf Léisungen erliichteren d'Belaaschtungen an d'Péng vu Virveraarbechtungsefforten. Si si gebaut fir déi meescht üblech Operatiounen ze maachen mat nëmmen e bësse Konfiguratioun erfuerderlech. Déi bescht Saach iwwer si ass: off-the-shelf Léisunge existéieren fir all Etappe vun ML Aarbechtslaascht.

Op der anerer Säit, personaliséiert Implementatiounen erfuerderen normalerweis méi Virveraarbechtungsefforten. Dat heescht net datt se komplett entlooss musse ginn: si sinn nach ëmmer verlaangt eng gewësse ML-Etapp un d'Spezifizitéiten vum Problem ze léisen. Eng besonnesch dreckeg Dataset kann e puer speziell Aart vu Reinigungsregelen erfuerderen. Zur selwechter Zäit kann e spezifesche Feature-Set personaliséiert Feature-Ingenieur erfuerderen, sou wéi neural Architekturen liicht Upassunge verlaangen. An dësem Fall sinn personaliséiert Léisunge vun Null gebaut méiglecherweis all Bedierfnesser ofdecken.

Entwécklung Vitesse 

Off-the-shelf Léisunge konzentréieren op Konfiguratioun anstatt Implementatioun. Amplaz Ressourcen ze verdeelen fir erauszefannen waat soll gemaach ginn, wäert ML Équipë konzentréieren op wéi déi verschidde Puzzelstécker passen zesummen. Dës Approche erlaabt Firmen, Fuerscher an Ingenieuren séier Prototypen a Beweiser vum Konzept ëmzesetzen. Amplaz d'Rad nei ze erfannen, maachen off-the-shelf Léisungen et méiglech existent Wëssen ze notzen, sou datt d'Entwécklungszäit spuert.

Benotzerdefinéiert Léisunge vun Null implementéiert si bekannt fir vill méi lues ze sinn mat der Entwécklungsgeschwindegkeet. Dëst ass wéinst hirem verstäerkten Ënnerhalt Bedierfnesser: Ingenieuren mussen erausfannen souwuel de waat an der wéi vun der Léisung. Och, wat méi komplex d'Léisung ass, wat méi Zäitressourcen erfuerderlech sinn fir seng Skalierbarkeet an Disponibilitéit ze garantéieren wärend der Produktioun. Aus dëser Perspektiv sinn personaliséiert Léisungen an Zäitefforten direkt proportional: Wat méi komplex eng Léisung ass, wat méi Zäit et brauch.

Normalerweis ass d'Wourecht awer iergendwou an der Mëtt: eng existent Codebase gëtt refaktoréiert an un d'Bedierfnesser vum aktuelle Projet ugepasst. Sou ass de Fall vun der bekannter Transfer Léieren Approche fir Modell Training.

Expertise

Just wéi et verschidde Schichten sinn op deenen Machine Learning gemaach gëtt, ginn et verschidde Niveaue vun Expertise bei deenen ML Modeller kënne entwéckelt ginn, rangéiert vu Code-gratis Interfaces bis zum Bau vun Modeller vun Null.

Off-the-shelf Léisunge existéieren fir déi ganz wéineg Maschinnléieren Expertise erfuerderlech ass. Andeems Dir intuitiv Interfaces benotzt a souguer Drag-and-Drop Approche ass et extrem einfach ginn fir jiddereen (vu Geschäftsanalytiker bis Software Ingenieuren) eng Zort Maschinn Léiermodell ze bauen an z'installéieren. Och wann dës einfach Approche fir Modellentwécklung fir Prototyping Zwecker ka funktionnéieren, ass et onwahrscheinlech fir d'Ufuerderunge vun de Produktiounssystemer z'erreechen.

Expertise ass nach ëmmer erfuerderlech fir richteg ze konfiguréieren, opzestellen an off-the-shelf Léisungen an der Produktioun z'erhalen. Ëmgéigend, Code-Patches, Verbindung mat verschiddene API Interfaces, an Ëmgank mat Détachement Problemer sinn gemeinsam Aufgaben néideg Modeller Leeschtung an Produktioun Ëmfeld ze garantéieren.

Custom-made Léisunge ginn normalerweis op infrastrukturellen Niveau ëmgesat an et gëtt kee Wee ronderëm: Expertise ass definitiv erfuerderlech. Ofhängeg vun der Firmagréisst a Projetziler, kënne multidisziplinär Teams erfuerderlech sinn fir Produktiounssystemer z'erhalen. Datewëssenschaftler, ML Ingenieuren, a Geschäftsanalytiker kommen zesummen fir Sënn vun Inferenzresultater ze maachen a Produktiounsmodeller z'erhalen.

Wat soll Dir benotzen: an off-the-shelf oder personaliséiert Maschinn Léieren Modell?

Eng ML-Léisung wäert aus villen eenzelne Komponenten a Servicer gebaut ginn, déi als eng kohäsiv Léisung zesummekommen mussen. Et geet ni drëm 100% personaliséiert ze goen oder 100% aus dem Regal ze goen, well verschidde Geschäftsproblemer verschidde Léisunge erfuerderen. Méi dacks wéi net, ML-baséiert Léisunge ginn duerch eng Mëschung vun deenen zwee gebaut: Off-the-shelf Servicer fir allgemeng Abléck ze extrahieren, kombinéiert mat personaliséierte Modeller fir erhéicht Genauegkeet a Modelléierung vun Domain-spezifesch Wëssen.

Den Trick ass ze wëssen wéini personaliséiert Léisunge vun Null ëmzesetzen a wéi eng Deeler vum Projet d'Virdeeler vun off-the-shelf Servicer kënne profitéieren. Dëst hänkt immens vun der Aart vum Problem of, deen ugepaakt gëtt, de Geschäftsbedéngungen, den verfügbaren Donnéeën an den allgemenge Contrainten vum Entwécklungsëmfeld.

Fir méi iwwer AI an Technologie Trends, kuckt Josh Miramant, CEO vun Blue Orange Digital d'Date-driven Léisungen fir LiwwerkettenGesondheetsariichtung Dokument Automatisatioun, a méi.

Dir kéint och gär:

Benotzt NLP fir Kommentarer op sozialen Medien ze klassifizéieren

Wéi d'Sproochveraarbechtung duerch Google's Open Source BERT Model verbessert gëtt  

De Josh Miramant ass de CEO a Grënner vun Blo Orange Digital, eng Top-klasséiert Datenwëssenschafts- a Maschinnléieragentur mat Büroen zu New York City a Washington DC. Miramant ass e populäre Spriecher, Futurist, an e strategesche Business & Technologie Beroder fir Entreprisen a Startups. Hien hëlleft Organisatiounen hir Geschäfter ze optimiséieren an ze automatiséieren, date-driven analytesch Techniken ëmzesetzen an d'Implikatioune vun neien Technologien wéi kënschtlech Intelligenz, Big Data, an den Internet vun de Saachen ze verstoen.