AI 101

Valmiit vai räätälöidyt koneoppimismallit?

mm
Off the shelf vs custom models

Milloin rakentaminen on parempaa kuin valmiin ratkaisun ostaminen?

Yritykset voivat osallistua erilaisiin lähestymistapoihin mallien kehittämiseen. Täysin hallittavista ML-palveluista aina räätälöityihin malleihin. Liiketoimintavaatimusten, saatavilla olevan asiantuntemuksen ja suunnittelurajoitusten mukaan heidän on tehtävä valinta: kehittäisivätkö he räätälöityjä ratkaisuja alusta alkaen? Vai valitsisivatko he valmiin palvelun?

Koneoppimisen työkuormien kaikissa vaiheissa on tehtävä päätös siitä, miten eri palaset sopivat yhteen. Datankeräämisen, valmistelun ja visualisoinnin kautta ominaisuuskehittämiseen, mallikoulutukseen ja arviointiin, koneoppimisen insinöörit kysyvät itseltään toistuvasti samaa kysymystä: Olisiko se räätälöity ratkaisu, joka on kirjoitettu ja kehitetty alusta alkaen? Vai olisiko se valmiiratkaisu?

Mutkaan milloin rakentaminen on parempaa kuin valmiin ratkaisun ostaminen? Pääasialliset erottautumistekijät näiden kahden lähestymistapan välillä ovat: esikäsittelyponnistelut, kehityksen nopeus ja vaadittu asiantuntemus.

Mitä tulee ottaa huomioon määritettäessä käytetäänkö valmiita vai räätälöityjä koneoppimismalleja?

Esikäsittelyponnistelut

Koneoppimishankkeet kohtaavat monenlaisia haasteita, mutta ehkä suurin haaste on koulutusdatan saatavuus. Koulutusdatan puute voi lopettaa hankkeen ennen kuin se edes alkaa. Ennen kuin hanke edes alkaa, se voi kohtaada merkittäviä esikäsittelykustannuksia datan keräämisestä, datan merkinnästä, puhdistamisesta ja esikäsittelyponnistelujen vuoksi. Tämä on tunnettu ansa, johon monet koneoppimishankkeet joutuvat: esikäsittely vie 80 % varattavista resursseista, kun taas vain vähän resursseja jää itse mallin koulutukseen ja arviointiin.

Valmiit ratkaisut helpottavat esikäsittelyponnistelujen rasitusta. Ne on suunniteltu suorittamaan yleisimpiä toimintoja vain vähäisellä konfiguroinnilla. Parasta niissä on: valmiit ratkaisut ovat käytettävissä koneoppimisen työkuormien kaikissa vaiheissa.

Toisaalta räätälöidyt toteutukset vaativat yleensä enemmän esikäsittelyponnisteluita. Se ei tarkoita, että niitä pitäisi hylätä kokonaan: ne ovat edelleen tarpeen joidenkin tiettyjen koneoppimisen vaiheiden mukauttamiseen ratkaistavan ongelman erityispiirteisiin. Erityisen likainen tietojoukko saattaa vaatia erityisiä puhdistussääntöjä. Samalla tietyn ominaisuusjoukon saattaa vaatia räätälöityä ominaisuuskehittämistä, aivan kuten neuroverkkorakenteiden saattaa vaatia hieman muutoksia. Tässä tapauksessa räätälöidyt ratkaisut, jotka on kehitetty alusta alkaen, ovat todennäköisesti kattavat kaikki tarpeet.

Kehityksen nopeus

Valmiit ratkaisut keskittyvät konfigurointiin eikä toteutukseen. Sen sijaan, että resursseja käytettäisiin selvittämään mitä pitäisi tehdä, koneoppimisen tiimit keskittyvät siihen, miten eri palaset sopivat yhteen. Tämä lähestymistapa mahdollistaa yritysten, tutkijoiden ja insinöörien nopean toteuttamisen prototyyppejä ja konseptin todisteita. Sen sijaan, että keksisi uudelleen pyörän, valmiit ratkaisut mahdollistavat olemassa olevan tiedon hyödyntämisen, mikä säästää kehitysaikaa.

Räätälöidyt ratkaisut, jotka on toteutettu alusta alkaen, ovat tunnettuja hitaammista kehityksen nopeudesta. Tämä johtuu niiden lisääntyneistä ylläpitotarpeista: insinöörien on selvitettävä sekä mitä että miten ratkaisua. Samoin, mitä monimutkaisempi ratkaisu on, sitä enemmän aikaresursseja vaaditaan sen skaalautuvuuden ja saatavuuden turvaamiseen tuotannossa. Tästä näkökulmasta räätälöidyt ratkaisut ja aikaponnistelut ovat suoraan suhteessa: mitä monimutkaisempi ratkaisu on, sitä enemmän aikaa se vaatii.

Yleensä kuitenkin totuus on jossakin välissä: olemassa oleva koodipohja uudelleenjärjestetään ja sovitetaan nykyisen hankkeen tarpeisiin. Tällainen on esimerkiksi tunnettu siirtymällinen lähestymistapa mallien koulutukseen.

Asiantuntemus

Just kuin on useita tasoja, joilla koneoppimista tehdään, on useita tasoja, joilla koneoppimismalleja voidaan kehittää, aina koodittomista liittymistä rakentamiseen alusta alkaen.

Valmiit ratkaisut ovat olemassa, joissa vaaditaan vain vähän koneoppimisen asiantuntemusta. Käyttämällä intuitiivisia liittymiä ja jopa raahaus- ja pudotuslähestymistapoja, on muodostunut erittäin helppoa kenelle tahansa (liiketoimintanalyytikoista ohjelmistosuunnittelijoihin) luoda ja ottaa käyttöön jokin koneoppimismalli. Vaikka tämä yksinkertainen lähestymistapa mallien kehittämiseen saattaa toimia prototyyppitarkoituksiin, se ei ole todennäköisesti täyttävä tuotantojärjestelmien vaatimuksia.

Asiantuntemus vaaditaan edelleen valmiiden ratkaisujen oikeaan konfigurointiin, asetukseen ja ylläpitoon tuotannossa. Kiertoreitit, koodipatchit, liittäminen eri API-liittymiin ja ongelmien käsittely ovat yleisiä tehtäviä, joita tarvitaan varmistamaan mallien suorituskyky tuotantoympäristöissä.

Räätälöidyt ratkaisut toteutetaan yleensä infrastruktuuritasolla eikä ole mitään keinoa sen kiertämiseen: asiantuntemus vaaditaan. Yrityksen koosta ja hankkeen tavoitteista riippuen monialaiset tiimit saattavat olla tarpeen tuotantojärjestelmien ylläpitämiseen. Data-analyytikot, koneoppimisen insinöörit ja liiketoimintanalyytikot tulevat yhteen antamaan merkitystä johtopäätöksille ja ylläpitämään tuotantomalleja.

Mitä kannattaa käyttää: valmiita vai räätälöityjä koneoppimismalleja?

Koneoppimisen ratkaisu koostuu useista yksittäisistä komponenteista ja palveluista, jotka tarvitsevat yhdistymisen yhtenäiseksi ratkaisuksi. Se ei ole koskaan kyse siitä, mennäänkö 100 % räätälöityyn vai 100 % valmiiseen, koska eri liiketoimintahaasteet vaativat eri ratkaisuja. Useimmiten koneoppimisperusteiset ratkaisut rakennetaan sekä valmiiden palvelujen että räätälöityjen mallien yhdistelmästä: valmiit palvelut yleisten oivallusten poimimiseen, yhdistettynä räätälöityihin malleihin tarkkuuden ja mallinomaisen tiedon lisäämiseksi.

Temppu on tietää, milloin toteuttaa räätälöityjä ratkaisuja alusta alkaen ja mitkä osat hankkeesta voivat hyödyntää valmiiden palvelujen hyötyjä. Tämä riippuu suuresti ongelman tyypistä, liiketoimintavaatimuksista, saatavilla olevasta datasta ja kehitysympäristön rajoituksista.

Lisää tietoa AI:sta ja teknologiatrendeistä, katso Josh Miramant, Blue Orange Digitalin toimitusjohtaja, datalähtöisiä ratkaisuja huolintaketjuille, terveydenhuollon asiakirjojen automaatioon ja lisää.

Saatat myös pitää:

Käytä NLP:ää luokittelemalla kommentteja sosiaalisessa mediassa

Miten kielenkäsittelyä parannetaan Googleen avoimen lähdekoodin BERT-mallin kautta

Josh Miramant on Blue Orange Digitalin toimitusjohtaja ja perustaja, Blue Orange Digital on korkeasti arvostettu data science ja machine learning -toimisto, jolla on toimistot New Yorkissa ja Washington DC:ssa. Miramant on suosittu puhuja, futuristi ja strateginen liiketoiminta- ja teknologia-asiantuntija yrityksille ja startup-yrityksille. Hän auttaa organisaatioita optimoimaan ja automatisoimaan liiketoimintaa, toteuttamaan dataohjattuja analytiikkaa ja ymmärtämään uusien teknologioiden vaikutuksia, kuten tekoäly, big data ja Internet of Things.