škrbina Uspješan razvoj strojnog učenja zahtijeva novu paradigmu - Voditelji mišljenja - Unite.AI
Povežite se s nama

Vođe misli

Uspješan razvoj strojnog učenja zahtijeva novu paradigmu – voditelje mišljenja

mm

Objavljeno

 on

Victor Thu, predsjednik, Datatron

Inicijative koje koriste strojno učenje ne mogu se tretirati na isti način kao projekti koji uključuju konvencionalni softver. Imperativ je brzog kretanja kako biste mogli testirati stvari, popraviti probleme i ponovno ih testirati. Drugim riječima, morate biti u mogućnosti brzo podbaciti – i to u ranoj fazi procesa. Čekati kasnije u ovom procesu da se pronađu problemi može biti vrlo skupo i dugotrajno.

AI zahtijeva novi pristup

Kada razvijate softver tradicionalnom metodom, koristite logiku odlučivanja. Da budemo što precizniji, vi uključujete logiku koja omogućuje ispravno funkcioniranje softvera. (Obično) nema potrebe za promjenama nakon što je logika aplikacije razvijena, osim za ispravke grešaka. To je vrlo metodičan proces razvoja; napredujete postupno osiguravajući da je svaki korak u procesu točan prije nego prijeđete na sljedeći. To je isprobana strategija koja dosljedno pokazuje svoju učinkovitost za razvoj softvera.

Međutim, ne možete koristiti istu strategiju za AI/ML projekte jer jednostavno neće raditi. Umjesto toga, morate imati sposobnost brzog i učestalog ponavljanja kako biste postigli uspjeh s ML projektom. Budući da ML zahtijeva početnu obuku i proces je, trebali biste mu pristupiti sa spoznajom da neće biti točan kada se prvi put primijeni.

Ovaj proces zahtijeva više ponavljanja. Stvarnost je da će vaš prvi model naići na neočekivane rezultate u 99% slučajeva. Čak i ako provedete mjesece trenirajući svoj model u laboratoriju, on će se bez sumnje promijeniti kada naiđe na podatke i promet iz stvarnog svijeta.

Ne težite trenutnom savršenstvu

Dakle, da biste testirali model i odredili koje su izmjene potrebne, morate biti u mogućnosti da ga brzo stavite u proizvodnju. Zatim možete izvršiti bilo kakve prilagodbe, ponovno ga otpustiti i poboljšati. Iz tog razloga ne biste se trebali previše truditi da svoj model učinite besprijekornim prije testiranja u proizvodnji; prvi pokušaj neće biti savršen i nitko ne bi trebao očekivati ​​da će biti.

Dok se model razvija u laboratoriju, dodatna poboljšanja s 92% na 95% točnosti možda neće biti značajna za neke slučajeve upotrebe. Zašto ne? Samo mali dio podataka za obuku korišten je za obuku vašeg AI modela. Na kraju možete uložiti mnogo vremena i novca da dobijete dodatnu točnost, a da se u međuvremenu odreknete prednosti koje bi vam vaš model mogao ponuditi.

Učinkoviti koraci u implementaciji ML-a

Budući da postoji mogućnost da model ne uspije ili proizvede netočna predviđanja, ML znanstvenici ponekad oklijevaju staviti model u proizvodnju. Ima smisla, do određenog stupnja. Potreban vam je sustav koji vam omogućuje pregled događaja onako kako se događaju u stvarnom vremenu. Ovim pristupom možete odmah povući i ažurirati svoj model, a zatim brzo objaviti novi model. Umjesto da se zaglavite u "paralizi analize", ovo je najučinkovitija metoda za stavljanje modela strojnog učenja u proizvodnju.

Daleko je bolje samo pokrenuti model i pustiti ga da stekne neko životno iskustvo. Ovo ne eliminira potrebu da znanstvenici koji se bave podacima od samog početka kreiraju model što je točnije moguće. Ali čim završite tu početnu verziju, trebali biste odmah početi prikupljati te važne podatke.

Možda biste trebali pokrenuti svoje modele u načinu A/B testiranja ili u sjeni u odnosu na podatke iz stvarnog svijeta kao dio ovog procesa. Na taj način možete u osnovi usporediti performanse različitih modela i imati mnogo podataka i dokaza prije nego što odaberete koji ćete model promovirati ili degradirati.

Izgradnja lokaliziranog modela umjesto koncentriranja na stvaranje jednog globalnog modela za predviđanje ponašanja za makro okruženje još je jedna najbolja praksa. S lokalnim modelom možete koristiti podatke iz specifičnih situacija tako da se model ponaša kako bi trebao za svaki od tih scenarija. Ovo štedi vrijeme, podatke i trud u usporedbi sa sveobuhvatnim modelom koji bi zahtijevao značajnu količinu ovih resursa da bi se osigurao njegov rad.

Ovdje će kao ilustracija poslužiti utvrđivanje potražnje za prilagođenim tenisicama. Globalni model mogao bi se primijeniti na ostatak Sjeverne Amerike da se temelji na broju stanovnika grada New Yorka. Ipak, to vjerojatno ne bi točno predstavljalo potražnju u drugim dijelovima zemlje. Strategija lokaliziranog modela omogućila bi vam da dobijete veće profitne marže, na kojima sada gubite.

Naravno, modeli zahtijevaju redovito ažuriranje. Modeli zahtijevaju stalna ažuriranja jer se podaci okruženja uvijek mijenjaju, za razliku od tradicionalnog softvera koji se može postaviti jednom i ostaviti na miru. ML modeli se s vremenom pogoršavaju ako se ne ponavljaju redovito. To se mora dogoditi tijekom životnog vijeka modela i mora se pažljivo pratiti.

Nova paradigma strojnog učenja

Uspoređivati ​​modele strojnog učenja s konvencionalnim softverom nije mudro. Međutim, ML stručnjaci imaju koristi od tehnike brze implementacije za AI/ML modele, baš kao što su softverski inženjeri učinili s DevOps. Za ML projekte potreban vam je sustav koji omogućuje brzo pokretanje modela. Morate biti u mogućnosti usporediti različite modele, učinkovito suprotstavljajući jedan koji je živ s onim koji nije. Ovi i drugi gore spomenuti najbolji primjeri iz prakse pomoći će vam u brzom i ranom zaobilaženju paralize analize i neuspjeha kako biste mogli skalirati svoje strojno učenje.

Victor Thu je predsjednik Datatron. Tijekom svoje karijere Victor se specijalizirao za marketing proizvoda, izlazak na tržište i upravljanje proizvodima na C-razini i direktorskim pozicijama za tvrtke kao što su Petuum, VMware i Citrix.