Myslitelé
Čtyři faktory pro úspěch s modely ML

Od Jasona Revelle, CTO, Datatron
Odborníci, analytici a ti, kteří mají první zkušenosti s implementací, chválí strojové učení (ML), což vede k rostoucímu počtu podniků, které přijímají ML pro různé účely. Jeho sláva spočívá v myšlence, že by mělo počítačově zpracovávat lidské poznání a dále umožňovat digitální transformaci. Nicméně, i když ML slibuje mnoho, existuje také negativní stránka: pro týmy, které musí spravovat ML v produkci, může práce být obtížným úkolem.
Podniky implementují ML pro různé úkoly, jako je klasifikace zdravotních rizik, zpracování dokumentů, předpovídání cen, detekce podvodů, preventivní údržba a další. Týmy trénují a vyhodnocují modely na historických datech, dokud se zdají splňovat cíle výkonu a přesnosti. Podniky jsou ochotny využít vysoké hodnoty, které ML slibuje, předpovídáním, klasifikací nebo předepisováním budoucích výsledků – a jednáním na základě těchto předpovědí.
Všechny tyto obchodní hodnoty však přicházejí s vysokými provozními náklady. Jakmile je model “připraven”, jeho automatizace prostřednictvím spolehlivých mechanismů dodávky vytváří provozní složitosti a rizika, které vyžadují bdělost. Aby tyto projekty byly efektivní a efektivní, týmy pro dodávku a provoz musí holisticky spravovat životní cyklus ML. Data musí být k dispozici a mít očekávanou kvalitu ve srovnání s tím, co bylo použito pro trénink.
Brzy se stává zřejmým, že se toto není příliš podobné jiným inženýrským úsilím, a musíte začít uvažovat o výzvách novým způsobem, abyste se真的 stali AI-powrerovanou společností. Zde jsou čtyři věci, které je třeba vzít v úvahu pro úspěch se strojovým učením, a zejména s modely ML.
1. Jak být schopen rychle nasadit několik verzí na pozadí
Modely strojového učení vyžadují iterativní proces, který závisí na skutečných produkčních datech. Investujte do nasazení cílů, které mohou běžet a zaznamenávat výsledky bez toho, aby produkční systémy nebo zákazníci viděli tyto výsledky. Musíte mít schopnost nasadit tímto způsobem snadno a plynule, dokud nemáte model, který se vám líbí. V dlouhodobém horizontu je mnohem účinnější a ekonomičtější předpokládat, že bude mnoho ladění vašich modelů, stejně jako potřeba srovnávat aktuální verze s novými kandidáty, kteří slibují lepší výsledky.
2. Pochopit, že to, co váš tým slibuje, obvykle nebude zapadat do tradičních, aplikací-centric “schválených softwarových” politik.
Jak ML rychle roste a diverzifikuje, má stále rostoucí seznam technologických poskytovatelů, velkých i malých. Je samozřejmé, že IT potřebuje udržovat řádnou podporu, bezpečnostní skeny a kontroly pro vaše provozní prostředí. Ale buďte varováni: aplikování stejných kontrol a procesů pro řízení provozního nebo produktového hostingu technologií na vaši praxi ML pravděpodobně významně sníží vaše potenciální výnosy, než jste vůbec překročili startovní čáru.
Je také důležité poznamenat, že datoví vědci jsou velmi žádaní. Není pro ně obtížné najít jinou práci, pokud se cítí tlak, aby dodávali lepší a lepší výsledky bez změny technologií, které používají, nebo toho, jak je mohou používat.
3. Pochopit, že životní cyklus vývoje modelu ML není stejný jako životní cyklus softwarového vývoje
Softwarový vývoj a vytváření modelů ML jsou velmi odlišné procesy; pokusit se zacházet s druhým jako s prvním je recept na katastrofu. Podniky, které považují dodávku modelu za pouhé vydání softwaru, skončí s mezerami v propojených schopnostech, jako je monitorování a analýza, a vysokými náklady na přenos znalostí mezi tvůrci a operátory, s sekvenčními, prodlouženými časovými osami. Specialisté, kteří nasazují a podporují vaše modely, potřebují pochopit, jak model a data fungují, ne pouze triážní službu spolehlivosti a chybových kódů. Správný talent, hybridní týmy složené z odborníků na data a provozní specialisty, spolu se správnými nástroji, vám umožní testovat a interpretovat nejen to, zda software funguje, ale také to, jak jsou odpovědi přesné a vysvětlitelné.
Je také důležité přijmout základní přístup k auditu modelů strojového učení, protože jsou omylné. Pokud chcete, aby vaši datoví vědci důvěřovali svým předpovědím modelů strojového učení, i když se věci pokazí (pochopíte, že se to stane), pak by proces auditu ML měl být navržen tak, aby umožňoval iteraci a zlepšování modelů strojového učení.
4. Plánovat na škálovatelnost.
Budete muset nasadit nástroje strojového učení, které mají automatizovaný systém nasazení, jako je Kubernetes nebo Docker Swarm. To vám pomůže dosáhnout několika cílů. Budete moci dynamicky spouštět zátěže strojového učení a automaticky monitorovat úkoly napříč clusterem pro selhání pomocí algoritmů AI – upozorňující operátory na potenciální problémy, než nastanou. Budete také moci konsolidovat analytické zprávy z více zdrojů do jednoho centralizovaného dashboardu, aby bylo zajištěno, že modely strojového učení fungují podle očekávání.
Zvládnout učební křivku
Před zahájením projektu ML je důležité pochopit, že i když modely ML mohou nabízet značné výhody a efektivitu vaší organizaci, mohou se stát nekontrolovatelnými, pokud nejsou řádně spravovány. Pochopit rizika a provozní složitosti od začátku, přičemž vezmete v úvahu výše uvedené čtyři tipy. S pevnou základnou budete moci vytvářet a snadno měnit své modely ML, aby sloužily vašim obchodním cílům.












