csonk Készen álló vs egyéni gépi tanulási modellek? - Egyesüljetek.AI
Kapcsolatba velünk
AI mesterkurzus:

AI 101

Készen álló vs egyéni gépi tanulási modellek?

mm

Közzététel:

 on

Polcról kapható kontra egyedi modellek

Mikor jobb építeni, mint egy kész megoldást vásárolni?

A vállalatok különböző megközelítéseket alkalmazhatnak a modellfejlesztésben. A teljesen felügyelt ML szolgáltatásoktól egészen az egyedi modellekig. Az üzleti követelményektől, a rendelkezésre álló szaktudástól és a tervezési korlátoktól függően dönteniük kell: a semmiből kell egyedi megoldásokat kidolgozniuk? Vagy válasszanak kész szolgáltatást?

Az ML munkaterhelések minden szakaszában el kell dönteni, hogy a különböző puzzle-darabok hogyan illeszkednek egymáshoz. Az adatgyűjtéstől, az előkészítéstől és a vizualizációtól kezdve egészen a jellemzők tervezéséig, a modellképzésig és -értékelésig a gépi tanulással foglalkozó mérnökök ismételten felteszik maguknak ugyanazt a kérdést: ez egy egyedileg megvalósított megoldás lesz, amelyet a nulláról írnak és fejlesztenek? Vagy ez egy kész szolgáltatás lesz?

De mikor jobb építeni, mint egy kész megoldást vásárolni? A fő megkülönböztető tényezők a két megközelítés között: az előfeldolgozási erőfeszítések, a fejlesztési sebesség és a szükséges szakértelem.

Mit kell figyelembe venni, amikor a kész vagy egyedi gépi tanulási modellek használata mellett dönt?

Előfeldolgozási erőfeszítések

Az ML projektek mindenféle kihívással néznek szembe, de a legnagyobb kihívást talán a képzési adatok elérhetősége jelenti. A képzési adatok hiánya leállíthatja a projektet, mielőtt még elindulna. A projekt megkezdése előtt jelentős előfeldolgozási költségekkel szembesülhet az adatgyűjtésből, az adatok címkézéséből, a tisztításból és az előfeldolgozásból eredő erőfeszítésekből. Ez az a jól ismert csapda, amelyben sok ML projekt kudarcot vall: az előfeldolgozás a kiosztott erőforrások 80%-át veszi el, míg a tényleges modellképzéshez és -értékeléshez kevés erőforrás marad.

A készen kapható megoldások enyhítik az előfeldolgozási erőfeszítések fáradalmait és fájdalmait. Úgy készültek, hogy a legáltalánosabb műveleteket hajtsák végre, csekély konfigurációval. A legjobb bennük az: kész megoldások léteznek az ML munkaterhelések minden szakaszára.

Másrészt az egyedi kivitelezések általában több előfeldolgozási erőfeszítést igényelnek. Ez nem jelenti azt, hogy teljesen el kell vetni őket: továbbra is kötelesek finomhangolni egy bizonyos ML szakaszt a megoldandó probléma sajátosságaihoz. Egy különösen szennyezett adatkészlethez speciális tisztítási szabályokra lehet szükség. Ugyanakkor egy adott szolgáltatáskészlet egyedi szolgáltatástervezést igényelhet, ahogy a neurális architektúráknál is szükség lehet kisebb módosításokra. Ebben az esetben a nulláról épített egyedi megoldások valószínűleg minden igényt kielégítenek.

Fejlődési sebesség 

A kész megoldások a megvalósítás helyett a konfigurációra összpontosítanak. Ahelyett, hogy erőforrásokat osztana ki a kitalálásra mit meg kell tenni, az ML csapatok erre fognak összpontosítani hogyan a különböző puzzle-darabok illeszkednek egymáshoz. Ez a megközelítés lehetővé teszi a vállalatoknak, kutatóknak és mérnököknek, hogy gyorsan megvalósítsák a prototípusokat és az ötletbizonyítékokat. A kerék újrafeltalálása helyett a kész megoldások lehetővé teszik a meglévő tudás hasznosítását, így fejlesztési időt takarítanak meg.

Ismeretes, hogy a semmiből megvalósított egyedi megoldások sokkal lassabb wrt-fejlesztési sebességgel rendelkeznek. Ennek oka a megnövekedett karbantartási igényük: a mérnököknek ki kell találniuk mind a mit és a hogyan a megoldástól. Hasonlóképpen, minél összetettebb a megoldás, annál több időerőforrásra van szükség a méretezhetőség és a gyártás közbeni rendelkezésre állás biztosításához. Ebből a szempontból az egyedi megoldások és az időráfordítás egyenesen arányos: minél összetettebb egy megoldás, annál több időt igényel.

Általában azonban az igazság valahol a közepén van: egy meglévő kódbázist át kell alakítani és az aktuális projekt igényeihez igazítani. Ilyen például a modellképzés jól ismert transzfertanulási megközelítése.

Szakvélemény

Ahogyan a gépi tanulásnak több szintje van, úgy az ML-modellek is többféle szinten fejleszthetők, kezdve a kódmentes felületektől egészen a modellek nulláról való felépítéséig.

Léteznek kész megoldások, amelyekhez nagyon kevés gépi tanulási szakértelem szükséges. Az intuitív interfészek, sőt a drag and drop megközelítések használatával rendkívül egyszerűvé vált bárki számára (az üzleti elemzőktől a szoftvermérnökökig) valamilyen gépi tanulási modell felépítése és bevezetése. Bár a modellfejlesztésnek ez az egyszerű megközelítése működhet prototípus-készítési célokra, nem valószínű, hogy megfelelne a termelési rendszerek követelményeinek.

Továbbra is szakértelemre van szükség a termelésben lévő kész megoldások megfelelő konfigurálásához, beállításához és karbantartásához. A megoldások, a kódjavítások, a különböző API-felületekhez való kapcsolódás és a telepítési problémák kezelése gyakori feladatok, amelyek szükségesek a modellek teljesítményének biztosításához éles környezetben.

Az egyedi megoldások általában infrastrukturális szinten valósulnak meg, és ezt nem lehet megkerülni: szakértelem mindenképpen szükséges. A vállalat méretétől és a projekt céljaitól függően multidiszciplináris csapatokra lehet szükség a termelési rendszerek karbantartásához. Az adattudósok, az ML mérnökök és az üzleti elemzők összefognak, hogy értelmezzék a következtetéseket és fenntartsák a termelési modelleket.

Mit kell használni: an készen kapható vagy egyedi gépi tanulási modell?

Egy ML-megoldás sok egyedi komponensből és szolgáltatásból épül majd fel, amelyeknek összefüggő megoldásként kell összeállniuk. Soha nem arról van szó, hogy 100%-ban egyedivé váljunk, vagy 100%-ban készen álljunk, mivel a különböző üzleti problémák eltérő megoldásokat igényelnek. Az ML-alapú megoldások leggyakrabban a kettő keverékéből épülnek fel: az általános ismeretek kinyerésére készen kapható szolgáltatások, a nagyobb pontosság és a tartomány-specifikus tudás modellezése érdekében egyedi modellekkel kombinálva.

A trükk abban rejlik, hogy tudjuk, mikor kell az egyedi megoldásokat a semmiből megvalósítani, és hogy a projekt mely részei hasznosíthatják a kész szolgáltatások előnyeit. Ez nagymértékben függ a kezelendő probléma típusától, az üzleti követelményektől, a rendelkezésre álló adatoktól és a fejlesztési környezet általános korlátaitól.

Az AI és a technológiai trendekről bővebben lásd Josh Miramant, a Blue Orange Digital adatvezérelt megoldásainak vezérigazgatója Supply ChainEgészségügyi dokumentumautomatizálás, és több.

A következőket is kedvelheti:

Használja az NLP-t a megjegyzések osztályozására a közösségi médiában

Hogyan fejleszti a nyelvi feldolgozást a Google nyílt forráskódú BERT-modellje?  

Josh Miramant a cég vezérigazgatója és alapítója Blue Orange Digital, egy elsőrangú adattudományi és gépi tanulási ügynökség, amelynek irodái vannak New Yorkban és Washington DC-ben. A Miramant népszerű előadó, futurista, valamint stratégiai üzleti és technológiai tanácsadó vállalati és startup vállalkozások számára. Segít a szervezeteknek optimalizálni és automatizálni vállalkozásaikat, bevezetni az adatvezérelt elemzési technikákat, és megérteni az új technológiák – például a mesterséges intelligencia, a big data és a tárgyak internete – következményeit.