- Terminológia (A-tól D-ig)
- AI képességvezérlés
- AIOps
- albumációk
- Eszköz teljesítménye
- Autoencoder
- Visszaszaporítás
- Bayes-tétel
- Big adatok
- Chatbot: Útmutató kezdőknek
- Számítási gondolkodás
- Számítógépes látás
- Zavart mátrix
- Konvolúciós neurális hálózatok
- Kiberbiztonság
- Data Fabric
- Adattörténetmondás
- Data Science
- Adattárolás
- Döntési fa
- Deepfakes
- Deep Learning
- Mély megerősítésű tanulás
- DevOps
- DevSecOps
- Diffúziós modellek
- Digitális iker
- Dimenzionalitás csökkentés
- Terminológia (E-től K-ig)
- Edge AI
- Érzelem AI
- Együttes tanulás
- Etikai hackelés
- ETL
- Megmagyarázható AI
- Egyesített tanulás
- FinOps
- Generatív AI
- Generatív versenytársak hálózata
- Generatív vs. diszkriminatív
- Gradiens Boosting
- Gradiens Descent
- Few-Shot Learning
- Képosztályozás
- IT-műveletek (ITOps)
- Incidens automatizálás
- Befolyásolás Mérnökség
- K-Means klaszterezés
- K-Legközelebbi szomszédok
- Terminológia (L-től Q-ig)
- Terminológia (R-től Z-ig)
- Erősítő tanulás
- Felelős mesterséges intelligencia
- RLHF
- Robotikus folyamat automatizálás
- Strukturált vs strukturálatlan
- Érzelmi elemzés
- Felügyelt vs nem felügyelt
- Támogatja a vektoros gépeket
- Szintetikus adatok
- Szintetikus média
- Szöveg osztályozása
- TinyML
- Transzfer tanulás
- Transzformátor neurális hálózatok
- Turing teszt
- Vektoros hasonlóság keresése
AI 101
Készen álló vs egyéni gépi tanulási modellek?
Közzététel:
3 éveon
Tartalomjegyzék
Mikor jobb építeni, mint egy kész megoldást vásárolni?
A vállalatok különböző megközelítéseket alkalmazhatnak a modellfejlesztésben. A teljesen felügyelt ML szolgáltatásoktól egészen az egyedi modellekig. Az üzleti követelményektől, a rendelkezésre álló szaktudástól és a tervezési korlátoktól függően dönteniük kell: a semmiből kell egyedi megoldásokat kidolgozniuk? Vagy válasszanak kész szolgáltatást?
Az ML munkaterhelések minden szakaszában el kell dönteni, hogy a különböző puzzle-darabok hogyan illeszkednek egymáshoz. Az adatgyűjtéstől, az előkészítéstől és a vizualizációtól kezdve egészen a jellemzők tervezéséig, a modellképzésig és -értékelésig a gépi tanulással foglalkozó mérnökök ismételten felteszik maguknak ugyanazt a kérdést: ez egy egyedileg megvalósított megoldás lesz, amelyet a nulláról írnak és fejlesztenek? Vagy ez egy kész szolgáltatás lesz?
De mikor jobb építeni, mint egy kész megoldást vásárolni? A fő megkülönböztető tényezők a két megközelítés között: az előfeldolgozási erőfeszítések, a fejlesztési sebesség és a szükséges szakértelem.
Mit kell figyelembe venni, amikor a kész vagy egyedi gépi tanulási modellek használata mellett dönt?
Előfeldolgozási erőfeszítések
Az ML projektek mindenféle kihívással néznek szembe, de a legnagyobb kihívást talán a képzési adatok elérhetősége jelenti. A képzési adatok hiánya leállíthatja a projektet, mielőtt még elindulna. A projekt megkezdése előtt jelentős előfeldolgozási költségekkel szembesülhet az adatgyűjtésből, az adatok címkézéséből, a tisztításból és az előfeldolgozásból eredő erőfeszítésekből. Ez az a jól ismert csapda, amelyben sok ML projekt kudarcot vall: az előfeldolgozás a kiosztott erőforrások 80%-át veszi el, míg a tényleges modellképzéshez és -értékeléshez kevés erőforrás marad.
A készen kapható megoldások enyhítik az előfeldolgozási erőfeszítések fáradalmait és fájdalmait. Úgy készültek, hogy a legáltalánosabb műveleteket hajtsák végre, csekély konfigurációval. A legjobb bennük az: kész megoldások léteznek az ML munkaterhelések minden szakaszára.
Másrészt az egyedi kivitelezések általában több előfeldolgozási erőfeszítést igényelnek. Ez nem jelenti azt, hogy teljesen el kell vetni őket: továbbra is kötelesek finomhangolni egy bizonyos ML szakaszt a megoldandó probléma sajátosságaihoz. Egy különösen szennyezett adatkészlethez speciális tisztítási szabályokra lehet szükség. Ugyanakkor egy adott szolgáltatáskészlet egyedi szolgáltatástervezést igényelhet, ahogy a neurális architektúráknál is szükség lehet kisebb módosításokra. Ebben az esetben a nulláról épített egyedi megoldások valószínűleg minden igényt kielégítenek.
Fejlődési sebesség
A kész megoldások a megvalósítás helyett a konfigurációra összpontosítanak. Ahelyett, hogy erőforrásokat osztana ki a kitalálásra mit meg kell tenni, az ML csapatok erre fognak összpontosítani hogyan a különböző puzzle-darabok illeszkednek egymáshoz. Ez a megközelítés lehetővé teszi a vállalatoknak, kutatóknak és mérnököknek, hogy gyorsan megvalósítsák a prototípusokat és az ötletbizonyítékokat. A kerék újrafeltalálása helyett a kész megoldások lehetővé teszik a meglévő tudás hasznosítását, így fejlesztési időt takarítanak meg.
Ismeretes, hogy a semmiből megvalósított egyedi megoldások sokkal lassabb wrt-fejlesztési sebességgel rendelkeznek. Ennek oka a megnövekedett karbantartási igényük: a mérnököknek ki kell találniuk mind a mit és a hogyan a megoldástól. Hasonlóképpen, minél összetettebb a megoldás, annál több időerőforrásra van szükség a méretezhetőség és a gyártás közbeni rendelkezésre állás biztosításához. Ebből a szempontból az egyedi megoldások és az időráfordítás egyenesen arányos: minél összetettebb egy megoldás, annál több időt igényel.
Általában azonban az igazság valahol a közepén van: egy meglévő kódbázist át kell alakítani és az aktuális projekt igényeihez igazítani. Ilyen például a modellképzés jól ismert transzfertanulási megközelítése.
Szakvélemény
Ahogyan a gépi tanulásnak több szintje van, úgy az ML-modellek is többféle szinten fejleszthetők, kezdve a kódmentes felületektől egészen a modellek nulláról való felépítéséig.
Léteznek kész megoldások, amelyekhez nagyon kevés gépi tanulási szakértelem szükséges. Az intuitív interfészek, sőt a drag and drop megközelítések használatával rendkívül egyszerűvé vált bárki számára (az üzleti elemzőktől a szoftvermérnökökig) valamilyen gépi tanulási modell felépítése és bevezetése. Bár a modellfejlesztésnek ez az egyszerű megközelítése működhet prototípus-készítési célokra, nem valószínű, hogy megfelelne a termelési rendszerek követelményeinek.
Továbbra is szakértelemre van szükség a termelésben lévő kész megoldások megfelelő konfigurálásához, beállításához és karbantartásához. A megoldások, a kódjavítások, a különböző API-felületekhez való kapcsolódás és a telepítési problémák kezelése gyakori feladatok, amelyek szükségesek a modellek teljesítményének biztosításához éles környezetben.
Az egyedi megoldások általában infrastrukturális szinten valósulnak meg, és ezt nem lehet megkerülni: szakértelem mindenképpen szükséges. A vállalat méretétől és a projekt céljaitól függően multidiszciplináris csapatokra lehet szükség a termelési rendszerek karbantartásához. Az adattudósok, az ML mérnökök és az üzleti elemzők összefognak, hogy értelmezzék a következtetéseket és fenntartsák a termelési modelleket.
Mit kell használni: an készen kapható vagy egyedi gépi tanulási modell?
Egy ML-megoldás sok egyedi komponensből és szolgáltatásból épül majd fel, amelyeknek összefüggő megoldásként kell összeállniuk. Soha nem arról van szó, hogy 100%-ban egyedivé váljunk, vagy 100%-ban készen álljunk, mivel a különböző üzleti problémák eltérő megoldásokat igényelnek. Az ML-alapú megoldások leggyakrabban a kettő keverékéből épülnek fel: az általános ismeretek kinyerésére készen kapható szolgáltatások, a nagyobb pontosság és a tartomány-specifikus tudás modellezése érdekében egyedi modellekkel kombinálva.
A trükk abban rejlik, hogy tudjuk, mikor kell az egyedi megoldásokat a semmiből megvalósítani, és hogy a projekt mely részei hasznosíthatják a kész szolgáltatások előnyeit. Ez nagymértékben függ a kezelendő probléma típusától, az üzleti követelményektől, a rendelkezésre álló adatoktól és a fejlesztési környezet általános korlátaitól.
Az AI és a technológiai trendekről bővebben lásd Josh Miramant, a Blue Orange Digital adatvezérelt megoldásainak vezérigazgatója Supply Chain, Egészségügyi dokumentumautomatizálás, és több.
A következőket is kedvelheti:
Használja az NLP-t a megjegyzések osztályozására a közösségi médiában
Hogyan fejleszti a nyelvi feldolgozást a Google nyílt forráskódú BERT-modellje?
Josh Miramant a cég vezérigazgatója és alapítója Blue Orange Digital, egy elsőrangú adattudományi és gépi tanulási ügynökség, amelynek irodái vannak New Yorkban és Washington DC-ben. A Miramant népszerű előadó, futurista, valamint stratégiai üzleti és technológiai tanácsadó vállalati és startup vállalkozások számára. Segít a szervezeteknek optimalizálni és automatizálni vállalkozásaikat, bevezetni az adatvezérelt elemzési technikákat, és megérteni az új technológiák – például a mesterséges intelligencia, a big data és a tárgyak internete – következményeit.