Mākslīgais intelekts

Lielo valodu modeļu un biznesa savienošana: LLMops

Atjaunināts on Janvāris 27, 2024

LLM, piemēram, OpenAI GPT-3 vai tā pēcteča GPT-4, pamatā ir dziļa mācīšanās, AI apakškopa, kas izmanto neironu tīklus ar trim vai vairākiem slāņiem. Šie modeļi ir apmācīti uz plašām datu kopām, kas aptver plašu interneta teksta spektru. Apmācības laikā LLM iemācās paredzēt nākamo vārdu pēc kārtas, ņemot vērā vārdus, kas ir bijuši iepriekš. Šī pēc būtības vienkārša iespēja ir pamatā LLM spējai ģenerēt saskaņotu, kontekstuāli atbilstošu tekstu paplašinātās secībās.

Iespējamās lietojumprogrammas ir neierobežotas — sākot ar e-pasta ziņojumu sastādīšanu, koda izveidi, atbildēm uz vaicājumiem un beidzot ar pat radošu rakstīšanu. Tomēr liela jauda ir saistīta ar lielu atbildību, un šo lielisko modeļu pārvaldība ražošanas apstākļos nav triviāla. Šeit iesaistās LLMOps, iemiesojot labākās prakses, rīku un procesu kopumu, lai nodrošinātu uzticamu, drošu un efektīvu LLM darbību.

Ceļvedī uz LLM integrāciju ir trīs dominējošie ceļi:

Universāla LLM pamudināšana:
- Tādi modeļi kā ChatGPT un Bard piedāvā zemu slieksni pieņemšanai ar minimālām sākotnējām izmaksām, lai gan ar iespējamu cenu zīmi ilgtermiņā.
- Tomēr datu privātuma un drošības ēnas ir lielas, īpaši tādās nozarēs kā Fintech un Healthcare ar stingriem normatīvajiem regulējumiem.
Laba skaņa Vispārējas nozīmes LLM:
- Ar atvērtā koda modeļiem, piemēram Lama, Piekūns un mistrāls, organizācijas var pielāgot šos LLM, lai tie atbilstu to īpašajiem lietošanas gadījumiem, izmantojot tikai modeļa regulēšanas resursus kā izdevumus.
- Lai gan šis ceļš risina privātuma un drošības problēmas, ir nepieciešama padziļināta modeļa atlase, datu sagatavošana, precizēšana, izvietošana un uzraudzība.
- Šī maršruta cikliskais raksturs prasa ilgstošu iesaistīšanos, tomēr nesenie jauninājumi, piemēram, LoRA (zema līmeņa adaptācija) un Q (quantized)-LoRa, ir pilnveidojuši precizēšanas procesu, padarot to par arvien populārāku izvēli.
Pielāgota LLM apmācība:
- LLM izstrāde no nulles sola nepārspējamu precizitāti, kas pielāgota konkrētajam uzdevumam. Tomēr augstie AI pieredzes, skaitļošanas resursu, apjomīgo datu un laika ieguldījuma prasības rada ievērojamus šķēršļus.

No šiem trim uzņēmumiem vislabvēlīgākā iespēja ir vispārējas nozīmes LLM precizēšana. Jauna pamata modeļa izveide var izmaksāt līdz 100 miljoniem ASV dolāru, savukārt esošo modeļu pielāgošana svārstās no 100 tūkstošiem līdz 1 miljonam ASV dolāru. Šie skaitļi izriet no skaitļošanas izdevumiem, datu iegūšanas un marķēšanas, kā arī inženierijas un pētniecības un attīstības izdevumiem.

LLMOps pret MLOps

Mašīnmācīšanās operācijas (MLOps) ir plaši izmantotas, piedāvājot strukturētu ceļu uz mašīnmācīšanās (ML) modeļu pāreju no izstrādes uz ražošanu. Tomēr līdz ar lielo valodu modeļu (LLM) pieaugumu ir parādījusies jauna darbības paradigma, ko sauc par LLMOps, lai risinātu unikālās problēmas, kas saistītas ar LLM izvietošanu un pārvaldību. Atšķirība starp LLMOps un MLOps ir saistīta ar vairākiem faktoriem:

Skaitļošanas resursi:
- LLM ir nepieciešamas ievērojamas skaitļošanas spējas apmācībai un precizēšanai, bieži vien ir nepieciešama specializēta aparatūra, piemēram, GPU, lai paātrinātu datu paralēlās darbības.
- Secinājumu izmaksas vēl vairāk uzsver modeļa saspiešanas un destilācijas metožu nozīmi, lai ierobežotu skaitļošanas izdevumus.
Pārneses mācības:
- Atšķirībā no parastajiem ML modeļiem, kas bieži tiek apmācīti no nulles, LLM lielā mērā balstās uz pārsūtīšanas mācīšanos, sākot no iepriekš apmācīta modeļa un precizējot to konkrētiem domēna uzdevumiem.
- Šī pieeja ļauj ietaupīt datus un skaitļošanas resursus, vienlaikus panākot vismodernāko veiktspēju.
Cilvēka atsauksmju cilpa:
- LLM iteratīvo uzlabošanu būtiski veicina pastiprinoša mācīšanās no cilvēku atgriezeniskās saites (RLHF).
- Atgriezeniskās saites cilpas integrēšana LLMOps cauruļvados ne tikai vienkāršo novērtēšanu, bet arī veicina precizēšanas procesu.
Hiperparametru regulēšana:
- Lai gan klasiskā ML uzsver precizitātes uzlabošanu, izmantojot hiperparametru regulēšanu, LLM arēnā uzmanība tiek pievērsta arī skaitļošanas prasību samazināšanai.
- Pielāgojot tādus parametrus kā partijas lielums un mācīšanās ātrums, var ievērojami mainīties apmācības ātrums un izmaksas.
Veiktspējas rādītāji:
- Tradicionālie ML modeļi atbilst precīzi definētiem veiktspējas rādītājiem, piemēram, precizitātei, AUC vai F1 rādītājam, savukārt LLM ir atšķirīgas metrikas, piemēram, BLEU un ROUGE.
- BLEU un ROUGE ir metrika, ko izmanto, lai novērtētu mašīnveidoto tulkojumu un kopsavilkumu kvalitāti. BLEU galvenokārt izmanto mašīntulkošanas uzdevumiem, savukārt ROUGE izmanto teksta apkopošanas uzdevumiem.
- BLEU mēra precizitāti jeb to, cik daudz vārdi mašīnas ģenerētajos kopsavilkos parādījās cilvēku atsauces kopsavilkumos. ROUGE mēra atgādinājumu jeb to, cik daudz vārdu cilvēku atsauces kopsavilkumos parādījās mašīnas ģenerētajos kopsavilkos.
Ātra inženierija:
- Precīzu uzvedņu izstrāde ir ļoti svarīga, lai panāktu precīzas un uzticamas atbildes no LLM, mazinot tādus riskus kā modeļa halucinācijas un tūlītēja uzlaušana.
LLM cauruļvadu būvniecība:
- Tādi rīki kā LangChain vai LlamaIndex ļauj montēt LLM cauruļvadus, kas savijas vairākus LLM izsaukumus vai ārējo sistēmu mijiedarbību sarežģītiem uzdevumiem, piemēram, zināšanu bāzes jautājumiem un atbildēm.

https://www.fiddler.ai/llmops

Izpratne par LLMOps darbplūsmu: padziļināta analīze

Language Model Operations jeb LLMOps ir līdzīgs lielu valodu modeļu darbības mugurkaulam, nodrošinot netraucētu darbību un integrāciju dažādās lietojumprogrammās. Lai gan šķietami ir MLOps vai DevOps variants, LLMOps ir unikālas nianses, kas atbilst lielu valodu modeļu prasībām. Iedziļināsimies ilustrācijā attēlotajā LLMOps darbplūsmā, visaptveroši izpētot katru posmu.

Apmācības dati:
- Valodas modeļa būtība ir tā apmācības datos. Šis solis ietver datu kopu vākšanu, nodrošinot, ka tās ir notīrītas, līdzsvarotas un precīzas anotācijas. Datu kvalitāte un daudzveidība būtiski ietekmē modeļa precizitāti un daudzpusību. LLMOps uzsvars tiek likts ne tikai uz skaļumu, bet arī uz saskaņošanu ar modeļa paredzēto lietošanas gadījumu.
Atvērtā pirmkoda fonda modelis:
- Ilustrācijā ir atsauce uz “Open Source Foundation Model”, kas ir iepriekš apmācīts modelis, ko bieži izdod vadošās AI vienības. Šie modeļi, kas apmācīti uz lielām datu kopām, kalpo kā lielisks sākums, ietaupot laiku un resursus, ļaujot precīzi pielāgot konkrētus uzdevumus, nevis apmācīt no jauna.
Apmācība / Tuning:
- Izmantojot pamata modeli un specifiskus apmācības datus, notiek regulēšana. Šajā darbībā modelis tiek uzlabots īpašiem mērķiem, piemēram, vispārīga teksta modeļa precizēšanai ar medicīnisko literatūru veselības aprūpes lietojumprogrammām. LLMOps stingra regulēšana ar konsekventām pārbaudēm ir ļoti svarīga, lai novērstu pārmērīgu pielāgošanu un nodrošinātu labu vispārināšanu neredzamiem datiem.
Apmācīts modelis:
- Pēc noregulēšanas parādās apmācīts modelis, kas ir gatavs izvietošanai. Šis modelis, uzlabota pamata modeļa versija, tagad ir specializēts konkrētam lietojumam. Tā varētu būt atvērtā koda ar publiski pieejamu svaru un arhitektūru vai patentēta, ko organizācija patur privāti.
izvietot:
- Izvietošana ietver modeļa integrēšanu dzīvā vidē reālās pasaules vaicājumu apstrādei. Tas ietver lēmumus par mitināšanu lokālajā vai mākoņa platformās. Programmā LLMOps ļoti svarīgi ir apsvērumi par latentumu, skaitļošanas izmaksām un pieejamību, kā arī nodrošināt, lai modelis būtu labi mērogots daudziem vienlaicīgiem pieprasījumiem.
ātrs:
- Valodu modeļos uzvedne ir ievades vaicājums vai priekšraksts. Efektīvu uzvedņu izstrāde, kas bieži vien prasa izpratni par modeļa uzvedību, ir ļoti svarīga, lai iegūtu vēlamos rezultātus, kad modelis apstrādā šos norādījumus.
Iegulšana Veikals vai Vektoru datu bāzes:
- Pēcapstrādes modeļi var atgriezt vairāk nekā vienkārša teksta atbildes. Uzlabotām lietojumprogrammām var būt nepieciešama iegulšana — augstas dimensijas vektori, kas attēlo semantisko saturu. Šīs iegulšanas var uzglabāt vai piedāvāt kā pakalpojumu, kas ļauj ātri izgūt vai salīdzināt semantisko informāciju, bagātinot veidu, kā modeļu iespējas tiek izmantotas ne tikai teksta ģenerēšanā.
Izvietotais modelis (pašmitināts vai API):
- Pēc apstrādes modeļa izvade ir gatava. Atkarībā no stratēģijas izvadiem var piekļūt, izmantojot pašmitinātu saskarni vai API, kur pirmais piedāvā lielāku kontroli uzņēmēja organizācijai, bet otrais nodrošina mērogojamību un vieglu integrāciju trešo pušu izstrādātājiem.
Izejas:
- Šis posms dod taustāmu darbplūsmas rezultātu. Modelis izmanto uzvedni, apstrādā to un atgriež izvadi, kas atkarībā no lietojumprogrammas var būt teksta bloki, atbildes, ģenerēti stāsti vai pat iegulšana, kā minēts iepriekš.

Populārākie LLM jaunizveidotie uzņēmumi

Lielo valodu modeļu operāciju (LLMOps) ainava ir pieredzējusi specializētu platformu un jaunuzņēmumu parādīšanos. Šeit ir divi starta uzņēmumi/platformas un to apraksti, kas saistīti ar LLMOps telpu:

komēta

Comet racionalizē mašīnmācīšanās dzīves ciklu, īpaši rūpējoties par lielu valodu modeļu izstrādi. Tas nodrošina iespējas eksperimentu izsekošanai un ražošanas modeļu pārvaldībai. Platforma ir piemērota lielu uzņēmumu komandām, piedāvājot dažādas izvietošanas stratēģijas, tostarp privāto mākoni, hibrīdus un lokālas iestatīšanas.

Diificēt

Dify ir atvērtā koda LLMOps platforma, kas palīdz izstrādāt AI lietojumprogrammas, izmantojot lielus valodu modeļus, piemēram, GPT-4. Tam ir lietotājam draudzīgs interfeiss un tas nodrošina netraucētu piekļuvi modelim, konteksta iegulšanu, izmaksu kontroli un datu anotācijas iespējas. Lietotāji var bez piepūles pārvaldīt savus modeļus vizuāli un izmantot dokumentus, tīmekļa saturu vai Notion piezīmes kā AI kontekstu, ko Dify apstrādā priekšapstrādei un citām darbībām.

Portkey.ai

Portkey.ai ir Indijas jaunuzņēmums, kas specializējas valodu modeļu operācijās (LLMOps). Ar neseno sākuma finansējumu 3 miljonu ASV dolāru apmērā, ko vadīja Lightspeed Venture Partners, Portkey.ai piedāvā integrācijas ar ievērojamiem lieliem valodu modeļiem, piemēram, OpenAI un Anthropic. Viņu pakalpojumi rūpējas par ģeneratīvais AI uzņēmumiem, koncentrējoties uz savu LLM operāciju kopuma uzlabošanu, kas ietver reāllaika kanāriju testēšanu un modeļu precizēšanas iespējas.

Saistītās tēmas:LLM LLMops

Nākošais

AudioSep: atdaliet visu, ko aprakstāt

Nepalaidiet garām

OpenAI mērķis ir drosmīgāka klātbūtne izstrādātāju arēnā

Ājušs Mitāls

Pēdējos piecus gadus esmu pavadījis, iegremdējot sevi aizraujošajā mašīnmācīšanās un dziļās mācīšanās pasaulē. Mana aizraušanās un pieredze lika man piedalīties vairāk nekā 50 dažādos programmatūras inženierijas projektos, īpašu uzmanību pievēršot AI/ML. Mana pastāvīgā ziņkārība mani ir piesaistījusi arī dabiskās valodas apstrādei, jomai, kuru vēlos izpētīt tālāk.