stub Esminis greitos inžinerijos vadovas ChatGPT – Unite.AI
Susisiekti su mumis

Greita inžinerija

Esminis greitos inžinerijos vadovas „ChatGPT“.

mm
Atnaujinta on

Nuo pat pradžios ChatGPT AI srityje sukėlė bangas ir per rekordiškai trumpą laiką pritraukė daugiau nei 100 milijonų vartotojų. Įspūdingo ChatGPT našumo ir universalumo slaptasis padažas slypi menuose, subtiliai įkomponuotame į programavimą – greitą inžineriją.

2022 m. pristatytos DALL-E, „MidJourney“ ir „StableDiffusion“ pabrėžė žalingą „Generative AI“ potencialą. Bet buvo Atidarykite AIChatGPT, kuri vėliau 2022 m. tikrai užėmė pagrindinę vietą. Ir šis tempas nerodė jokių lėtėjimo ženklų.

„Google“ pranešimas apie Bardą ir „Meta's Lamma 2“.  atsakas į OpenAI ChatGPT žymiai sustiprino AI lenktynių pagreitį. Pateikdami šiems modeliams įvesties duomenis, vadovaujame jų elgesiui ir atsakymams. Tai verčia mus visus tam tikru mastu paskatinti inžinierius. Technologijų pramonė atkreipė dėmesį. Rizikos kapitalistai kaupia lėšas startuoliams, sutelkdami dėmesį į greitą inžineriją, pvz Vellum AI. Be to, „Forbes“ praneša, kad vadovauja inžinieriai atlyginimai viršija 300,000 XNUMX USD, rodo klestinčią ir vertingą darbo rinką.

Šiame straipsnyje mes išaiškinsime greitosios inžinerijos pasaulį ChatGPT kontekste. Išnagrinėsime pagrindinius principus ir metodus bei išnagrinėsime jų komercinį pritaikymą.

Pirmiausia išsiaiškinkime, kaip veikia „ChatGPT“ ir kaip šiame procese atlieka esminį greitosios inžinerijos vaidmenį.

„ChatGPT Prompt Engineering“ mechanika

„ChatGPT“ sėkmės paslaptis yra jos gebėjimas suprasti ir imituoti žmonių pokalbių niuansus. Modelis yra apmokytas įvairaus internetinio teksto spektro, tačiau svarbiausia, kad jis savo mokymo rinkinyje nežino konkrečių dokumentų ar šaltinių, užtikrindamas apibendrinimą, o ne konkretumą. Šis mokymo metodas leidžia ChatGPT generuoti kūrybingus atsakymus, naršyti sudėtinguose dialoguose ir netgi parodyti humoro jausmą. Tačiau svarbu atsiminti, kad „ChatGPT“ iš tikrųjų nesupranta arba neturi įsitikinimų; ji generuoja atsakymus pagal modelius, kuriuos išmoko treniruočių metu.

„ChatGPT“ gebėjimas suprasti ir reaguoti į žmonių kalbą niuansuotai ir atsižvelgiant į kontekstą daro juos neįtikėtinai universaliais įrankiais.

Šių modelių mechanika remiasi „žetonų“ koncepcija – atskiromis kalbos dalimis, kurios gali svyruoti nuo vieno simbolio iki viso žodžio. Šie modeliai vienu metu veikia su tam tikru žetonų skaičiumi (4096 GPT-3.5-Turbo arba 8192 arba 32768 GPT-4), numatant kitą galimų žetonų seką. Modeliai apdoroja žetonus naudodami sudėtingą tiesinę algebrą, numatydami labiausiai tikėtiną tolesnį žetoną.


„ChatGPT Tokenizer“ – greita inžinerija – „Unite AI“.

Pavyzdžiui, paprastas devynių žodžių sakinys gali virsti dešimčia žetonų. Net vienas sudėtingas žodis gali virsti keliais žetonais, o tai padeda modeliui geriau suprasti ir generuoti kalbą. Netgi sudėtingos žodžių struktūros kalbos, pvz., vokiečių, yra valdomos naudojant žetonus.

greita inžinerija – didelis kalbos modelio prieigos raktas ir numatymo iliustracija

 

GPT (generatyvus iš anksto apmokytas transformatorius) modeliai veikia generuodami po vieną prieigos raktą, pradedant nuo pirmojo prieigos rakto ir tęsiant iki paskutinio. Sugeneravęs kiekvieną prieigos raktą, modelis iš naujo peržiūri visą seką ir apdoroja ją dar kartą, kad sugeneruotų kitą prieigos raktą. Šis kartotinis procesas tęsiasi tol, kol sugeneruojamas galutinis prieigos raktas, todėl teksto generavimas panašus į didelę for-ciklą.

Tačiau čia yra klaida – šių atsakymų kokybė labai priklauso nuo gaunamų raginimų. Kaip ir norint valdyti pokalbį su žmogumi, vedant dialogą su ChatGPT reikia tam tikro lygio įgūdžių ir supratimo. Čia atsiranda greita inžinerija.

Kas yra greitoji inžinerija?

Prompt Engineering yra menas sukurti tikslius, veiksmingus raginimus / įvestį, skirtą dirbtiniam intelektui (NLP/Vision) modelius, tokius kaip ChatGPT, siekiant sukurti ekonomiškiausius, tikslius, naudingus ir saugius rezultatus.

Greita inžinerija neapsiriboja tik teksto generavimu, bet ir turi platų pritaikymą visame AI srityje. Jis vis dažniau naudojamas tokiose srityse kaip robotiniai procesų automatizavimo robotai, 3D turtas, scenarijai, roboto instrukcijos ir kitų tipų turinys bei skaitmeninė laikmena. Tai unikalus logikos, kodavimo, meno ir tam tikrais atvejais specialių modifikatorių derinys.

Nors raginimas gali apimti natūralios kalbos tekstą, vaizdus ar kitų tipų įvesties duomenis, išvestis gali labai skirtis įvairiose AI paslaugose ir įrankiuose. Kiekvienas įrankis turi specialius modifikatorius, apibūdinančius žodžių svorį, stilius, perspektyvas, išdėstymą ar kitas norimo atsakymo savybes.

Ši sritis yra būtina kuriant geresnes dirbtinio intelekto paslaugas ir siekiant geresnių rezultatų naudojant esamus generuojančius AI įrankius. Pavyzdžiui, įmonių kūrėjai dažnai naudoja greitą inžineriją, kad pritaikytų didelių kalbų modelius (LLM), pvz., GPT-3, kad galėtų padėti klientui. pokalbis arba atlikti užduotis, pvz., kurti konkrečiai pramonės šakai skirtas sutartis.

Šis kartotinis greito tobulinimo ir dirbtinio intelekto našumo matavimo procesas yra pagrindinis elementas, leidžiantis dirbtinio intelekto modeliams generuoti labai tikslingus, naudingus atsakymus įvairiuose kontekstuose.

Tapimas greitu inžinieriumi

GPT-4 modelio meistriškumas suvokiant sudėtingas instrukcijas ir tiksliai sprendžiant sudėtingas problemas daro jį neįkainojamu šaltiniu. Tačiau yra įvairių būdų, kaip pasiekti šio modelio galimybes, ir jų supratimas gali būti labai svarbus norint greitai atlikti inžinieriaus vaidmenį optimizuojant efektyvumą ir ekonomiškumą.

Iš esmės yra du būdai, kaip naudoti GPT modelius, pvz., GPT-4. Vienas iš būdų yra per OpenAI API, kur išlaidos skaičiuojamos už įvesties ir išvesties prieigos raktus. Pagal šį scenarijų išlaidos už 1 tūkst. prieigos raktų gali svyruoti atsižvelgiant į konteksto dydį. Pavyzdžiui, didesniame 32 0.06 kontekste kaina gali padidėti iki 0.12 USD už įvesties prieigos raktus ir XNUMX USD už išvesties prieigos raktus. Taigi, tvarkant daug užklausų, gali greitai susikaupti naudojimo išlaidos.

Arba „ChatGPT“, kuri naudoja GPT-4 modelį, veikia pagal prenumeratos modelį.

Kitas svarbus greitos inžinerijos uždavinys yra modelio parametrų derinimas. Šis procesas apima kintamųjų, kuriuos modelis naudoja prognozėms, koregavimą. Tiksliai sureguliavę šiuos parametrus, greiti inžinieriai gali pagerinti modelio atsakymų kokybę ir tikslumą, todėl jie bus tinkamesni ir naudingesni pagal kontekstą.

Nors daugelis greitai dirbančių inžinierių yra kilę iš technikos srities, šios srities daugiadiscipliniškumas daro ją prieinamą asmenims iš įvairių profesinių sluoksnių. Vis dažniau rašytojai, tyrinėtojai ir net menininkai naudoja savo unikalius įgūdžius, kad padidintų AI modelių veiksmingumą. Šis pokytis atsispindi ir darbo rinkoje, nes daugėja įmonių, ieškančių greitų inžinierių, turinčių įvairių įgūdžių ir išsilavinimo.

Greitas projektavimas ir inžinerija naudojant „ChatGPT“.

Greitas projektavimas ir inžinerija atlieka svarbų vaidmenį optimizuojant kalbos modelių veikimą ir apima ne tik klausimų kūrimą; jiems būtinas gilus AI modelio supratimas ir labai pasikartojantis bei rafinuotas požiūris.

„ChatGPT“ raginimo pavyzdys – „Prompt Engineering“ – „Unite AI“.

Greitas dizainas

Greitas dizainas iš esmės yra menas ir mokslas sukurti tobulą raginimą tam tikram didelės kalbos modeliui (LLM), pavyzdžiui, „ChatGPT“, kad būtų pasiektas aiškiai nurodytas tikslas. Tai mišinys iš:

  • LLM supratimas: skirtingų kalbų modeliai gali skirtingai reaguoti į tą patį raginimą. Be to, tam tikri kalbų modeliai gali turėti unikalių raktinių žodžių arba aktyviklių, kuriuos jie interpretuoja tam tikru būdu.
  • Domeno žinios: atitinkamos srities žinios yra labai svarbios kuriant raginimus. Pavyzdžiui, norint sugeneruoti raginimą nustatyti medicininę diagnozę, reikės medicininių žinių.
  • Iteratyvus metodas ir kokybės vertinimas: idealaus raginimo kūrimo procesas dažnai apima bandymus ir klaidas. Todėl labai svarbu turėti būdą įvertinti išvesties kokybę, o ne tik subjektyvų sprendimą, ypač naudojant raginimą didesniu mastu.

Greita inžinerija

Greita inžinerija yra išplėstinė greito projektavimo sritis, apimanti keletą svarbių procesų:

  • Skalių projektavimas: šis procesas apima meta raginimų (raginimų, generuojančių kitus raginimus) ir raginimų šablonų, kurie yra parametrizuoti raginimai, kuriuos galima sukurti vykdymo metu, kūrimą.
  • Įrankių projektavimas ir integravimas: raginimai kartais gali apimti išorinių įrankių rezultatus, todėl labai svarbu sklandžiai integruoti šiuos įrankius į sistemą.
  • Darbo eiga, planavimas ir greitas valdymas: norint įdiegti LLM programą, pavyzdžiui, pokalbių robotą, dažnai reikia tvarkyti raginimų bibliotekas, planuoti ir pasirinkti tinkamus raginimus bei efektyviai integruoti įvairius įrankius.
  • Raginimų įvertinimas ir kokybės užtikrinimas: šis aspektas apima metrikos ir procesų nustatymą, kad būtų galima automatiškai ir dalyvaujant žmonėms įvertinti raginimus.
  • Raginimo optimizavimas: AI modelio kaina ir delsa gali priklausyti nuo modelio pasirinkimo ir raginimo ilgio (žetonų skaičiaus).

Sukurta daug automatizuotų raginimų projektavimo metodų, įrankių ir struktūrų, kad būtų galima valdyti raginimus dideliu mastu. Tačiau svarbu suprasti, kad nė vienas iš šių įrankių negali pakeisti patyrusio greito inžinieriaus supratimo, sprendimo ir patirties.

Greita inžinerija: metodai ir geriausia praktika

1) Greitas išdėstymas ir aprašymas

Instrukcijų pateikimas raginimo pradžioje gali labai paveikti AI supratimą ir atsaką. Apsvarstykite užduotį apibendrinti tekstą taško formatu. Mažiau veiksmingas būdas būtų:

vartotojas: toliau pateiktą tekstą apibendrinkite kaip svarbiausių punktų sąrašą.
{teksto įvestis čia}

Kita vertus, veiksmingesnė technika galėtų būti:

vartotojas: toliau pateiktą tekstą apibendrinkite kaip svarbiausių punktų sąrašą.
Tekstas: ""
{teksto įvestis čia}
"" "

Aiškiai atskirdamas instrukcijas ir kontekstą tokiais simboliais kaip ### arba "", AI modelis gali geriau apibūdinti savo užduotį ir tekstą, kurį reikia apdoroti, taip pateikdamas tikslesnius ir aktualesnius atsakymus.

Antra, konkretus, aprašomasis ir išsamus konteksto, laukiamo rezultato, ilgio, formato, stiliaus ir tt gali žymiai padidinti AI atsakymų tikslumą. Tarkime, jums reikia sukurti trumpą mokslinio darbo apžvalgą patraukliu, neprofesionaliu stiliumi. Neaiški instrukcija, pvz., „Apibendrinkite mokslinį straipsnį“, duotų mažiau veiksmingų rezultatų, palyginti su konkrečiu, išsamiu raginimu:

vartotojas: sukurkite trumpą (apie 200 žodžių), įtraukiantį šio mokslinio darbo santrauką. Santrauka turi būti suprantama asmeniui, neturinčiam jokio mokslinio pagrindo, ir tiksliai atspindėti pagrindines straipsnio išvadas.
Popierius: ""
{mokslinio popieriaus tekstas čia}
"" "

2) „Persona Pattern“.

„Persona Pattern“ yra strategija, pagal kurią AI veikia tam tikra perspektyva, pvz., profesinio vaidmens ar išgalvoto veikėjo atžvilgiu. Ši taktika leidžia modeliui pateikti rezultatus, susijusius su konkrečiais vaidmenimis, kuriuos asmuo atliktų. Pavyzdžiui, galima nurodyti AI veikti kaip kibernetinio saugumo ekspertui per kodo peržiūrą. Šis modelis yra ypač naudingas, kai vartotojams reikia pagalbos, bet jie nėra tikri dėl tikslios informacijos, reikalingos išvestyje.

Kaip pavyzdį paimkite šiuos dalykus:

vartotojas: „Įsivaizduokite vyresniojo istoriko, besispecializuojančio Prancūzijos revoliucijos, asmenybę. Atsižvelgdami į šią asmenybę, paaiškinkite pagrindinius įvykius ir priežastis, vedusias į Prancūzijos monarchijos žlugimą.

Tikimasi, kad pagal šį scenarijų AI atsakys nuodugniais Prancūzijos revoliucijos analize, sutelkdamas dėmesį į monarchijos žlugimą, kaip tai darytų istorikas.

Pristatome naują informaciją

„ChatGPT“ neturi žinių, viršijančių mokymosi ribą, todėl negali pateikti informacijos apie naujausius įvykius ar atnaujinimus po mokymų. Tačiau galite pateikti naują informaciją apie modelį naudodami raginimus.

vartotojas: "Kas yra kriptovaliuta?"
ChatGPT: „Kriptovaliuta yra skaitmeninės arba virtualios valiutos rūšis, kuri saugumui naudoja kriptografiją. Labiausiai žinoma kriptovaliuta yra Bitcoin.

Dabar, jei prie raginimo pridėsime šiek tiek daugiau konteksto, paaiškinimą galime padaryti dar intuityvesnį:

vartotojas: „Paaiškinkite kriptovaliutos sąvoką vidurinės mokyklos mokiniui, studijuojančiam skaitmeninius finansus“
ChatGPT: „Įsivaizduokite, kad žaidžiate internetinį vaizdo žaidimą ir galite uždirbti pinigų, kad nusipirktumėte atnaujinimus ar naujus personažus. Kriptovaliuta yra panaši į tokią, tačiau užuot apsiriboję žaidimu, iš tikrųjų galite ją naudoti pirkdami realaus pasaulio prekes ir paslaugas. Tai tarsi skaitmeniniai pinigai, kurių nekontroliuoja joks bankas ar vyriausybė.

3) Raginimo dydžio apribojimai

Labai svarbu suprasti „ChatGPT“ dydžio apribojimą, nes jis tiesiogiai veikia informacijos, kurią galime įvesti, apimtį ir tipą. Kalbos modeliai nėra sukurti taip, kad vienu metu apdorotų neribotą kiekį duomenų. Jie turi įgimtą raginimo, kurį galime sukurti ir įvesti, dydį. Šis apribojimas turi didelę įtaką raginimų projektavimui ir vykdymui.

„ChatGPT“ turi prieigos raktų limitą (paprastai 2048 prieigos raktai), kuris apima ir raginimą, ir sugeneruotą atsakymą. Tai reiškia, kad ilgi raginimai gali apriboti atsakymo trukmę. Todėl svarbu, kad raginimai būtų glausti, tačiau būtų informatyvūs.

Praktikoje turime veikti kaip redaktoriai, pasirinktinai pasirenkant aktualiausią informaciją atliekamai užduočiai atlikti. Įsivaizduokite, kad rašote referatą ar straipsnį su žodžių ar puslapių limitu – negalite tiesiog išmesti atsitiktinių faktų, bet ir atidžiai atsirinkti ir susisteminti su tema susijusią informaciją.

vartotojas: „Atsižvelgdami į modelio apribojimus, apibendrinkite pagrindinius Antrojo pasaulinio karo įvykius mažiau nei 1000 žodžių.

Pripažindamas modelio žetonų apribojimus, šis raginimas nukreipia AI pateikti glaustą, bet išsamią Antrojo pasaulinio karo santrauką.

Pakartotinio naudojimo raginimai: pokalbio scenarijuje galite pakartotinai naudoti raginimus arba patikslinti juos pagal ankstesnius atsakymus. Tai suteikia pokalbio srautą ir palaiko sąveikos kontekstą.

4) Klausimo patikslinimo modelis

„ChatGPT“ taip pat gali padėti patikslinti jūsų klausimus. Pavyzdžiui, jei užduodate klausimą, jis gali pasiūlyti geriau suformuluotą klausimą, kad rezultatai būtų tikslesni.

Klausimo patikslinimo modelis apima LLM patikslinant vartotojo užduodamus klausimus. Tai ypač naudinga, kai vartotojai nėra srities ekspertai arba nežino, kaip suformuluoti savo klausimą.

Raginimo pavyzdys gali atrodyti taip:

vartotojas: „Kai užduodu klausimą apie duomenų mokslą, pasiūlykite išsamesnį klausimą, atsižvelgdami į statistinės analizės specifiką, ir paklauskite, ar noriu tęsti patobulintą klausimą.

Tikimasi, kad AI patobulins vartotojo bendruosius duomenų mokslo klausimus iki išsamesnių klausimų, atsižvelgdama į statistinės analizės aspektus.

5) Kognityvinio patikrinimo modelis

Kognityvinio tikrinimo šablonas suskaido sudėtingus klausimus į mažesnius, valdomus antrinius klausimus. Tada atsakymai į šiuos antrinius klausimus sujungiami, kad būtų pateiktas išsamus atsakymas į pagrindinį klausimą. Šis metodas yra naudingas, kai pradiniai klausimai yra per aukšto lygio arba kai reikia papildomo aiškumo, kad būtų pateiktas išsamus atsakymas.

Pavyzdžiui:

vartotojas: „Jei užduodu klausimą apie klimato kaitą, suskirstykite jį į tris mažesnius klausimus, kurie padėtų pateikti tikslesnį atsakymą. Sujunkite atsakymus į šiuos antrinius klausimus, kad gautumėte galutinį atsakymą.

Pagal šį scenarijų AI suskirstys sudėtingą klausimą apie klimato kaitą į tris valdomus klausimus. Gavęs atsakymus į šiuos antrinius klausimus, AI juos sujungs, kad pateiktų išsamesnį ir tikslesnį atsakymą.

Šis modelis apima kelių klausimų generavimą, kad gautumėte tikslesnį galutinį atsakymą. Tai informacijos tikrinimo ir konsolidavimo procesas, kad būtų pasiektas tvirtas galutinis rezultatas

6) Keletą kartų skatinantis požiūris

Keleto kadrų raginimas yra galingas būdas mokyti AI modelius laikytis tam tikrų modelių arba atlikti užduotis. Idėja – prieš užduodant norimą klausimą modeliui pateikti daugybę pavyzdžių. Tai padeda nustatyti norimą elgesį ir nukreipti modelio atsakymus.

Apsvarstykite scenarijų, kai vartotojas bando sukurti glaustą, įtikinamą naujos techninės programėlės rinkodaros kopiją:

vartotojas: „Štai keletas technologijų rinkodaros kopijų pavyzdžių: „Patirk muziką kaip niekada anksčiau su mūsų pažangiausiomis belaidėmis ausinėmis“. „Užfiksuokite savo pasaulį stulbinančia 4K raiška su mūsų itin elegantiška veiksmo kamera.“ Atsižvelgdami į šiuos pavyzdžius, sukurkite mūsų naujo dirbtinio intelekto išmaniojo laikrodžio rinkodaros kopiją.

ChatGPT: „Įgalinkite savo gyvenimo būdą naudodami mūsų dirbtinio intelekto išmanųjį laikrodį – jūsų sveikatos, ryšio ir produktyvumo palydovą“. Nepaprastas mokymosi per kelis kartus bruožas yra tas, kad nereikia detaliai aprašyti, kaip atlikti užduotį. Vietoj to reikia parodyti, kas daroma, todėl jis gali būti tinkamas daugeliui programų.

Be to, šis metodas apima ne tik paprastą įvesties ir išvesties susiejimą. Modelis taip pat gali būti išmokytas atlikti tarpinius veiksmus, kad būtų pasiektas tikslas.

7) Minčių grandinės raginimas

Neseniai paskelbtame moksliniame darbe „Minčių grandinės raginimas skatina samprotavimą didelės kalbos modeliuose“ autoriai Jasonas Wei ir komanda siekia paskatinti samprotavimą dideliuose kalbos modeliuose. Užuot naudojusi tradicinius tiesioginius raginimus, komanda naudoja daugybę tarpusavyje susijusių raginimų, sudarydama „minčių grandinę“.

Pavyzdžiui, vartotojas gali būti suinteresuotas galimu dirbtinio intelekto poveikiu darbo rinkoms:

vartotojas: „Ar galėtumėte trumpai paaiškinti dirbtinio intelekto sąvoką?

ChatGPT: „Dirbtinis intelektas arba AI reiškia mašinos gebėjimą imituoti protingą žmogaus elgesį. Tai yra apie mašinų, galinčių mąstyti ir mokytis kaip žmonės, kūrimą, leidžiančią jiems atlikti tokias užduotis kaip kalbos vertimas, sprendimų priėmimas ir problemų sprendimas.

vartotojas: „Kaip AI įtakoja dabartinę darbo rinką?

ChatGPT: „AI kuria naujas darbo vietas ir keičia esamų pobūdį. Viena vertus, jis automatizuoja įprastas užduotis, todėl tam tikruose sektoriuose atsiranda darbo vietų perkėlimas. Kita vertus, atsiranda poreikis atlikti anksčiau neegzistuojančius vaidmenis, pvz., dirbtinio intelekto etikos pareigūnus, duomenų analitikus ir mašininio mokymosi inžinierius. Be to, dirbtinis intelektas gali išplėsti žmonių vaidmenis, todėl žmonės gali efektyviau ir tiksliau atlikti užduotis.

Minčių grandinės raginimas seka susijusių raginimų eigą, palaiko „pokalbį“ su modeliu, kuris nukreipia jį į tikslesnius ir kontekstą atitinkančius atsakymus.

„ChatGPT“ API ir greitos inžinerijos supratimas kūrėjo požiūriu

Kūrėjo ar tyrėjo požiūriu greita inžinerija yra sudėtingesnis procesas. Tai apima algoritmų ir metodų, padedančių dirbtinio intelekto modeliui suprasti raginimus ir veiksmingiau į juos reaguoti, kūrimą. Tai gali apimti dviprasmiškų raginimų tvarkymo strategijas, raginimų konteksto nustatymą arba raginimų sujungimą, kad būtų skatinami sudėtingesni mąstymo procesai AI

 

„ChatGPT“ API SĄSAJA

Aukščiau pateiktoje iliustracijoje vartotojas sąveikauja su pokalbių sąsaja, kurią palaiko GPT-4. Jų įvestis yra sustiprinta siekiant aiškumo ir konteksto nuoseklumo specializuotu moduliu, prieš perduodant juos į AI modelį. Šio modulio tikslas yra patobulinti ir pagerinti vartotojo indėlį, kad jis geriau suprastų, kartu išlaikant pokalbio kontekstą. AI atsakymas, sukurtas remiantis patobulintu raginimu, grąžinamas vartotojui per pokalbių sąsają. Sąveikos istorija atnaujinama nuosekliai, išlaikant pokalbio kontekstą. Apskritai ši diagrama iliustruoja dinamišką vartotojo ir AI pokalbių srautą, kurį įgalina greiti inžineriniai metodai.

Šios „ChatGPT“ API sąsaja sukurta naudojant įvairius hiperparametrus, kurie leidžia vartotojams patobulinti AI atsakymus į raginimus, todėl jie yra veiksmingesni ir universalesni. Tai apima parametrus Temperature, Maximum Length ir Stop Sequences. Panagrinėkime, kaip jie veikia ir gali būti naudojami įvairiuose kontekstuose.

 

Atidarykite AI Chatgpt API – hiperparametrai

1) Temperatūra

Temperatūros parametras turi įtakos AI atsakymų atsitiktinumui. Aukštesnė temperatūra, pvz., 1.0, skatina daugiau atsitiktinių rezultatų, todėl atsakymai gali būti įvairūs, bet galbūt ne į temą. Priešingai, žemesnė temperatūra, pvz., 0.2, skatina AI pasirinkti labiau deterministinius atsakymus, kurie gali būti naudingi sutelktiems ir specifiniams išėjimams, tačiau gali trūkti įvairovės.

Pavyzdys: jei rašote kūrybingą istoriją ir norite nenuspėjamų, vaizduotės elementų, nustatykite aukštesnę temperatūrą. Raginimas gali būti toks: „Parašykite trumpą istoriją apie laiku keliaujančią katę“. Esant aukštai temperatūrai galite gauti laukinę, fantastišką pasaką su nenuspėjamais vingiais.

2) Maksimalus ilgis

Šis parametras valdo didžiausią modelio išvesties žetonų ilgį, kuris apima ir pranešimo įvesties, ir pranešimo išvesties žetonus. Nustačius aukštesnę ribą galima gauti ilgesnius atsakymus, o esant žemesnei ribai, išvestis trumpa ir glausta.

Pavyzdys: norėdami gauti trumpus atsakymus į smulkmeniškus klausimus, pvz., „Kas laimėjo Nobelio literatūros premiją 2020 m.?“ galbūt norėsite nustatyti mažą didžiausią ilgį, kad atsakymas būtų glaustas ir tiesioginis.

3) Sustabdyti sekas

Stabdymo sekos yra konkrečios teksto eilutės, kuriose modelis, su jomis susidūręs, nustoja generuoti tolesnę išvestį. Ši funkcija gali būti naudinga norint valdyti išvesties ilgį arba nurodyti modeliui sustoti ties loginiais galiniais taškais.

Pavyzdys: oficialiam laiške galite naudoti „Pagarbiai“ kaip sustabdymo seką, kad užtikrintumėte, jog AI negeneruotų jokio papildomo teksto, išskyrus tinkamą laiško pabaigą.

4) Viršutinė P

Parametras „Top P“, dar žinomas kaip branduolio atranka, yra metodas, suteikiantis dinamišką žodžių skaičiaus pasirinkimą kiekviename modelio numatymo etape. Mažesnė vertė, pvz., 0.5, užtikrina saugesnę ir tikslingesnę išvestį. Didesnė reikšmė, pvz., 0.9, apima platesnį žodžių pasirinkimą, todėl gaunami įvairesni rezultatai.

Pavyzdys: jei kuriate dirbtinį intelektą eilėraščiams rašyti ir norite, kad jame būtų naudojamas platus žodynas ir stilistinės frazės, galite nustatyti „Top P“ į didesnę reikšmę. Raginimas galėtų būti: „Sukurk eilėraštį apie rudens grožį“.

5) Dažnumo bauda

Dažnumo nuobauda kontroliuoja, kiek modelis turėtų teikti pirmenybę retesniems žodžiams. Didesnė bauda (iki 1) skatina modelį naudoti rečiau įprastus žodžius, o mažesnė reikšmė (iki -1) skatina modelį naudoti daugiau įprastų žodžių.

Pavyzdys: jei bandote sukurti verslo pasiūlymą ir norite vengti žargono, galite nustatyti mažesnę dažnumo baudą, kad kalba būtų aiški ir prieinama.

6) Buvimo bausmė

Parametras „Presence Penalty“ turi įtakos modeliui nubausti už naujų idėjų ar temų, kurių nebuvo pokalbio istorijoje, generavimą. Didesnės vertės skatina modelį laikytis jau minėtų temų, o mažesnės – leidžia modeliui laisviau diegti naujas sąvokas.

Pavyzdys: protų šturmo sesijose galite nustatyti mažesnę buvimo baudą, kad paskatintumėte įvairias idėjas. Galite naudoti raginimą, pvz., „Sukurkite naujoviškas rinkodaros strategijas internetinei švietimo platformai“.

Greitos inžinerijos taikymas pramonėje

Klientų aptarnavimas ir DUK generavimas

Klientų aptarnavimo pasaulyje negalima pervertinti greitos inžinerijos naudingumo. Vienas iš novatoriškiausių AI pritaikymų šiame sektoriuje yra dirbtinio intelekto valdomų pokalbių robotų atsiradimas. Pavyzdžiui, apsvarstykite elektroninės prekybos platformą, tokią kaip „eBay“. Jie naudoja pažangią pokalbių robotų sistemą, kuri buvo tiksliai suderinta su greita inžinerija, kad būtų galima apdoroti klientų užklausas. Pokalbių robotas gali išspręsti įvairias problemas, įskaitant, bet neapsiribojant, pristatymo atnaujinimus, pinigų grąžinimo užklausų apdorojimą ir atsakymus į užklausas apie produkto specifikacijas.

Kai klientas klausia: „Kur yra mano užsakymas?“, AI pokalbių robotas atsako ne tik bendru pranešimu; Vietoj to jis prisijungia prie užsakymų valdymo sistemos, gauna duomenis realiuoju laiku ir pateikia suasmenintą atsakymą, pvz.: „Jūsų užsakymas Nr. 1234 šiuo metu siunčiamas ir tikimasi, kad jis bus pristatytas rytoj vakare“. Tokie suasmeninti ir aktualūs atsakymai yra tiesioginis gerai parengtų raginimų, kurie yra šių išmaniųjų pokalbių robotų sistemų pagrindas, rezultatas.

Turinio kūrimas ir rinkodara

Turinio kūrimo ir rinkodaros srityje greita inžinerija yra AI pagrįstų naujovių kertinis akmuo. Įmonės mėgsta Grammarly naudokite dirbtinio intelekto variklius, kad padėtų vartotojams kurti patrauklų ir gramatiškai teisingą turinį. Šios platformos veikia pagal raginimus, vadovaudamosi AI modeliu, kad būtų galima generuoti pasiūlymus ar pataisymus, kurie gali pagerinti bendrą turinio kokybę.

Apsvarstykite vartotoją, kuris siekia sukurti patrauklų turinį apie AI pažangą. Jie galėtų naudoti tokį raginimą: „Paprastu ir patraukliu būdu paaiškinkite naujausius dirbtinio intelekto pasiekimus pradedantiesiems“. AI, pasinaudojęs šiuo raginimu, gali parengti glaustą, skaitytojui patogų kūrinį apie sudėtingas AI koncepcijas, taip sumažindamas žinių spragą ir skatindamas skaitytojų susidomėjimą. Tai tik vienas iš daugelio būdų, kaip greita inžinerija gali pagerinti turinio kūrimą.

Kodavimo pagalba ir kodų interpretavimas

Šiame kontekste greita inžinerija yra tarsi dvipusis kūrėjo ir AI pokalbis. Kūrėjas AI pateikia raginimą – problemos ar funkcijos, kurią reikia įdiegti, aprašymą, o AI atsako pateikdamas atitinkamą kodo dalį arba pasiūlymą, padedantį programinės įrangos kūrimo procesui.

Be to, dirbtinio intelekto patobulinti kodavimo įrankiai, pvz „GitHub“ kopilotas, buvo sukurti naudojant OpenAI patirtį. Šie pažangūs įrankiai buvo plačiai mokomi atlikti sudėtingas užduotis, pvz., užpildyti neužbaigtus kodo failus. Jie tai daro nepaisant ryškių skirtumų tarp kodo rašymo proceso ir užduoties jį užbaigti.

Švietimas ir individualizuotas mokymasis

AI integracija į švietimo sektorių pastaraisiais metais pastebimai išaugo, o greita inžinerija vaidina pagrindinį vaidmenį. Dirbtinio intelekto dėstytojai buvo sukurti siekiant suteikti individualizuotą mokymosi patirtį, prisitaikant prie kiekvieno mokinio mokymosi tempo ir stiliaus.

Paimkite, pavyzdžiui, AI pagrįstą mokymosi platformą Duolingo. Jis naudoja gerai parengtus raginimus, kad įvertintų mokinio naujos kalbos mokėjimą ir pateiktų tinkamus pratimus. Jei mokinys mokosi prancūzų kalbos ir jam sunku konjuguoti, dirbtinio intelekto dėstytojas gali pristatyti pritaikytus pratimus, pvz.: „Sujunkite veiksmažodį „ėdžios“ (valgyti) esamuoju laiku. Mokinio pasiekimai ir pažanga yra nuolat vertinami, o raginimai atitinkamai tobulinami ir pritaikomi, užtikrinant individualizuotą ir efektyvią mokymosi patirtį.

Nesustabdomas greitos inžinerijos augimas

Kai artėjame prie mūsų gilaus nardymo į greitą inžineriją pabaigos, labai svarbu pabrėžti, kaip ši sritis iš tikrųjų atsiranda. Esame pačioje epochos taške, kai dirbtinis intelektas neapsiriboja atsakymu į iš anksto užprogramuotas komandas, vystosi, kad apdorotų ir vykdytų kruopščiai sukonstruotus raginimus, kurie duoda labai konkrečius rezultatus.

Daugybė programų, kurias ištyrėme, nuo klientų aptarnavimo iki turinio kūrimo, duomenų analizės ir asmeninio mokymosi, yra tik ledkalnio viršūnė. Suintensyvėjant tyrimams šioje srityje galime tikėtis dar sudėtingesnių ir niuansesnių operatyvios inžinerijos panaudojimo būdų. Žmogaus kūrybiškumo ir AI išradingumo konvergencija stumia mus į ateitį, kurioje dirbtinis intelektas ne tik padės, bet ir pakeis įvairius mūsų gyvenimo aspektus.

Pastaruosius penkerius metus praleidau pasinerdamas į žavų mašininio mokymosi ir giluminio mokymosi pasaulį. Mano aistra ir patirtis paskatino mane prisidėti prie daugiau nei 50 įvairių programinės įrangos inžinerijos projektų, ypatingą dėmesį skiriant AI/ML. Mano nuolatinis smalsumas taip pat patraukė mane į natūralios kalbos apdorojimą – sritį, kurią noriu tyrinėti toliau.