Nopea suunnittelu

Viimeisimmät modernit edistysaskeleet nopeassa suunnittelussa: kattava opas

Päivitetty on Marraskuussa 15, 2024

Aayush Mittal

Nopea suunnittelu, taiteesta ja tieteestä valmistaa kehotteita, jotka saavat toivottuja vastauksia LLM:iltä, on tullut keskeinen tutkimus- ja kehitysalue.

Päättelykyvyn parantamisesta saumattoman integroinnin mahdollistamiseen ulkoisten työkalujen ja ohjelmien kanssa nopean suunnittelun viimeisimmät edistysaskeleet avaavat uusia rajoja tekoälylle. Alla käsittelemme viimeisimpiä huipputekniikoita ja strategioita, jotka muokkaavat nopean suunnittelun tulevaisuutta.

Nopea suunnittelu

Kehittyneet kehotusstrategiat monimutkaiseen ongelmanratkaisuun

Vaikka CoT-kehote on osoittautunut tehokkaaksi monissa päättelytehtävissä, tutkijat ovat tutkineet edistyneempiä kehotusstrategioita vieläkin monimutkaisempien ongelmien ratkaisemiseksi. Yksi tällainen lähestymistapa on Vähiten useimmille -kehotus, joka jakaa monimutkaisen ongelman pienempiin, paremmin hallittaviin osaongelmiin, jotka ratkaistaan itsenäisesti ja yhdistetään sitten lopulliseen ratkaisuun.

Toinen innovatiivinen tekniikka on Tree of Thoughts (ToT) -kehotus, jonka avulla LLM voi luoda useita päättelylinjoja tai "ajatuksia" rinnakkain, arvioida omaa edistymistään kohti ratkaisua ja perääntyä tai tutkia vaihtoehtoisia polkuja tarpeen mukaan. Tämä lähestymistapa hyödyntää hakualgoritmeja, kuten leveys- tai syvyyshaku, mikä mahdollistaa LLM:n ennakoivan ja perääntyvän ongelmanratkaisuprosessin aikana.

LLM:ien integrointi ulkoisten työkalujen ja ohjelmien kanssa

Vaikka LLM:t ovat uskomattoman tehokkaita, niillä on luontaisia rajoituksia, kuten kyvyttömyys saada käsiksi ajantasaista tietoa tai suorittaa tarkkaa matemaattista päättelyä. Näiden haittojen korjaamiseksi tutkijat ovat kehittäneet tekniikoita, joiden avulla LLM:t voivat integroitua saumattomasti ulkoisten työkalujen ja ohjelmien kanssa.

Yksi huomionarvoinen esimerkki on Toolformer, joka opettaa LLM:itä tunnistamaan skenaariot, jotka edellyttävät ulkoisten työkalujen käyttöä, määrittämään käytettävän työkalun, antamaan asiaankuuluvia tietoja ja sisällyttämään työkalun tuotoksen lopulliseen vastaukseen. Tämä lähestymistapa sisältää synteettisen opetustietojoukon rakentamisen, joka osoittaa erilaisten tekstistä tekstiksi -sovellusliittymien oikean käytön.

Toinen innovatiivinen kehys, Chameleon, käyttää "plug-and-play" -lähestymistapaa, jonka avulla LLM-pohjainen keskusohjain voi luoda luonnollisen kielen ohjelmia, jotka muodostavat ja suorittavat monenlaisia työkaluja, mukaan lukien LLM:t, visiomallit, verkkohakukoneet ja Python-funktiot. Tämä modulaarinen lähestymistapa antaa Chameleonille mahdollisuuden käsitellä monimutkaisia, multimodaalisia päättelytehtäviä hyödyntämällä eri työkalujen ja mallien vahvuuksia.

Peruskehotusstrategiat

Zero-Shot -kehotus

Nollakuvaus sisältää tehtävän kuvauksen kehotteessa ja mallin pyytämisen ratkaisemaan se ilman esimerkkejä. Esimerkiksi sanan "juusto" kääntämiseksi ranskaksi nollakuvakehote voi olla:

Translate the following English word to French: cheese.

Tämä lähestymistapa on yksinkertainen, mutta sitä voi rajoittaa tehtäväkuvausten monitulkintaisuus.

Muutaman laukauksen kehotus

Muutaman laukauksen kehotus parantaa nollakohtaa lisäämällä useita esimerkkejä tehtävästä. Esimerkiksi:

Translate the following English words to French:

1. apple => pomme

2. house => maison

3. cheese => fromage

Tämä menetelmä vähentää epäselvyyttä ja tarjoaa selkeämmän oppaan mallille hyödyntäen LLM:ien kontekstin sisäistä oppimiskykyä.

Ohjekehotus

Ohjekehote kuvaa selkeästi halutun tulosteen, mikä on erityisen tehokasta malleissa, jotka on koulutettu noudattamaan ohjeita. Esimerkiksi:

Translate the word "cheese" to French. The correct translation is "fromage."

Mallit, kuten GPT-4, on erityisesti hienosäädetty noudattamaan näitä ohjeita tarkasti.

Kehittyneet kehotustekniikat

Päättelykyvyn parantaminen ajatusketjun kehotuksella

Yksi nopean suunnittelun merkittävimmistä läpimurroista on ollut Chain-of-thought (CoT) kehotus. Tällä tekniikalla pyritään saamaan esiin ja parantamaan LLM:ien päättelykykyä rohkaisemalla heitä luomaan vaiheittainen ajatusprosessi tai perustelut ennen lopullisen vastauksen antamista.

Vasemmalla: Perinteiset menetelmät LLM-kehotuksiin perustuvat yleisiin syötteisiin (0-shot CoT) tai edellyttävät merkittyjä esimerkkejä (muutaman kuvan CoT). Oikealla: Uusi lähestymistapa kannustaa LLM:itä luomaan itse asiaankuuluvia esimerkkejä ennen ongelmanratkaisua, mikä poistaa merkintöjen tarpeen ja mukauttaa esimerkkejä jokaiseen ainutlaatuiseen ongelmaan.

CoT-kehotus toimii esittelemällä LLM:lle esimerkkejä, jotka sisältävät syötteen ja tulosteen lisäksi myös välivaiheet tai "ajatteluketjun", joka johtaa ratkaisuun. Näistä esimerkeistä oppimalla LLM voi sitten luoda oman ajatusketjunsa, kun sille esitetään uusia ongelmia, mikä parantaa kykyään käsitellä monimutkaisia päättelytehtäviä.

Esimerkiksi:

Syöte: Nataliella on 3 omenaa, ja hän haluaa jakaa ne tasapuolisesti kahden ystävänsä kanssa. Kuinka monta omenaa kukin saa? Ajatusketju: Okei, jaetaan tämä vaiheittain:

Nataliella on 3 omenaa
Hän haluaa jakaa ne tasapuolisesti 2 ystävän kanssa
Yhteensä siis 3 henkilöä (Natalie ja hänen 2 ystävänsä)
Jotta omenat jaetaan tasan, jaamme omenoiden kokonaismäärän (3) ihmisten lukumäärällä (3)
3 jaettuna 3 on 1
Siksi jokainen saa 1 omenan. Tulos: Jokainen saa 1 omenan.

Luomalla päättelyprosessin eksplisiittisesti LLM:t, kuten GPT-3 ja Codex, ovat osoittaneet merkittäviä parannuksia aritmeettisissa, järkeissä ja symbolisissa päättelytehtävissä.

Itsejohdonmukaisuus

Itsejohdonmukaisuus parantaa CoT-kehotusten luotettavuutta luomalla useita ajatusketjuja ja saamalla enemmistön lopullisesta vastauksesta. Tämä menetelmä lieventää minkä tahansa yksittäisen virheellisen päättelypolun vaikutusta.

Vähiten kehotuksiin

Vähimmäisestä useimpiin kehotteet jakavat monimutkaiset ongelmat yksinkertaisempiin osaongelmiin, ratkaisemalla jokaisen peräkkäin ja käyttämällä aiempien ratkaisujen kontekstia seuraavien vaiheiden informoimiseksi. Tämä lähestymistapa on hyödyllinen monivaiheisissa päättelytehtävissä.

Viimeaikaiset edistysaskeleet nopeassa suunnittelussa

Nopea suunnittelu kehittyy nopeasti, ja useita innovatiivisia tekniikoita on syntynyt suurten kielimallien (LLM) suorituskyvyn parantamiseksi. Tutustutaanpa joihinkin näistä huippuluokan menetelmistä yksityiskohtaisesti:

Auto-CoT (automaattinen ajatusketjun kehotus)

Mikä se on: Auto-CoT on menetelmä, joka automatisoi päättelyketjujen luomisen LLM:ille, mikä poistaa manuaalisesti muotoiltujen esimerkkien tarpeen. Tämä tekniikka käyttää zero-shot Chain-of-thought (CoT) -kehotetta, jossa mallia ohjataan ajattelemaan askel askeleelta päättelyketjujen luomiseksi.

Näin se toimii:

Zero-Shot CoT-kehotus: Mallille annetaan yksinkertainen kehote, kuten "Ajattelemme askel askeleelta", mikä rohkaisee yksityiskohtaiseen päättelyyn.
Mielenosoitusten monimuotoisuus: Auto-CoT valitsee erilaisia kysymyksiä ja luo päättelyketjuja näille kysymyksille varmistaen erilaisia ongelmatyyppejä ja päättelymalleja.

edut:

Automaatio: Vähentää päättelyesittelyjen luomiseen vaadittavaa manuaalista työtä.
Suorituskyky: Useissa benchmark-päättelytehtävissä Auto-CoT on vastannut tai ylittänyt manuaalisen CoT-kehotteen suorituskyvyn.

Monimutkaisuuteen perustuva kehotus

Mikä se on: Tämä tekniikka valitsee kehotteeseen sisällytettävät esimerkit, jotka ovat monimutkaisimpia (eli useimmat päättelyvaiheet). Sen tavoitteena on parantaa mallin suorituskykyä monivaiheista päättelyä vaativissa tehtävissä.

Näin se toimii:

Esimerkkivalinta: Kehotteet valitaan niiden sisältämien päättelyvaiheiden määrän perusteella.
Monimutkaisuuteen perustuva johdonmukaisuus: Dekoodauksen aikana näytteistetään useita päättelyketjuja, ja enemmistöäänestys otetaan monimutkaisimmista ketjuista.

edut:

Parannettu suorituskyky: Huomattavasti parempi tarkkuus monivaiheisissa päättelytehtävissä.
Vankkuus: Tehokas jopa erilaisissa kehotteissa ja kohinaisissa tiedoissa.

Progressive-Hint Prompting (PHP)

Mikä se on: PHP iteratiivisesti tarkentaa mallin vastauksia käyttämällä aiemmin luotuja perusteluja vihjeinä. Tämä menetelmä hyödyntää mallin aiempia vastauksia ohjatakseen sitä kohti oikeaa vastausta useiden iteraatioiden kautta.

Näin se toimii:

Alkuperäinen vastaus: Malli luo perusvastauksen käyttämällä standardikehotetta.
Vinkkejä ja tarkennuksia: Tätä perusvastausta käytetään sitten vihjeenä myöhemmissä kehotteissa vastauksen tarkentamiseksi.
Iteratiivinen prosessi: Tämä prosessi jatkuu, kunnes vastaus vakiintuu peräkkäisten iteraatioiden aikana.

edut:

Tarkkuus: Merkittäviä parannuksia päättelyn tarkkuudessa.
Tehokkuus: Vähentää tarvittavien näytepolkujen määrää, mikä parantaa laskennan tehokkuutta.

Hajautettu kehote (DecomP)

Mikä se on: DecomP hajottaa monimutkaiset tehtävät yksinkertaisempiin osatehtäviin, joista jokainen käsitellään tietyn kehotteen tai mallin mukaan. Tämä modulaarinen lähestymistapa mahdollistaa monimutkaisten ongelmien tehokkaamman käsittelyn.

Näin se toimii:

Tehtävän hajottaminen: Pääongelma on jaettu yksinkertaisempiin osatehtäviin.
Alatehtävien käsittelijät: Jokaista osatehtävää hallitaan erillisen mallin tai kehotteen avulla.
Modulaarinen integrointi: Näitä käsittelijöitä voidaan optimoida, korvata tai yhdistää tarpeen mukaan monimutkaisen tehtävän ratkaisemiseksi.

edut:

Joustavuus: Helppo virheenkorjaus ja tiettyjen alitehtävien parantaminen.
Skaalautuvuus: Käsittelee pitkiä konteksteja ja monimutkaisia osatehtäviä tehokkaasti.

Hypoteesit-teorioihin (HtT) kehotus

Mikä se on: HtT käyttää tieteellistä löytöprosessia, jossa malli luo ja vahvistaa hypoteeseja monimutkaisten ongelmien ratkaisemiseksi. Tämä menetelmä sisältää sääntökirjaston luomisen vahvistetuista hypoteeseista, joita malli käyttää päättelyyn.

Näin se toimii:

Induktiovaihe: Malli luo mahdollisia sääntöjä ja tarkistaa ne koulutusesimerkkien perusteella.
Sääntökirjaston luominen: Vahvistetut säännöt kerätään sääntökirjastoksi.
Vähennysvaihe: Malli soveltaa näitä sääntöjä uusiin ongelmiin käyttämällä sääntökirjastoa ohjaamaan päättelyään.

edut:

Tarkkuus: Vähentää virheiden todennäköisyyttä turvautumalla vahvistettuihin sääntöihin.
Siirrettävyys: Opittuja sääntöjä voidaan siirtää eri mallien ja ongelmamuotojen välillä.

Työkaluilla tehostetut kehotustekniikat

Toolformer

Toolformer integroi LLM:t ulkoisiin työkaluihin tekstistä tekstiksi -sovellusliittymien kautta, jolloin malli voi käyttää näitä työkaluja ongelmien ratkaisemiseen, joita se ei muuten voisi. Esimerkiksi LLM voi kutsua laskimen API:ta suorittaakseen aritmeettisia operaatioita.

Kameleontti

Kameleontti käyttää LLM-pohjaista keskusohjainta luodakseen ohjelman, joka koostuu useista työkaluista monimutkaisten päättelytehtävien ratkaisemiseksi. Tämä lähestymistapa hyödyntää laajaa työkaluvalikoimaa, mukaan lukien visiomallit ja verkkohakukoneet, parantaakseen ongelmanratkaisukykyä.

GPT4Tools

GPT4Tools hienosäätää avoimen lähdekoodin LLM:t käyttämään multimodaalisia työkaluja itseohjautuvan lähestymistavan avulla, mikä osoittaa, että jopa patentoidut mallit voivat tehokkaasti hyödyntää ulkoisia työkaluja suorituskyvyn parantamiseksi.

Gorilla ja HuggingGPT

Sekä Gorilla että HuggingGPT integroida LLM:t erikoistuneisiin syväoppimismalleihin, jotka ovat saatavilla verkossa. Nämä järjestelmät käyttävät hakutietoista hienosäätöprosessia ja vastaavasti suunnittelu- ja koordinointilähestymistapaa monimutkaisten tehtävien ratkaisemiseksi, joihin liittyy useita malleja.

Ohjelmaavusteiset kielimallit (PAL) ja ajatusohjelmat (POT)

Ulkoisten työkalujen kanssa integroinnin lisäksi tutkijat ovat selvittäneet tapoja parantaa LLM:n ongelmanratkaisukykyä yhdistämällä luonnollista kieltä ohjelmointirakenteisiin. Ohjelmaavusteiset kielimallit (PAL) ja ajatusohjelmat (POT) ovat kaksi tällaista lähestymistapaa, jotka hyödyntävät koodia LLM:n päättelyprosessin lisäämiseksi.

Kaverukset kehota LLM:ää luomaan perustelu, joka lomittaa luonnollisen kielen koodiin (esim. Python), joka voidaan sitten suorittaa lopullisen ratkaisun tuottamiseksi. Tämä lähestymistapa käsittelee yleistä epäonnistumistapausta, jossa LLM:t luovat oikean päättelyn, mutta tuottavat väärän lopullisen vastauksen.

Samoin PoT:t käyttävät SymPyn kaltaista symbolista matemaattista kirjastoa, jonka avulla LLM voi määritellä matemaattisia symboleja ja lausekkeita, jotka voidaan yhdistää ja arvioida SymPyn ratkaisutoiminnolla. Delegoimalla monimutkaiset laskelmat kooditulkin tehtäväksi nämä tekniikat erottavat päättelyn laskennasta, jolloin LLM:t voivat käsitellä monimutkaisempia ongelmia tehokkaasti.

Kontekstin ymmärtäminen ja hyödyntäminen Windows

LLM:ien suorituskyky riippuu suuresti heidän kyvystään käsitellä ja hyödyntää kehotteessa annettua kontekstia. Tutkijat ovat tutkineet, kuinka LLM:t käsittelevät pitkiä konteksteja ja merkityksettömän tai häiritsevän tiedon vaikutusta heidän tuotoksiinsa.

"Lost in the Middle" -ilmiö korostaa, kuinka LLM:t kiinnittävät enemmän huomiota kontekstinsa alussa ja lopussa olevaan tietoon, kun taas keskellä oleva tieto jää usein huomiotta tai "kadotetaan". Tämä näkemys vaikuttaa nopeaan suunnitteluun, koska asianmukaisten tietojen huolellinen sijoittaminen kontekstiin voi vaikuttaa merkittävästi suorituskykyyn.

Toinen tutkimuslinja keskittyy lieventämään epäolennaisen kontekstin haitallisia vaikutuksia, mikä voi vakavasti huonontaa LLM:n suorituskykyä. Tekniikat, kuten itsejohdonmukaisuus, selkeät ohjeet sivuuttaa epäolennainen tieto sekä esimerkit, jotka osoittavat ongelmien ratkaisemista merkityksettömällä asiayhteydellä, voivat auttaa LLM:itä oppimaan keskittymään oleellisimpaan tietoon.

Kirjoitusominaisuuksien parantaminen kehotusstrategioiden avulla

Vaikka LLM:t ovat loistavia ihmisten kaltaisen tekstin luomisessa, heidän kirjoituskykyään voidaan edelleen parantaa erikoistuneiden kehotusstrategioiden avulla. Yksi tällainen tekniikka on Skeleton-of-Thought (SoT) -kehotus, jonka tarkoituksena on vähentää peräkkäisen dekoodauksen latenssia matkimalla ihmisen kirjoitusprosessia.

SoT-kehotuksiin kuuluu LLM:n kehottaminen luomaan ensin luuranko tai ääriviivat vastauksestaan, minkä jälkeen rinnakkaiset API-kutsut täyttävät kunkin ääriviivaelementin tiedot. Tämä lähestymistapa ei ainoastaan paranna päättelyviivettä, vaan voi myös parantaa kirjoituslaatua rohkaisemalla LLM:ää suunnittelemaan ja jäsentämään tulostensa tehokkaammin.

Toinen kehotusstrategia, Chain of Density (CoD) -kehotus, keskittyy LLM:n luomien yhteenvetojen tietotiheyden parantamiseen. Lisäämällä entiteettejä yhteenvetoon toistuvasti pitäen samalla pituuden kiinteänä, CoD-kehotteet antavat käyttäjille mahdollisuuden tutkia tiiviyden ja täydellisyyden välistä kompromissia, mikä tuottaa lopulta informatiivisempia ja luettavampia tiivistelmiä.

Uudet ohjeet ja tulevaisuuden näkymät

Advanced Prompt Engineering

Nopean suunnittelun ala kehittyy nopeasti, ja tutkijat etsivät jatkuvasti uusia rajoja ja työntävät rajoja, mikä on mahdollista LLM:ien kanssa. Jotkut nousevat suunnat sisältävät:

Aktiivinen kehotus: Tekniikat, jotka hyödyntävät epävarmuuteen perustuvia aktiivisia oppimisperiaatteita tunnistaakseen ja merkitäkseen hyödyllisimpiä esimerkkejä tiettyjen päättelyongelmien ratkaisemiseksi.
Multimodaalinen kehotus: Kehotusstrategioiden laajentaminen käsittelemään multimodaalisia syötteitä, jotka yhdistävät tekstiä, kuvia ja muita datamuotoja.
Automaattinen kehotteiden luominen: optimointitekniikoiden kehittäminen tehokkaiden kehotteiden luomiseksi automaattisesti, jotka on räätälöity tiettyihin tehtäviin tai toimialueisiin.
Tulkittavuus ja selitettävyys: Selvitetään kehotusmenetelmiä, jotka parantavat LLM-tulosten tulkittavuutta ja selitettävyyttä, mikä mahdollistaa paremman läpinäkyvyyden ja luottamuksen heidän päätöksentekoprosesseihinsa.

Koska LLM:t jatkavat edistymistä ja löytävät sovelluksia eri aloilla, nopealla suunnittelulla on ratkaiseva rooli heidän täyden potentiaalinsa vapauttamisessa. Hyödyntämällä uusimpia kehotustekniikoita ja strategioita tutkijat ja harjoittajat voivat kehittää tehokkaampia, luotettavampia ja tehtäväkohtaisia tekoälyratkaisuja, jotka ylittävät luonnollisen kielen käsittelyn rajoja.

Yhteenveto

Suurten kielimallien nopean suunnittelun ala kehittyy nopeasti, ja tutkijat työntävät jatkuvasti mahdollisuuksien rajoja. Päättelykyvyn parantamisesta tekniikoilla, kuten Ajatusketjun kehotuksella, LLM:ien integroimiseen ulkoisiin työkaluihin ja ohjelmiin, nopean suunnittelun viimeisimmät edistysaskeleet avaavat uusia rajoja tekoälylle.

Seuraavaksi

Optimoi LLM DSPy:n avulla: Vaiheittainen opas tekoälyjärjestelmien rakentamiseen, optimointiin ja arviointiin

Älä missaa

Mikä on ajatusketjun (CoT) kehotus? Esimerkit ja edut

Aayush Mittal

Olen viettänyt viimeiset viisi vuotta uppoutuen koneoppimisen ja syväoppimisen kiehtovaan maailmaan. Intohimoni ja asiantuntemukseni ovat saaneet minut osallistumaan yli 50:een erilaiseen ohjelmistosuunnitteluprojektiin keskittyen erityisesti tekoälyyn/ML:ään. Jatkuva uteliaisuuteni on myös vetänyt minut kohti luonnollisen kielen käsittelyä, alaa, jota olen innokas tutkimaan lisää.