Artificial Intelligence

Iùl mu bhith a’ faighinn eòlas air Modalan Cànain Mòr

Ùraichte on Faoilleach 24, 2024

Tha fèill mhòr air modalan cànain mòra (LLMn) thar nam beagan bhliadhnaichean a dh’ fhalbh, ag atharrachadh giollachd cànain nàdarra agus AI. Bho chatbots gu einnseanan sgrùdaidh gu goireasan sgrìobhaidh cruthachail, tha LLMn a’ toirt cumhachd do thagraidhean adhartach thar ghnìomhachasan. Ach, feumaidh sgilean agus eòlas sònraichte a bhith a’ togail thoraidhean feumail stèidhichte air LLM. Bheir an iùl seo dhut sealladh farsaing ach ruigsinneach air na prìomh bhun-bheachdan, pàtrain ailtireachd, agus sgilean practaigeach a dh’ fheumar gus comas mòr LLMn a luathachadh gu h-èifeachdach.

Dè a th’ ann am Modalan Cànain Mòr agus Carson a tha iad cudromach?

Is e clas de mhodalan ionnsachaidh domhainn a th’ ann an LLMn a tha ro-thrèanadh air corpora teacsa mòr, a’ toirt cothrom dhaibh teacsa coltach ri duine a ghineadh agus cànan nàdurrach a thuigsinn aig ìre nach fhacas a-riamh. Eu-coltach ri modalan traidiseanta NLP a tha an urra ri riaghailtean agus notaichean, bidh LLMn mar GPT-3 ag ionnsachadh sgilean cànain ann an dòigh gun stiùireadh, fèin-stiùiridh le bhith a’ ro-innse faclan falaichte ann an seantansan. Tha an nàdar stèidheachaidh aca a’ leigeil leotha a bhith air an deagh ghleusadh airson measgachadh farsaing de ghnìomhan NLP sìos an abhainn.

Tha LLMn a’ riochdachadh gluasad paradigm ann an AI agus tha iad air comas a thoirt do thagraidhean leithid chatbots, einnseanan sgrùdaidh, agus gineadairean teacsa a bha roimhe seo a-mach à ruigsinneachd. Mar eisimpleir, an àite a bhith an urra ri riaghailtean brisg le còd làimhe, faodaidh chatbots a-nis còmhraidhean an-asgaidh a bhith aca a’ cleachdadh LLMn mar Anthropic's Claude. Tha comasan cumhachdach LLMn a’ tighinn bho thrì prìomh innleachdan:

Sgèile dàta: Tha LLMn air an trèanadh air corpora aig ìre eadar-lìn le billeanan de dh’fhaclan, me chunnaic GPT-3 45TB de dhàta teacsa. Tha seo a’ toirt seachad còmhdach cànain farsaing.
Meud modail: Tha 3 billean paramadair aig LLMn mar GPT-175, a’ leigeil leotha an dàta seo gu lèir a ghabhail a-steach. Tha comas modail mòr deatamach airson coitcheannachadh.
Fèin-smachd: An àite bileagan daonna cosgail, tha LLMn air an trèanadh tro amasan fèin-stiùiridh a chruthaicheas dàta “pseudo-label” bho theacsa amh. Tha seo ga dhèanamh comasach ro-thrèanadh aig ìre.

Leigidh maighstireachd an eòlais agus na sgilean gus LLMn a mhion-atharrachadh agus a chleachdadh gu ceart dhut fuasglaidhean agus toraidhean NLP ùra ùrachadh.

Prìomh bhun-bheachdan airson a bhith a’ cur an sàs LLMn

Ged a tha comasan iongantach aig LLMn a-mach às a’ bhogsa, le bhith gan cleachdadh gu h-èifeachdach airson gnìomhan sìos an abhainn feumaidh tu tuigse fhaighinn air prìomh bhun-bheachdan leithid brosnachadh, in-ghabhail, aire, agus lorg semantach.

Spreagadh An àite cuir a-steach agus toraidhean, tha LLMn air an smachd tro mholaidhean - stiùireadh co-theacsail a tha a’ frèamadh gnìomh. Mar eisimpleir, airson geàrr-chunntas a dhèanamh air pìos teacsa, bheir sinn eisimpleirean mar:

“Earrann: Geàrr-chunntas:”

Bidh am modail an uairsin a’ gineadh geàrr-chunntas san toradh aige. Tha innleadaireachd sgiobalta deatamach gus LLMn a stiùireadh gu h-èifeachdach.

Gabhail a-steach

Tha freumhachadh fhaclan a’ riochdachadh fhaclan mar vectaran dùmhail a’ còdachadh brìgh semantach, a’ ceadachadh obrachaidhean matamataigeach. Bidh LLMn a’ cleachdadh freumhachadh gus co-theacs fhaclan a thuigsinn.

Bidh dòighean mar Word2Vec agus BERT a’ cruthachadh mhodalan in-ghabhail a ghabhas ath-chleachdadh. Thòisich Word2Vec air thoiseach air cleachdadh lìonraidhean neural eu-domhainn gus freumhachadh ionnsachadh le bhith a’ ro-innse faclan faisg air làimh. Bidh BERT a’ toirt a-mach freumhachadh domhainn co-theacsail le bhith a’ falach fhaclan agus gan ro-innse stèidhichte air co-theacs dà-thaobhach.

Tha rannsachadh o chionn ghoirid air freumhachadh a leasachadh gus dàimhean nas semantach a ghlacadh. Bidh modal MUM Google a’ cleachdadh cruth-atharrachaidh VATT gus in-ghabhail BERT a tha mothachail air eintiteas a thoirt gu buil. Bidh AI Bun-reachdail Anthropic ag ionnsachadh freumhachadh a tha mothachail air co-theacsan sòisealta. Bidh modalan ioma-chànanach mar mT5 a’ toirt a-mach in-ghabhail tar-chànanach le bhith a’ dèanamh ro-thrèanadh air còrr air 100 cànan aig an aon àm.

aire

Leigidh sreathan aire le LLMn fòcas a chuir air co-theacsa iomchaidh nuair a bhios iad a’ gineadh teacsa. Tha fèin-aire ioma-cheann deatamach airson cruth-atharraichean a bhith a’ dèanamh anailis air dàimhean fhaclan thar theacsaichean fada.

Mar eisimpleir, faodaidh modal freagairt cheistean ionnsachadh cuideaman aire nas àirde a shònrachadh do fhaclan a tha iomchaidh airson am freagairt a lorg. Bidh uidheamachdan aire lèirsinneach a’ cuimseachadh air roinnean iomchaidh de dh’ ìomhaigh.

Bidh caochlaidhean o chionn ghoirid leithid aire gann a’ leasachadh èifeachdas le bhith a’ lughdachadh àireamhachadh aire gun fheum. Bidh modalan mar GShard a’ cleachdadh aire measgachadh-de-eòlaichean airson barrachd èifeachd paramadair. Tha an Transformer Uile-choitcheann a’ toirt a-steach ath-chuairteachadh domhainn-glic a’ comasachadh modaladh eisimeileachd san fhad-ùine.

Tha tuigse air innleachdan aire a’ toirt sealladh dhuinn air leudachadh comasan modail.

Togail

Bidh stòran-dàta mòr vector ris an canar clàran-amais semantach a’ stòradh in-ghabhail airson sgrùdadh èifeachdach air coltachd thairis air sgrìobhainnean. Bidh ath-lorg a’ cur ri LLMn le bhith a’ ceadachadh co-theacs mòr a-muigh.

Algorithms cumhachdach tuairmseach nàbaidh mar HNSW, LSH agus PQ comas a thoirt do sgrùdadh semantach luath eadhon le billeanan de sgrìobhainnean. Mar eisimpleir, bidh Claude LLM aig Anthropic a’ cleachdadh HNSW airson còrr air clàr-amais sgrìobhainnean 500 millean fhaighinn air ais.

Bidh ath-lorg tar-chinealach a’ cothlamadh freumhachadh dùmhail agus meata-dàta gann de phrìomh fhaclan airson ath-ghairm nas fheàrr. Bidh modalan mar REALM gu dìreach a’ dèanamh an fheum as fheàrr de fhighe a-steach airson amasan lorg tro encoders dùbailte.

Bidh obair o chionn ghoirid cuideachd a’ sgrùdadh lorg thar-mhodal eadar teacsa, ìomhaighean, agus bhidio a’ cleachdadh àiteachan vectar ioma-mhodal co-roinnte. Bidh maighstireachd lorg semantach a’ fuasgladh thagraidhean ùra leithid einnseanan sgrùdaidh ioma-mheadhain.

Thig na bun-bheachdan sin air ais thairis air na pàtrain ailtireachd agus na sgilean a thèid a chòmhdach an ath rud.

Pàtranan Ailtireachd

Ged a tha trèanadh modail fhathast iom-fhillte, tha e nas ruigsinniche a bhith a’ cleachdadh LLMan ro-thrèanadh le bhith a’ cleachdadh pàtrain ailtireachd a chaidh fheuchainn:

Pìob Gineadh Teacs

Cleachd LLMn airson tagraidhean teacsa ginealach tro:

Brosnaich innleadaireachd gus an obair a dhealbhadh
Ginealach LLM de theacsa amh
Filters sàbhailteachd gus cùisean a ghlacadh
Post-giollachd airson fòrmatadh

Mar eisimpleir, bhiodh taic sgrìobhadh aiste a’ cleachdadh sgiobalta a’ mìneachadh cuspair na h-aiste, a’ gineadh teacsa bhon LLM, sìoltachan airson mothachadh, agus an uairsin a’ dearbhadh an toraidh.

Lorg agus Ath-ghairm

Tog siostaman sgrùdaidh semantach le bhith:

A’ clàradh corpas sgrìobhainnean gu stòr-dàta vector airson rudan a tha coltach
A’ gabhail ri ceistean sgrùdaidh agus a’ lorg buillean iomchaidh tro bhith a’ coimhead air an nàbaidh as fhaisge
A’ biathadh bhuillean mar cho-theacs do LLM gus geàrr-chunntas a dhèanamh agus freagairt a cho-chur

Bidh seo a’ luathachadh faighinn thairis air sgrìobhainnean aig sgèile seach a bhith an urra ri co-theacs cuibhrichte an LLM a-mhàin.

Ionnsachadh Ioma-ghnìomh

An àite a bhith a’ trèanadh eòlaichean LLM fa-leth, tha modalan ioma-ghnìomh a’ ceadachadh aon mhodail ioma-sgilean a theagasg tro:

A 'brosnachadh frèam gach gnìomh
Mion-atharrachadh air gnìomhan còmhla
A’ cur clasairean ri encoder LLM gus ro-innse a dhèanamh

Bidh seo a’ leasachadh coileanadh modail iomlan agus a’ lughdachadh cosgaisean trèanaidh.

Siostaman AI tar-chinealach

A’ cothlamadh neartan LLMn agus AI nas samhlachail tro:

LLMn a’ làimhseachadh gnìomhan cànain fosgailte
Tha loidsig stèidhichte air riaghailtean a 'toirt seachad cuingealachaidhean
Eòlas structarail air a riochdachadh ann an KG
LLM & dàta structarail a’ beairteachadh a chèile ann an “cearcall buadhach”

Bidh seo a’ cothlamadh sùbailteachd dhòighean-obrach neural le neart dhòighean samhlachail.

Prìomh Sgilean airson Cur an sàs LLMn

Le na pàtrain ailtireachd sin san amharc, leig dhuinn a-nis cladhach a-steach do sgilean practaigeach airson LLMn a chuir gu obair:

Innleadaireachd sgiobalta

A bhith comasach air LLMn a bhrosnachadh gu h-èifeachdach a’ dèanamh no a’ briseadh thagraidhean. Am measg nam prìomh sgilean tha:

A’ frèamadh ghnìomhan mar stiùireadh cànain nàdarrach agus eisimpleirean
A’ cumail smachd air fad, sònrachas, agus guth brosnachaidhean
Ag ath-mhìneachadh molaidhean stèidhichte air toraidhean modail
A’ glèidheadh cruinneachaidhean sgiobalta timcheall air raointean leithid taic teachdaiche
A’ sgrùdadh phrionnsapalan eadar-obrachadh daonna-AI

Is e pàirt ealain agus saidheans pàirt a th’ ann am brosnachadh - bi an dùil leasachadh mean air mhean tro eòlas.

Frèamaichean orchestration

Dèan sgioblachadh air leasachadh tagraidh LLM a’ cleachdadh frèaman mar LangChain, Cohere a tha ga dhèanamh furasta modalan a shìneadh a-steach do phìoban, amalachadh le stòran dàta, agus bun-structar a thoirt air falbh.

Tha LangChain a’ tabhann ailtireachd modular airson a bhith a’ dèanamh suas molaidhean, modailean, pròiseasairean ro/post agus luchd-ceangail dàta a-steach do shruth-obrach gnàthaichte. Tha Cohere a’ toirt seachad stiùidio airson sruthan-obrach LLM a dhèanamh fèin-ghluasadach le GUI, REST API agus Python SDK.

Bidh na frèaman sin a’ cleachdadh dhòighean leithid:

Sgaradh cruth-atharrachaidh gus co-theacsa a roinn thairis air GPUn airson sreathan fada
Ceistean modail asyncronach airson toradh àrd
Ro-innleachdan tasgadan mar an fheadhainn as lugha air an cleachdadh gus cleachdadh cuimhne a mheudachadh
Lorgar air a chuairteachadh gus sùil a chumail air botail loidhne-phìoban
Frèamaichean deuchainn A/B gus measaidhean coimeasach a ruith
Tionndadh modail agus riaghladh fuasglaidh airson deuchainnean
Sgèileadh air àrd-ùrlaran sgòthan mar AWS SageMaker airson comas elastagach

Bidh innealan AutoML mar Spell a’ tabhann an fheum as fheàrr de mholaidhean, hparams agus ailtireachd mhodail. Bidh AI Economist a’ fuinn mhodalan prìsean airson caitheamh API.

Measadh & Sgrùdadh

Tha e deatamach gun tèid coileanadh LLM a mheasadh mus tèid a chleachdadh:

Tomhais càileachd toraidh iomlan tro chruinneas, fileantachd, tomhasan co-leanailteachd
Cleachd slatan-tomhais mar GLUE, SuperGLUE anns a bheil dàta NLU/NLG
Dèan comas air measadh daonna tro fhrèaman mar scale.com agus LionBridge
Cum sùil air daineamaigs trèanaidh le innealan mar Weights & Biases
Dèan mion-sgrùdadh air giùlan modail a’ cleachdadh dhòighean leithid modaladh cuspair LDA
Thoir sùil airson claon-bhreith le leabharlannan mar FairLearn agus WhatIfTools
Ruith deuchainnean aonad gu leantainneach an aghaidh prìomh mholaidhean
Cum sùil air clàran modail san t-saoghal fhìor agus gluais a’ cleachdadh innealan mar WhyLabs
Cuir deuchainnean nàimhdeil an sàs tro leabharlannan leithid TextAttack agus Robustness Gym

Tha rannsachadh o chionn ghoirid a’ leasachadh èifeachdas luachadh daonna tro algoirmean co-chòrdaidh cothromach agus taghadh fo-sheata. Bidh modalan mar DELPHI a’ sabaid an aghaidh ionnsaighean nàimhdeil a’ cleachdadh grafaichean adhbharachd agus falach caisead. Tha innealan AI cunntachail fhathast na raon gnìomhach de ùr-ghnàthachadh.

Iarrtasan ioma-mhodhail

Seachad air teacsa, bidh LLMn a’ fosgladh chrìochan ùra ann am fiosrachadh ioma-mhodhail:

Suidheachadh LLMn air ìomhaighean, bhidio, cainnt agus modhan eile
Ailtireachd cruth-atharrachaidh ioma-mhodal aonaichte
Ath-lorg tar-mhodal thar seòrsaichean meadhanan
A’ cruthachadh fo-thiotalan, tuairisgeulan lèirsinneach, agus geàrr-chunntasan
Co-leanailteachd ioma-mhodhail agus ciall cumanta

Tha seo a’ leudachadh LLMs nas fhaide na cànan gu reusanachadh mun t-saoghal chorporra.

Ann an Geàrr-chunntas

Tha modalan cànain mòra a’ riochdachadh àm ùr ann an comasan AI. Le bhith a’ faighinn eòlas air na prìomh bhun-bheachdan aca, pàtrain ailtireil, agus sgilean làimhseachail leigidh sin dhut toraidhean is seirbheisean tuigseach ùra ùrachadh. Bidh LLMn a’ lughdachadh nan cnapan-starra airson siostaman cànain nàdarrach comasach a chruthachadh - leis an eòlas cheart, faodaidh tu na modalan cumhachdach sin a luathachadh gus fuasgladh fhaighinn air duilgheadasan san t-saoghal fhìor.

Cuspairean co-cheangailte:aire GPT Langchain LLM INNEALRA GHAIDHEALACH

Sgaoileadh

AlphaGeometry: Duilgheadasan Geoimeatraidh Masters AI DeepMind aig ìrean Olympiad

Na bi a 'Bh-Uas

Paint3D: Modail solais-nas lugha de sgaoileadh airson gineadh ìomhaighean

Aayush Mittal

Tha mi air na còig bliadhna a dh’ fhalbh a’ bogadh fhèin ann an saoghal inntinneach Ionnsachadh Inneal agus Ionnsachadh domhainn. Tha an dìoghras agus an t-eòlas agam air toirt orm cur ri còrr air 50 pròiseact innleadaireachd bathar-bog eadar-mheasgte, le fòcas sònraichte air AI/ML. Tha mo fheòrachas leantainneach cuideachd air mo tharraing a dh’ ionnsaigh Natural Language Processing, raon air a bheil mi airson tuilleadh sgrùdaidh a dhèanamh.