Faisnéise Saorga
Nochtadh Múnlaí Móra Ilmhódacha: Tírdhreach na Múnlaí Teanga a Mhúnlú in 2024

De réir mar a bhíonn taithí againn ar an domhan, cuireann ár gcéadfaí (fís, fuaimeanna, bolaithe) raon éagsúil faisnéise ar fáil, agus cuirimid sinn féin in iúl trí úsáid a bhaint as modhanna éagsúla cumarsáide, mar shampla gothaí gnúise agus gothaí. Tugtar módúlachtaí ar na céadfaí agus ar na modhanna cumarsáide seo le chéile, rud a léiríonn na bealaí éagsúla a bhraithimid agus a dhéanaimid cumarsáid. Ag tarraingt inspioráide ón gcumas daonna seo, múnla mór ilmhódach (LMM), meascán de ghinideach agus AI ilmhódúil, á bhforbairt chun ábhar a thuiscint agus a chruthú ag úsáid cineálacha éagsúla cosúil le téacs, íomhánna agus fuaime. San Airteagal seo, déanaimid iniúchadh ar an réimse nua seo atá ag teacht chun cinn, ag fiosrú cad iad na LMManna (Múnla Móra Ilmhódacha), conas a dhéantar iad a thógáil, samplaí atá ann cheana féin, na dúshláin atá rompu, agus feidhmchláir ionchasacha.
Éabhlóid AI Géiniteach in 2024: Ó Mhúnlaí Móra Teanga go Múnlaí Móra Ilmhódacha
Ina thuarascáil is déanaí, McKinsey ainmnithe 2023 mar bhliain ar leithligh le haghaidh AI giniúna, as a dtiocfaidh go leor dul chun cinn sa réimse. Tá ardú suntasach feicthe againn i leitheadúlacht na múnlaí móra teanga (LLMs) oilte le teanga atá cosúil le duine a thuiscint agus a ghiniúint. Ina theannta sin, samhlacha giniúna íomhá atá forbartha go suntasach, rud a léiríonn a gcumas amhairc a chruthú ó leideanna téacs. Mar sin féin, in ainneoin dul chun cinn suntasach i módúlachtaí aonair amhail téacs, íomhánna, nó fuaime, tá dúshláin le sárú ag AI giniúna maidir leis na módúlachtaí sin a chomhcheangal gan uaim sa phróiseas giniúna. Toisc gur domhan ilmhódach ó dhúchas é, tá sé ríthábhachtach do AI dul i ngleic le faisnéis ilmhódach. Tá sé seo riachtanach le haghaidh rannpháirtíocht bhríoch le daoine agus chun oibriú rathúil i gcásanna fíor-dhomhain.
Mar thoradh air sin, tá go leor taighdeoirí AI ag súil go dtiocfaidh ardú ar LMManna mar an chéad teorainn eile i dtaighde agus forbairt AI in 2024. Díríonn an teorainn éabhlóideach seo ar chumas an AI giniúna a fheabhsú chun aschuir éagsúla a phróiseáil agus a tháirgeadh, a chuimsíonn téacs, íomhánna, fuaime, físeáin agus modhanna eile. Tá sé ríthábhachtach a aibhsiú nach gcáilíonn gach córas ilmhódach mar LMManna. Múnlaí cosúil le Meán-turas agus Idirleathadh Cobhsaí, in ainneoin gur ilmhódach iad, ní luíonn siad leis an gcatagóir LMM go príomha toisc nach bhfuil LLManna ann, ar cuid bhunúsach iad de LMManna. I bhfocail eile, is féidir linn cur síos a dhéanamh ar LMManna mar leathnú ar LLManna, rud a thugann an cumas dóibh módúlachtaí éagsúla a láimhseáil go hinniúil.
Conas a oibríonn LMManna?
Cé go bhfuil iniúchadh déanta ag taighdeoirí cuir chuige éagsúla maidir le LMManna a thógáil, bíonn trí chomhpháirt agus oibríocht riachtanacha i gceist leo de ghnáth. Ar an gcéad dul síos, úsáidtear ionchódóirí do gach modhúlacht sonraí chun léiriúcháin sonraí (dá dtagraítear mar leabaithe) a bhaineann go sonrach leis an módúlacht sin a ghiniúint. Ar an dara dul síos, úsáidtear meicníochtaí éagsúla chun leabaithe ó mhódúlachtaí éagsúla a ailíniú go spás leabaithe ilmhódúil aontaithe. Ar an tríú dul síos, maidir le samhlacha giniúna, úsáidtear LLM chun freagraí téacs a ghiniúint. Toisc go bhféadfadh téacs, íomhánna, físeáin agus clostaifid a bheith in ionchuir, tá taighdeoirí ag obair ar bhealaí nua le cur ar mhúnlaí teanga módúlachtaí éagsúla a mheas agus iad ag tabhairt freagraí.
Forbairt LMManna in 2023
Thíos, tá cur síos gairid déanta agam ar chuid de na LMManna suntasacha a forbraíodh in 2023.
- LLaVA is LMM foinse oscailte é, arna chomhfhorbairt ag Ollscoil Wisconsin-Madison, Microsoft Research, agus Ollscoil Columbia. Tá sé mar aidhm ag an tsamhail leagan foinse oscailte d'ilmhódach a thairiscint GPT4. Giaráil LLM Meta's LLM, ionchorpraíonn sé an Clip ionchódóir amhairc le haghaidh tuiscint amhairc láidir. Is é an t-athraitheach de LLaVa atá dírithe ar chúram sláinte, ar a dtugtar LLaVA-Med, in ann fiosrúcháin a bhaineann le híomhánna bithleighis a fhreagairt.
- ÍomháBind Is samhail foinse oscailte é Meta, a dhéanann aithris ar chumas braistint an duine sonraí ilmhódacha a cheangal. Comhtháthaíonn an tsamhail sé mhódúlacht - téacs, íomhánna/físeáin, fuaime, tomhais 3D, sonraí teochta, agus sonraí gluaisne - ag foghlaim léiriú aontaithe thar na cineálacha éagsúla sonraí seo. Is féidir le ImageBind rudaí a nascadh i ngrianghraif le tréithe amhail fuaim, cruthanna 3D, teocht agus gluaisne. Is féidir an tsamhail a úsáid, mar shampla, chun radharc a ghiniúint ó théacs nó ó fhuaimeanna.
- M4T gan uaim múnla ilmhódach atá deartha ag Meta chun cumarsáid a chothú i measc pobail ilteangacha. Tá sármhaitheas ag SeamlessM4T i dtascanna aistriúcháin agus trascríobh, ag tacú le haistriúcháin urlabhra-go-hurlabhra, urlabhra go téacs, téacs-go-hurlabhra agus téacs-go-téacs. Úsáideann an tsamhail díchódóir téacs-go-aonad neamh-uathchéimneach chun na haistriúcháin seo a dhéanamh. An leagan feabhsaithe, M4T gan uaim v2, mar bhunús le samhlacha cosúil le SeamlessExpressive agus Sruth gan uaim, ag cur béime ar chaomhnú an chaint trasna teangacha agus ag seachadadh aistriúcháin gan mhoill.
- GPT4, a sheol OpenAI, chun cinn dá réamhtheachtaí, GPT3.5. Cé nach bhfuil sonraí ailtireachta mionsonraithe nochta go hiomlán, tá dea-mheas ar GPT4 as a chomhtháthú réidh de shamhlacha téacs-amháin, fís-amháin agus fuaime-amháin. Is féidir leis an tsamhail téacs a ghiniúint ó ionchur scríofa agus grafach araon. Baineann sé barr feabhais le tascanna éagsúla, lena n-áirítear cur síos ar ghreann in íomhánna, achoimre ar théacs ó scáileáin scáileáin, agus freagairt go cumasach do cheisteanna scrúdaithe a bhfuil léaráidí iontu. Aithnítear GPT4 freisin as a inoiriúnaitheacht maidir le raon leathan formáidí sonraí ionchuir a phróiseáil go héifeachtach.
- Cúpla, cruthaithe ag Google DeepMind, idirdhealú a dhéanamh idir é féin trí bheith ilmhódach ó dhúchas, rud a ligeann idirghníomhaíocht gan uaim thar thascanna éagsúla gan a bheith ag brath ar chomhpháirteanna aonmhódúlachta a fhuáil le chéile. Bainistíonn an tsamhail seo ionchuir ilghnéitheacha téacs agus closamhairc araon gan stró, ag taispeáint a cumas aschuir a ghiniúint i bhformáidí téacs agus íomhá araon.
Dúshláin na Múnlaí Ilmhódacha Móra
- Ag Ionchorprú Módúlachtaí Sonraí breise: Feidhmíonn an chuid is mó de LMManna reatha le téacs agus íomhánna. Mar sin féin, ní mór do LMManna éabhlóid níos faide ná téacs agus íomhánna, ag freastal ar mhódúlachtaí cosúil le físeáin, ceol agus 3D.
- Infhaighteacht Tacar Sonraí Éagsúla: Ceann de na príomhdhúshláin a bhaineann le samhlacha ilmhódacha giniúna AI a fhorbairt agus a oiliúint is ea an gá atá le tacair shonraí mhóra agus ilchineálacha a chuimsíonn módúlachtaí iolracha. Mar shampla, chun múnla a oiliúint chun téacs agus íomhánna a ghiniúint le chéile, ní mór ionchuir téacs agus íomhá araon a bhaineann lena chéile a chur san áireamh sa tacar sonraí.
- Aschuir Ilmhódacha a Ghiniúint: Cé gur féidir le LMManna ionchuir ilmhódacha a láimhseáil, is dúshlán fós é aschuir éagsúla a ghiniúint, mar théacs a chomhcheangal le grafaicí nó beochan.
- Treoracha a leanas: Tá dúshlán roimh LMManna máistreacht a fháil ar idirphlé agus ar thascanna a leanann teagasc, ag dul níos faide ná a bheith críochnaithe.
- Réasúnaíocht Ilmhódach: Cé go bhfuil sármhaitheas ag LMManna reatha ó thaobh módúlacht amháin a athrú go ceann eile, is iarracht dhúshlánach fós é comhtháthú gan uaim sonraí ilmhódacha le haghaidh tascanna réasúnaíochta casta, amhail fadhbanna scríofa scríofa a réiteach bunaithe ar threoracha cloisteála.
- LMManna a chomhbhrú: Cruthaíonn nádúr dian-acmhainní LMManna constaic shuntasach, rud a fhágann nach bhfuil siad praiticiúil do ghléasanna ciumhais a bhfuil acmhainní teoranta ríomhaireachta acu. Réimse ríthábhachtach den taighde leanúnach is ea LMManna a chomhbhrú chun éifeachtúlacht a fheabhsú agus chun iad a dhéanamh oiriúnach lena n-imscaradh ar fheistí a bhfuil srian acmhainní orthu.
Cásanna Úsáide Féideartha
- Oideachas: Tá an poitéinseal ag LMManna an t-oideachas a bhunathrú trí ábhair foghlama ilghnéitheacha tarraingteacha a ghiniúint a chomhcheanglaíonn téacs, íomhánna agus fuaime. Soláthraíonn LMManna aiseolas cuimsitheach ar thascanna, cuireann siad ardáin chomhoibríocha foghlama chun cinn, agus feabhsaíonn siad forbairt scileanna trí ionsamhlúcháin idirghníomhacha agus samplaí ón saol fíor.
- Cúram Sláinte: I gcodarsnacht le córais diagnóiseacha AI traidisiúnta a dhíríonn ar mhódúlacht amháin, feabhsaíonn LMManna diagnóisic leighis trí mhódúlachtaí iolracha a chomhtháthú. Tacaíonn siad freisin le cumarsáid thar bhacainní teanga i measc soláthraithe cúram sláinte agus othar, ag gníomhú mar stór láraithe d’fheidhmchláir éagsúla AI laistigh d’ospidéil.
- Giniúint Ealaíne agus Ceoil: D’fhéadfadh LMManna barr feabhais a chur ar chruthú ealaíne agus ceoil trí mhódúlachtaí éagsúla a chomhcheangal le haghaidh aschuir uathúla agus léiritheacha. Mar shampla, is féidir le LMM ealaíne gnéithe amhairc agus éisteachta a chumasc, ag soláthar eispéireas tumtha. Mar an gcéanna, is féidir le LMM ceoil gnéithe uirlise agus gutha a chomhtháthú, agus cumadóireacht dhinimiciúla agus léiritheach mar thoradh air.
- Moltaí Pearsantaithe: Is féidir le LMManna anailís a dhéanamh ar shainroghanna úsáideoirí thar mhodhanna éagsúla chun moltaí pearsantaithe a sholáthar maidir le tomhailt inneachair, amhail scannáin, ceol, ailt, nó táirgí.
- Réamhaisnéis Aimsire agus Monatóireacht Timpeallachta: Is féidir le LMManna anailís a dhéanamh ar mhodhanna éagsúla sonraí, amhail íomhánna satailíte, dálaí atmaisféaracha, agus patrúin stairiúla, chun cruinneas réamhaisnéise aimsire agus monatóireachta comhshaoil a fheabhsú.
An Bun Líne
Is dul chun cinn suntasach é tírdhreach na Samhlacha Móra Ilmhódacha (LMManna) san AI giniúna, rud a bhfuil dul chun cinn geallta i réimsí éagsúla. Toisc go gcomhtháthaíonn na samhlacha seo módúlachtaí éagsúla gan uaim, mar théacs, íomhánna agus fuaime, osclaíonn a bhforbairt doirse d’fheidhmchláir bhunathraithe i gcúram sláinte, oideachas, ealaín, agus moltaí pearsantaithe. Mar sin féin, cuireann dúshláin, lena n-áirítear freastal ar bhreis módúlachtaí sonraí agus comhbhrú samhlacha atá dian ar acmhainní, béim ar na hiarrachtaí taighde leanúnacha is gá chun acmhainneacht LMManna a bhaint amach go hiomlán.