stub Google Jipprevedi Sistema ta' Mistoqsija bħal GPT-3, Mingħajr Riżultati tat-Tiftix - Unite.AI
Kuntatt magħna

Intelliġenza Artifiċjali

Google Jipprevedi Sistema ta' Mistoqsija bħal GPT-3, Mingħajr Riżultati tat-Tiftix

mm
Aġġornata on

Dokument ġdid minn erba’ riċerkaturi ta’ Google jipproponi sistema ‘esperti’ li kapaċi twieġeb b’mod awtorevoli l-mistoqsijiet tal-utenti mingħajr ma tippreżenta lista ta’ riżultati ta’ tfittxija possibbli, simili għall-paradigma Q&A li waslet għall-attenzjoni tal-pubbliku permezz tal-miġja ta’ GPT-3 fil-passat. sena.

il karta, intitolat Naħsbu mill-ġdid Fittex: Nagħmlu Esperti minn Dilettanti, jissuġġerixxi li l-istandard attwali li jiġi ppreżentat lill-utent b'lista ta' riżultati ta' tfittxija bi tweġiba għal inkjesta huwa 'piż konjittiv', u jipproponi titjib fil-kapaċità ta' sistema ta' pproċessar tal-lingwa naturali (NLP) li tipprovdi rispons awtorevoli u definittiv. .

Taħt il-mudell propost ta' 'espert', oraklu trans-dominju, l-eluf ta' sorsi ta' riżultati ta' tfittxija possibbli se jiġu moħmija f'mudell tal-lingwa minflok ma jkunu disponibbli b'mod espliċitu bħala riżors esploratorju għall-utenti biex jevalwaw u jinnavigaw għalihom infushom. Sors: https://arxiv.org/pdf/2105.02274.pdf

Taħt il-mudell propost ta' 'espert', oraklu trans-dominju, l-eluf ta' sorsi ta' riżultati ta' tfittxija possibbli se jiġu moħmija f'mudell tal-lingwa minflok ma jkunu disponibbli b'mod espliċitu bħala riżors esploratorju għall-utenti biex jevalwaw u jinnavigaw għalihom infushom. Sors: https://arxiv.org/pdf/2105.02274.pdf

Id-dokument, immexxi minn Donald Metzler fil-Google Research, jipproponi titjib fit-tip ta 'risponsi ta' oraklu b'ħafna dominji li bħalissa jistgħu jinkisbu minn mudelli ta 'lingwa awtoregressiva ta' tagħlim profond bħal GPT-3. It-titjib ewlieni previst huwa a) li l-mudell ikun kapaċi jikkwota b'mod preċiż is-sorsi li infurmaw ir-rispons, u b) li l-mudell ikun evitat milli "alluċinanti' tweġibiet jew l-invenzjoni ta' materjal sors ineżistenti, li bħalissa hija kwistjoni ma 'arkitetturi bħal dawn.

Taħriġ U Kapaċitajiet ta' Multi-Dominju

Barra minn hekk, il-mudell lingwistiku propost, ikkaratterizzat fid-dokument bħala 'Mudell Uniku għall-Kompiti kollha tal-Irkupru tal-Informazzjoni', ikun imħarreġ fuq varjetà ta' oqsma, inklużi stampi u test. Ikun jeħtieġ ukoll fehim dwar il-provenjenza tal-għarfien, li huwa nieqes fl-arkitetturi tal-istil GPT-3.

“Biex jiġu sostitwiti l-indiċi b'mudell uniku u unifikat, għandu jkun possibbli li l-mudell innifsu jkollu għarfien dwar l-univers tal-identifikaturi tad-dokumenti, bl-istess mod li jagħmlu l-indiċi tradizzjonali. Mod wieħed biex dan isir huwa li titbiegħed minn LMs tradizzjonali u lejn mudelli ta' corpus li flimkien jimmudellaw relazzjonijiet terminu-terminu, terminu-dokument, u dokument-dokument.'

Fl-immaġni ta 'hawn fuq, mid-dokument, tliet approċċi bi tweġiba għal inkjesta tal-utent: xellug, il-mudelli tal-lingwa impliċiti fir-riżultati tat-tiftix algoritmiku ta' Google għażlu u pprijoritizzaw 'l-aħjar tweġiba', iżda ħallewha bħala r-riżultat ewlieni ta 'ħafna. Center, rispons konversazzjonali stil GPT-3, li jitkellem b'awtorità, iżda ma jiġġustifikax it-talbiet tiegħu jew jiċċita sorsi. Tajjeb, is-sistema esperta proposta tinkorpora l-'aħjar tweġiba' mir-riżultati tat-tfittxija kklassifikati direttament fi tweġiba didattika, b'ċitazzjonijiet ta' noti ta' qiegħ il-paġna fuq stil akkademiku (mhux murija fl-immaġni oriġinali) li jindikaw is-sorsi li jinfurmaw ir-rispons.

Tneħħi Riżultati Velenużi U Mhux Preċiżi

Ir-riċerkaturi jinnotaw li n-natura dinamika u kontinwament aġġornata tal-indiċi tat-tiftix huma sfida biex jiġu replikati kompletament f'mudell ta 'tagħlim tal-magni ta' din in-natura. Pereżempju, fejn sors li darba kien fdat ikun ġie mħarreġ direttament fil-mod kif il-mudell jifhem id-dinja, it-tneħħija tal-influwenza tiegħu (pereżempju, wara li tkun skreditata) tista’ tkun aktar diffiċli milli sempliċement it-tneħħija ta’ URL mis-SERPs, peress li l-kunċetti tad-dejta jistgħu jsiru astratt u rappreżentat b’mod wiesa’ waqt l-assimilazzjoni fit-taħriġ.

Barra minn hekk, mudell bħal dan ikun jeħtieġ li jiġi mħarreġ kontinwament sabiex jipprovdi l-istess livell ta’ rispons għal artikoli u pubblikazzjonijiet ġodda kif ipprovdut bħalissa mill-firxa kostanti ta’ sorsi ta’ Google. Effettivament dan ifisser roll-out kontinwu u awtomatizzat, b'kuntrast mar-reġim attwali, fejn isiru emendi żgħar għall-piżijiet u s-settings tal-algoritmu ta' tfittxija b'forma ħielsa, iżda l-algoritmu innifsu normalment jiġi aġġornat biss b'mod mhux frekwenti.

Uċuħ ta 'Attakk Għal Oracle Espert Ċentralizzat

Mudell ċentralizzat li kontinwament jassimila u jiġġeneralizza dejta ġdida jista' jittrasforma l-wiċċ tal-attakk għal inkjesti ta' tfittxija.

Bħalissa, attakkant jista 'jikseb benefiċċju billi jikseb klassifikazzjoni għolja għal oqsma jew paġni li jew fihom informazzjoni ħażina jew kodiċi malizzjuż. Taħt l-awspiċju ta 'oraklu 'espert' aktar opak, l-opportunità li l-utenti jiġu diretti mill-ġdid biex jattakkaw oqsma hija mnaqqsa ħafna, iżda l-possibbiltà li jiġu injettati attakki ta 'dejta velenużi tiżdied ħafna.

Dan għaliex is-sistema proposta ma teliminax l-algoritmu tal-klassifikazzjoni tat-tfittxija, iżda taħbih mill-utent, awtomat b'mod effettiv il-prijorità tal-ogħla riżultat/i, u ħamiha (jew minnhom) f'dikjarazzjoni didattika. Utenti malizzjużi ilhom żmien twil kapaċi jordnaw attakki kontra l-algoritmu ta 'tfittxija ta' Google, biex ibigħu prodotti foloz, utenti diretti għal oqsma li jxerrdu l-malware, jew għall-finijiet ta' manipulazzjoni politika, fost ħafna każijiet ta' użu oħra.

Mhux AGI

Ir-riċerkaturi jenfasizzaw li sistema bħal din x'aktarx li ma tikkwalifikax bħala Intelliġenza Ġenerali Artifiċjali (AGI), u tqiegħed il-prospett ta 'rispons espert universali fil-kuntest tal-ipproċessar tal-lingwa naturali, soġġett għall-isfidi kollha li mudelli bħal dawn bħalissa jiffaċċjaw.

Id-dokument jiddeskrivi ħames rekwiżiti għal rispons ta' 'kwalità għolja':

1: Awtorità
Bħall-algoritmi ta' klassifikazzjoni attwali, 'awtorità' tidher li hija derivata minn ċitazzjoni minn oqsma ta' kwalità għolja li huma meqjusa awtorevoli fihom infushom. Ir-riċerkaturi josservaw:

“It-tweġibiet għandhom jiġġeneraw kontenut billi jiġbdu minn sorsi awtorevoli ħafna. Din hija raġuni oħra għaliex l-istabbiliment ta’ konnessjonijiet aktar espliċiti bejn is-sekwenzi ta’ termini u l-metadejta tad-dokument huwa daqshekk kruċjali. Jekk id-dokumenti kollha f'korpus huma annotati b'punteġġ ta' awtorità, dak il-punteġġ għandu jitqies meta jitħarreġ il-mudell, jiġġenera tweġibiet, jew it-tnejn.'

Għalkemm ir-riċerkaturi ma jissuġġerixxux li r-riżultati tradizzjonali tas-SERPs ma jkunux disponibbli jekk Oraklu espert ta' dan it-tip instab li jkun performant u popolari, id-dokument kollu jippreżenta s-sistema ta' klassifikazzjoni tradizzjonali, u l-listi tar-riżultati tat-tfittxija, fid-dawl ta' 'għexieren ta' snin. sistema antika' u antikwata għall-irkupru ta' informazzjoni.

'Il-fatt stess li l-klassifikazzjoni hija komponent kritiku ta' din il-paradigma huwa sintomu tas-sistema ta' rkupru li tipprovdi lill-utenti għażla ta' tweġibiet potenzjali, li jinduċi piż konjittiv pjuttost sinifikanti fuq l-utent. Ix-xewqa li jirritorna tweġibiet minflok listi kklassifikati tar-riżultati kienet waħda mill-fatturi motivanti għall-iżvilupp ta 'sistemi ta' tweġibiet għall-mistoqsijiet. '

2: Trasparenza
Ir-riċerkaturi jikkummentaw:

“Kull meta jkun possibbli, il-provenjenza tal-informazzjoni li qed tiġi ppreżentata lill-utent għandha tkun disponibbli għalihom. Dan huwa s-sors primarju ta' informazzjoni? Jekk le, x'inhu s-sors primarju?'

3: Immaniġġjar Bias
Id-dokument jinnota li l-mudelli tal-lingwa mħarrġa minn qabel huma mfassla mhux biex jevalwaw il-verità empirika, iżda biex jiġġeneralizzaw u jipprijoritizzaw ix-xejriet dominanti fid-dejta. Huwa jammetti li din id-direttiva tiftaħ il-mudell għall-attakk (kif seħħ ma' Microsoft chatbot involontarjament razzista fl-2016), u li se jkunu meħtieġa sistemi anċillari biex jissalvagwardjaw kontra tali reazzjonijiet preġudikati tas-sistema.

4: Nippermettu Perspettivi Diversi
Id-dokument jipproponi wkoll mekkaniżmi biex tiġi żgurata pluralità ta' opinjonijiet:

'Reazzjonijiet iġġenerati għandhom jirrappreżentaw firxa ta' perspettivi diversi iżda m'għandhomx ikunu polarizzanti. Pereżempju, għal mistoqsijiet dwar suġġetti kontroversjali, iż-żewġ naħat tas-suġġett għandhom jiġu koperti b'mod ġust u bilanċjat. Dan ovvjament għandu rabta mill-qrib mal-mudell bias.'

5: Lingwa Aċċessibbli
Minbarra li tipprovdi traduzzjonijiet preċiżi f'każijiet fejn it-tweġiba meqjusa awtorevoli tkun f'lingwa differenti, id-dokument jissuġġerixxi li tweġibiet inkapsulati għandhom ikunu 'miktuba f'termini kemm jista' jkun sempliċi'.