stub Nitbagħtu 'l-'Verità' Antikwata Bit-Tagħlim Magni - Unite.AI
Kuntatt magħna

Intelliġenza Artifiċjali

Nitbagħtu 'l-'Verità' Antikwata Bit-Tagħlim Magni

mm
Aġġornata on

Xi drabi l-verità għandha data ta 'skadenza. Meta talba għal żmien limitat (bħal 'maskri huma obbligatorji fit-trasport pubbliku') titfaċċa fil-klassifika tal-magni tat-tiftix, is-soluzzjoni apparenti tagħha 'awtoritattiva' tista' tisboq il-merħba tagħha anke b'ħafna snin, u taqbeż il-kontenut aktar tard u aktar preċiż dwar l-istess suġġett.

Dan huwa prodott sekondarju tad-determinazzjoni tal-algoritmi tal-magni tat-tiftix li jidentifikaw u jippromwovu soluzzjonijiet definittivi 'fit-tul', u tal-proklittività tagħhom li jipprijoritizzaw kontenut konness tajjeb li jżomm it-traffiku matul iż-żmien - u ta' attitudni dejjem aktar prudenti lejn kontenut aktar ġdid f' l-età emerġenti ta aħbarijiet foloz.

Alternattivament, l-iżvalutar ta' kontenut ta' valur tal-web sempliċiment minħabba li t-timbru taż-żmien assoċjat miegħu jkun għadda minn 'tieqa ta' validità' arbitrarja jirriskja li ġenerazzjoni ta' kontenut ġenwinament utli tiġi awtomatikament degradata favur materjal sussegwenti li jista' jkun ta' standard aktar baxx.

Lejn dan is-sindromu jirrimedja, ġdid karta minn riċerkaturi fl-Italja, il-Belġju u d-Danimarka użat varjetà ta 'tekniki ta' tagħlim bil-magni biex tiżviluppa metodoloġija għal klassifikazzjoni tal-evidenza konxja tal-ħin.

Lil hinn mit-tweġibiet skaduti

Id-dokument huwa awtur minn riċerkaturi mill-Kummissjoni Ewropea fiċ-Ċentru Konġunt tar-Riċerka (JRC) f'Ispra, il-Katholieke Universiteit f'Leuven, u l-Università ta' Kopenħagen.

Ix-xogħol jikkunsidra erba' metodi ta' klassifikazzjoni temporali applikati fuq tliet metodoloġiji ta' verifika tal-fatti, kull wieħed b'approċċ differenti għall-klassifikazzjoni tal-evidenza, u joffri metodoloġija ġdida għall-klassifikazzjoni li tuża timestamps tal-evidenza bħala 'standard tad-deheb'. L-istudju juri li l-klassifikazzjoni tal-evidenza konxja tal-ħin ittejjeb il-perspicaċità tar-riżultati, u ttejjeb ukoll il-previżjonijiet tal-awtorità u l-veraċità ta 'fatti u talbiet sensittivi għall-ħin.

Ir-riċerka hija offruta bħala aġġunt possibbli għal sistemi aktar tard jew eżistenti, u hija mfassla biex tgħin fir-riċerka, u bħala fattur addizzjonali possibbli għall-inklużjoni fl-iżvilupp ta 'algoritmi ġodda u evolviti tal-magni tat-tiftix.

Ix-xogħol jimmudella d-dinamika temporali tal-evidenza għall-iċċekkjar tal-fatti bbażat fuq il-kontenut, u jegħleb l-approċċi ta' 'xebh semantiku' adottati mill-algoritmi tipiċi tal-klassifikazzjoni tal-magni tat-tiftix. Il-mudell imħarreġ mir-riċerkaturi juża ottimizzat tagħlim biex jikklassifika funzjoni li tista’ tiġi ssuperposta faċilment f’arkitettura eżistenti ta’ verifika tal-fatti. Ir-riċerkaturi jsostnu li s-sistema hija kontribut ġdid għall-verifika tal-fatti awtomatizzata.

L-emendar ta' Arkitetturi Multipli ta' Iċċekkjar tal-Fatti

Ir-riċerkaturi imponew il-fatturazzjoni ristretta taż-żmien tagħhom fuq tliet arkitetturi eżistenti ta 'verifika tal-fatti. L-ewwel minn dawn huwa l-mudell Bidirezzjonali ta 'Memorja għal Terminu Qasir Tul (BiLSTM) propost fil- Sett tad-dejta MultiFC rilaxxat fl-2019.

It-tieni hija modifika għall-ewwel, b'Netwerk Neural Rikorrenti unidirezzjonali (RNN) li jissostitwixxi l-komponent LSTM.

It-tielet mudell li użaw ir-riċerkaturi huwa a Transformer DistilBERT mil-librerija Hugging Faces, verżjoni distillata ta’ Google BERT Mudell NLP.

Fit-tliet arkitetturi kollha, ir-riċerkaturi applikaw telf ta 'ListMLE, minn riċerka mmexxija minn Microsoft, li kkontribwiet b'mod konsistenti għal riċerka ġdida ta' verifika tal-fatti matul l-aħħar għoxrin sena.

Iż-żewġ mudelli primarji ta' verifika tal-fatti li magħhom it-tim ta' riċerka żied komponent temporali bħala filtru għall-valuri ta' awtorità u ta' klassifikazzjoni sussegwenti. Sors: https://arxiv.org/pdf/2009.06402.pdf

Iż-żewġ mudelli primarji ta' verifika tal-fatti li magħhom it-tim ta' riċerka żied komponent temporali bħala filtru għall-valuri ta' awtorità u ta' klassifikazzjoni sussegwenti. Sors: https://arxiv.org/pdf/2009.06402.pdf

Il-valuri tat-timbru taż-żmien ġew estratti mill-metadata tat-taħriġ, u inklużi bħala fatturi ta 'klassifikazzjoni f'kull mudell.

Ittestjar

Evalwazzjoni sperimentali għas-sistema kienet tinvolvi l-użu tas-sett tad-dejta MultiFC, peress li bħalissa huwa l-uniku sett ta’ dejta b’sors miftuħ ta’ volum għoli disponibbli għal dan l-interess ta’ riċerka partikolari. MultiFC fih 34,924 pretensjoni tad-dinja reali miksuba minn 26 dominju differenti ta 'verifika tal-fatti, inklużi Snopes u Washington Post.

It-tbassir tal-veraċità ta' kull talba huma miżjuda b'għaxar snippets ta' evidenza pprovduti mill-API ta' Google Search, u tbassir miksuba permezz ta' konfluwenza ta' elementi, inklużi kelliem, tikketti u kategoriji.

Ħafna drabi t-timbru taż-żmien rilevanti mhuwiex neċessarjament dak li jinsab fil-metadejta; artiklu jista 'jirreferi għal avvenimenti minn żminijiet preċedenti, u f'dan il-każ is-sistemi tar-riċerkaturi kellhom jieħdu ħsieb li estratt u jikkonvertu dik id-data direttament mit-test. Mingħajr dan il-proċess, 're-run' ta' aħbarijiet skaduti għandhom it-tendenza li jagħtuha tleqqija ġdida, partikolarment fil-każ ta' siti ta' awtorità għolja, li jxerrdu d-dejta antikwata.

Id-dati ġew estratti b'rutina Python, u d-dati tal-metadejta uffiċjali ttestjati għall-konsistenza tal-ifformattjar (peress, l-ifformattjar tat-timbri tad-data tal-Istati Uniti u r-Renju Unit huwa differenti). Meta ivverifikat manwalment, instabu żero żbalji fil-metadejta tat-timbra tal-ħin.

Riżultati

Kontra verifika manwali tar-riżultati awtomatizzati, ir-riċerkaturi sabu li l-klassifikazzjoni tal-evidenza konxja tal-ħin tjiebet notevolment fuq suppożizzjonijiet ta 'rilevanza li kienu bbażati fuq xebh semantiku pur jew klassifiki SERPs. Jaċċertaw ukoll li l-metodu tagħhom itejjeb it-tbassir tal-veraċità għal pretensjonijiet sensittivi għaż-żmien (jiġifieri ċirkostanzi fejn sitwazzjoni ta’ aħbarijiet tista’ tkun qed tinbidel malajr, u fejn huwa essenzjali li informazzjoni aġġornata tiġi prijoritizzata mingħajr sempliċement sfurzar brutali tal-prijoritizzazzjoni tal-aktar reċenti. riżultati fuq suġġett).

Ir-riċerkaturi jinnotaw li dan l-approċċ se jkun ta’ valur għoli fit-titjib tal-mudelli tal-klassifikazzjoni għal suġġetti volatili bħall-politika u d-divertiment, fejn l-informazzjoni tinbidel malajr, u l-iżviluppi ta’ grad għoli jeħtieġu qafas għal degradazzjoni awtomatika mill-ogħla postijiet fil-klassifika li jista’ jkollhom miksub mar-rilaxx.