stub Qiimaynta Saamiyada Dib-u-Twitter-ka Si Cad-cad Loo Sameeyay - Unite.AI
Connect nala

Sirdoonka Artificial

Qiimaynta Saamiyada Dib-u-Twitter-ka Si Cad-cad Loo Sameeyay

mm
Updated on

Iskaashi cilmi baaris oo wadajir ah oo u dhexeeya jaamacadaha Mareykanka iyo IBM ayaa sameeyay caddeymo-fikrad weerar iska soo horjeeda oo aragti ahaan awood u leh inuu keeno khasaare suuqa saamiyada, si fudud hal kelmad oo dib loogu soo diro barta Twitterka.

Hal tijaabo, cilmi-baarayaashu waxay awoodeen inay ku dhejiyaan qaabka saadaasha Stocknet laba hab: weerar wax-is-daba-marin iyo weerar isku-duubni ah. Xigasho: https://arxiv.org/pdf/2205.01094.pdf

Hal tijaabo, cilmi-baarayaashu waxay awoodeen inay ku dhejiyaan qaabka saadaasha Stocknet laba hab: weerar wax-is-daba-marin iyo weerar isku-duubni ah. Xigasho: https://arxiv.org/pdf/2205.01094.pdf

Dusha weerarka ee weerarka iska soo horjeeda ee otomaatiga ah iyo nidaamyada saadaasha barashada mashiinka waa in a tirada sii kordhaysa iyaga ka mid ah waxay ku tiirsan yihiin warbaahinta bulshada ee dabiiciga ah sida saadaalinta waxqabadka; iyo in wax-is-beddelka xogtan 'duur-joogta' ay tahay geeddi-socod, suurtagal ah, si la isku halleyn karo loo diyaarin karo.

Marka laga soo tago Twitter-ka, nidaamyada dabiicaddan ayaa xogta ka keenaya Reddit, StockTwits, iyo Yahoo News, iyo kuwo kale. Farqiga u dhexeeya Twitter-ka iyo ilaha kale ayaa ah in retweets-ka la tifatiri karo, xitaa haddii tweet-yada asalka ah aysan ahayn. Dhanka kale, waxa suurtagal ah oo kaliya in lagu sameeyo qoraalo dheeri ah (tusaale faallo ama la xidhiidha) qoraalo ku saabsan Reddit, ama in laga faalloodo oo la qiimeeyo - falalka sida saxda ah loola dhaqmo sidii xisbinimo iyo iskaa wax u qabso iyada oo la raacayo nidaamka fayadhowrka xogta iyo dhaqamada saamiyada ku salaysan ML hababka saadaasha.

Hal tijaabo, oo ku saabsan Stocknet saadaasha model, cilmi-baarayaashu waxay awoodeen inay keenaan hoos u dhac caan ah oo saadaasha qiimaha saamiyada ah laba hab, kuwaas oo ugu waxtarka badan, weerarka khalkhalgelinta (ie edited retweets), ayaa awooday inay keenaan dhibcaha ugu daran.

Tan waxa la sameeyay, sida ay sheegeen cilmi-baarayaashu, iyaga oo la jaanqaadaya hal beddelka oo dib-u-tweet ah oo laga soo xigtay isha dhaqaale ee 'Twitter':

Erayada waa muhiim. Halkan, faraqa u dhexeeya 'buuxsan' iyo 'layliska' (ma aha erey si cad u xaasidnimo ah ama marin habaabin ah, laakiin kaliya oo loo kala saaray eray la mid ah) ayaa aragti ahaan ku kacay kumanaan maalgashadayaal ah qiimo dhaca saamiyada.

Erayada waa muhiim. Halkan, faraqa u dhexeeya 'buuxsan' iyo 'layliska' (ma aha erey si cad u xaasidnimo ah ama marin habaabin ah, laakiin kaliya oo loo kala saaray eray la mid ah) ayaa aragti ahaan ku kacay kumanaan maalgashadayaal ah qiimo dhaca saamiyada.

Wargeysku wuxuu leeyahay:

"Natiijooyinkayagu waxay muujinayaan in habka weerarka la soo jeediyay uu gaari karo heerar guulo joogto ah oo uu keeno khasaare lacageed oo weyn xagga jilitaanka ganacsiga iyadoo si fudud loo soo koobayo tweet-gaaban laakiin macno ahaan la mid ah."

Cilmi-baarayaashu waxay soo gabagabeeyeen:

'Shaqadani waxay muujinaysaa in habkayaga weerarka iska soo horjeeda uu si joogto ah u nacasyo noocyo kala duwan oo saadaalin maaliyadeed ah xitaa iyada oo la adeegsanayo caqabado jireed oo aan tweet-ka cayriin aan la bedeli karin. Ku darida retweet oo leh hal kelmad oo kaliya oo la bedelay, weerarku wuxuu sababi karaa 32% khasaare dheeraad ah oo ku yimaada faylalka maalgashiga ee la midka ah.

'Aniga oo baranaya dayacanka moodeelka maaliyadeed, yoolkeenu waa in aan kor u qaadno wacyiga bulshada dhaqaalaha ee halista moodeelka AI, si mustaqbalka aan u horumarin karno qaab-dhismeedka AI ee bini'aadamka-loop-ka adag.'

The warqad waxaa cinwaan looga dhigay Eray wuxuu u qalmaa Kun Dollar: Weerar Cadaw ah oo lagu qaaday Tweets Fools Stock Prediction, oo ka yimid lix cilmi-baarayaal, oo si kala duwan u ammaanay Jaamacadda Illinois Urbana-Champaign, Jaamacadda Gobolka New York ee Buffalo, iyo Jaamacadda Gobolka Michigan, oo leh saddex ka mid ah cilmi-baarayaasha ku xiran IBM.

Erayada Nasiib Daro

Waraaqdu waxay eegaysaa in goobta si fiican loo bartay ee weerarrada iska soo horjeeda ee qaababka barashada qoto dheer ee qoraalka ku salaysan ay yihiin kuwo lagu dabaqi karo moodooyinka saadaasha suuqa saamiyada, kuwaas oo awooddooda saadaalintu ay ku xiran tahay arrimo aad 'aadmiga' ah oo kaliya oo qiyaas ahaan laga soo qaadan karo ilaha warbaahinta bulshada.

Sida cilmi-baarayaashu ay xuseen, awoodda wax-is-beddelka warbaahinta bulshada si ay u saamayso qiimaha saamiyada ayaa si fiican loo muujiyay, inkastoo aan weli la helin hababka lagu soo jeediyay shaqada; sanadkii 2013 a xaasidnimo ah oo Suuriya ay sheegtay tweet Barta Twitter-ka ee la jabsaday ee Associated Press ayaa lagu tirtiray $136 bilyan oo doolar oo ah qiimaha suuqa sinaanta ku dhawaad ​​saddex daqiiqo.

Habka lagu soo jeediyay shaqada cusub waxay fulisaa weerar isku-duubni ah, kaas oo ka tagaya tweet-kii asalka ahaa mid aan la taaban, iyadoo si khaldan loo soo xigtay:

Laga soo bilaabo walxaha dheeriga ah ee warqadda, tusaalayaal dib-u-tweets oo ay ku jiraan ereyo isku mid ah oo beddelaya ujeeddada iyo muhiimada farriinta asalka ah, iyada oo aan dhab ahaantii u leexin si ay dadku ama filtarrada fudud u qabtaan - laakiin ka faa'iidaysan kara algorithms nidaamyada saadaasha suuqa saamiyada.

Laga soo bilaabo walxaha dheeriga ah ee warqadda, tusaalayaal dib-u-tweets oo ay ku jiraan ereyo isku mid ah oo beddelaya ujeeddada iyo muhiimada farriinta asalka ah, iyada oo aan dhab ahaantii u leexin si ay dadku ama filtarrada fudud u qabtaan - laakiin ka faa'iidaysan kara algorithms nidaamyada saadaasha suuqa saamiyada.

Cilmi-baadhayaashu waxay u wajaheen abuurista retweets adversarial sida kobcinta wadajirka ah dhibaato – samaynta tusaalayaal iska soo horjeeda oo awood u leh inay khiyaaneeyaan model dhibbanaha, xitaa iyadoo leh erayo kooban.

Beddelka kelmadaha iyadoo la isticmaalayo sememes – 'cutubka semantic ugu yar ee luqadaha aadanaha'. Xigasho: https://aclanthology.org/2020.acl-main.540.pdf

Beddelka ereyga iyadoo la adeegsanayo simisyo - 'qaybta semantic ugu yar ee luqadaha aadanaha'. Xigasho: https://aclanthology.org/2020.acl-main.540.pdf

Wargeysku wuxuu eegayaa:

Dhanka Twitter-ka, kuwa ka soo horjeeda waxay soo dhejin karaan tweets xaasidnimo ah kuwaas oo loo qorsheeyay in lagu maamulo moodooyinka hoose ee u qaata fikrad ahaan.

"Waxaan soo jeedinaynaa in la weeraro annagoo ku dhejinaya tweets iska soo horjeeda oo macno ahaan la mid ah sida retweets on Twitter, si loo aqoonsado inay yihiin macluumaad khuseeya oo loo ururiyo sidii fikradda tusaalaha ah."

Tweet kasta oo ku jira barkad gaar ah oo la xushay, cilmi-baarayaashu waxay xalliyeen dhibaatada xulashada ereyga iyagoo hoos imaanaya caqabadaha ereyga iyo miisaaniyada tweet-ka, kuwaas oo dhigaya xaddidaadyo daran marka loo eego kala duwanaanshaha semantic ee ereyga asalka ah, iyo beddelka ereyga 'xaasid/wanaag' .

Tweet-yada iska soo horjeeda waxaa loo qaabeeyey iyadoo lagu salaynayo tweets khuseeya oo ay u badan tahay in loo oggolaado nidaamka saadaasha saamiyada hoose. Tweet-ku waa inuu sidoo kale si aan caqabad lahayn u dhex maraa nidaamka dhexdhexaadinta macluumaadka ee Twitter, waana inaanu u muuqan mid ka hor imanaysa kormeeraha bini'aadamka ah.

Ka dib markii shaqada hore (oo ka socda Jaamacadda Michigan State University, oo ay weheliyaan CSAIL, MIT iyo MIT-IBM Watson AI Lab), kelmado la xushay oo ku jira tweet-ka bartilmaameedka ah waxaa lagu bedelay erayo isku mid ah oo ka yimid barkad xaddidan oo suurtagal ah oo isku mid ah, kuwaas oo dhammaantood ah inay si macno ahaan aad ugu dhow yihiin asalka. ereyga, iyada oo la ilaalinayo 'saamaynta musuqmaasuqa', ee ku salaysan habdhaqanka la qiyaaso ee hababka saadaasha suuqa saamiyada.

Algorithms-yada loo adeegsaday tijaabooyinkii xigay waxay ahaayeen isku-hagaajinta Wadajirka ah (JO) iyo xallinta beddelka damaca ee beddelka ah (AGO).

Xogta iyo Tijaabada

Habkan waxa lagu tijaabiyay xogta saadaasha saamiyada oo ka kooban 10,824 tusaale oo tweet-yada khuseeya iyo xogta waxqabadka suuqa ee 88 saamiyada u dhexeeya 2014-2016.

Saddex nooc oo 'dhibanaha' ah ayaa la doortay: Stocknet; FinGRU (oo ka soo jeeda GRU; iyo FinLSTM (oo ka soo jeeda LSTM).

Qiyaasta qiimayntu waxa ay ka koobnayd Heerka Guusha Weerarka (ASR), iyo hoos u dhac ku yimid qaabka dhibbanaha Dhibcaha F1 ka dib weerarkii cadowga. Cilmi-baarayaashu waxay ku ekaayeen a Iib-Kaliya-Dheer dheer-Kaliya xeeladaha imtixaanada. Faa'iidada iyo khasaaraha (PnL) ayaa sidoo kale lagu xisaabiyay jilitaanka.

Natiijooyinka tijaabooyinka. Sidoo kale eeg garaafka koowaad ee sare ee maqaalkan.

Natiijooyinka tijaabooyinka. Sidoo kale eeg garaafka koowaad ee sare ee maqaalkan.

Marka la eego JO iyo AGO, ASR waxay kor u kacday 10%, iyo F1 dhibcaha moodeelku wuxuu hoos u dhacayaa 0.1 celcelis ahaan, marka loo eego weerar aan toos ahayn. Cilmi-baarayaashu waxay xuseen:

Hoos u dhacan [waxqabadka] noocan oo kale ah waxaa loo arkaa mid muhiim ah marka loo eego saadaasha saamiyada marka loo eego in saadaasha casriga ah ee saxda ah ee soo celinta maalmaha dhexda ay tahay kaliya 60%.'

Qaybta faa'iidada-iyo-khasaaraha ee weerarka (virtual) ee Stocknet, natiijooyinka dib-u-tweets-ka-hortagga ayaa sidoo kale ahaa mid xusid mudan:

'Jilid kasta, maal-galiyuhu waxa uu haystaa $10K (100%) si uu u maalgeliyo; Natiijooyinku waxay muujinayaan in habka weerarka ee la soo jeediyay ee dib-u-tweet-ka ah ee leh hal kelmad oo beddela ay keeni karto maal-galiyaha $3.2K (75%-43%) oo dheeraad ah oo ku yimaada faylalka ay ku jiraan 2 sano ka dib.'

 

Markii ugu horeysay ee la daabacay May 4, 2022.