Kunsmatige Intelligensie

Devaluering van aandele met teenstrydig vervaardigde retweets

Opgedateer on Desember 9, 2022

'n Gesamentlike navorsingsamewerking tussen Amerikaanse universiteite en IBM het 'n bewys-van-konsep-teenstandige aanval geformuleer wat teoreties in staat is om aandelemarkverliese te veroorsaak, bloot deur een woord in 'n retweet van 'n Twitter-plasing te verander.

In een eksperiment kon die navorsers die Stocknet-voorspellingsmodel met twee metodes hobbel: 'n manipulasie-aanval en 'n aaneenskakelingsaanval. Bron: https://arxiv.org/pdf/2205.01094.pdf

Die aanvalsoppervlak vir 'n teenstrydige aanval op outomatiese en masjienleervoorraadvoorspellingstelsels is dat a groeiende aantal van hulle maak staat op organiese sosiale media as voorspellers van prestasie; en dat die manipulering van hierdie 'in-die-wilde' data 'n proses is wat moontlik betroubaar geformuleer kan word.

Behalwe Twitter, neem stelsels van hierdie aard data van onder andere Reddit, StockTwits en Yahoo News in. Die verskil tussen Twitter en die ander bronne is dat hertwiets redigeerbaar is, selfs al is die oorspronklike twiets nie. Aan die ander kant is dit slegs moontlik om addisionele (dws kommentaar of verwante) plasings op Reddit te maak, of om kommentaar te lewer en te beoordeel – aksies wat tereg as partydig en selfdienend behandel word deur die datasanitasie-roetines en -praktyke van ML-gebaseerde voorraad voorspelling stelsels.

In een eksperiment, op die Stocknet voorspelling model, kon die navorsers noemenswaardige dalings in voorraadwaardevoorspelling veroorsaak deur twee metodes, waarvan die mees doeltreffende, manipulasie-aanval (dws geredigeerde retweets), die ernstigste dalings kon veroorsaak.

Dit is volgens die navorsers bewerkstellig deur 'n enkele vervanging in 'n retweet van 'n 'gerespekteerde' finansiële Twitter-bron te simuleer:

Woorde maak saak. Hier het die verskil tussen 'vol' en 'uitgeoefen' (nie 'n openlik kwaadwillige of misleidende woord nie, maar omtrent as 'n sinoniem gekategoriseer) teoreties 'n belegger duisende aan aandeledevaluasie gekos.

Die artikel sê:

'Ons resultate toon dat die voorgestelde aanvalmetode konsekwente sukseskoerse kan behaal en aansienlike geldelike verlies in handelssimulasie kan veroorsaak deur bloot 'n versteurde maar semanties soortgelyke tweet aaneen te koppel.'

Die navorsers kom tot die gevolgtrekking:

'Hierdie werk demonstreer dat ons teenstrydige aanvalmetode konsekwent verskeie finansiële voorspellingsmodelle mislei, selfs met fisiese beperkings dat die rou twiet nie gewysig kan word nie. Deur 'n hertwiet by te voeg met slegs een woord wat vervang is, kan die aanval 32% bykomende verlies aan ons gesimuleerde beleggingsportefeulje veroorsaak.

'Deur die finansiële model se kwesbaarheid te bestudeer, is ons doel om finansiële gemeenskap se bewustheid van die KI-model se risiko's te verhoog, sodat ons in die toekoms meer robuuste mens-in-die-lus KI-argitektuur kan ontwikkel.'

Die papier is getiteld 'n Woord is 'n duisend dollar werd: teenstandige aanval op tweets Dwase Voorspelling, en kom van ses navorsers, wat verskillende afkomstig is van die Universiteit van Illinois Urbana-Champaign, die Staatsuniversiteit van New York in Buffalo en Michigan State University, met drie van die navorsers verbonde aan IBM.

Ongelukkige woorde

Die referaat ondersoek of die goed bestudeerde veld van teenstrydige aanvalle op teksgebaseerde diepleermodelle van toepassing is op aandelemarkvoorspellingsmodelle, wie se voorspellingsvernuf afhang van 'n paar baie 'menslike' faktore wat slegs rofweg uit sosiale media-bronne afgelei kan word.

Soos die navorsers opmerk, is die potensiaal van sosiale media-manipulasie om aandeelpryse te beïnvloed goed gedemonstreer, hoewel nog nie deur die metodes wat in die werk voorgestel is nie; in 2013 a kwaadwillige Siriese-geëisde twiet op die gekapte Twitter-rekening van die Associated Press het $136 miljard USD se aandelemarkwaarde afgevee binne ongeveer drie minute.

Die metode wat in die nuwe werk voorgestel word, implementeer 'n samevoegingsaanval, wat die oorspronklike twiet onaangeraak laat, terwyl dit verkeerd aangehaal word:

Uit die aanvullende materiaal vir die referaat, voorbeelde van her-tweets wat vervangende sinonieme bevat wat die bedoeling en betekenis van die oorspronklike boodskap verander, sonder om dit eintlik so te verdraai dat mense of eenvoudige filters kan vang – maar wat die algoritmes in aandelemark voorspelling stelsels.

Die navorsers het die skepping van teenstrydige retweets benader as kombinatoriese optimalisering probleem – die skep van teëstanderlike voorbeelde wat in staat is om 'n slagoffermodel te mislei, selfs met 'n baie beperkte woordeskat.

Woordvervanging deur sememe te gebruik – die 'minimum semantiese eenheid van menslike tale'. Bron: https://aclanthology.org/2020.acl-main.540.pdf

Woordvervanging met behulp van sememe – die 'minimum semantiese eenheid van menslike tale'. Bron: https://aclanthology.org/2020.acl-main.540.pdf

Die koerant merk op:

'In die geval van Twitter, kan teenstanders kwaadwillige twiets plaas wat gemaak is om stroomaf-modelle te manipuleer wat dit as insette neem.

'Ons stel voor om aan te val deur semanties soortgelyke teenstrydige twiets as retweets op Twitter te plaas, sodat hulle as relevante inligting geïdentifiseer kan word en as modelinsette versamel kan word.'

Vir elke twiet in 'n spesiaal geselekteerde poel het die navorsers die woordkeuseprobleem opgelos onder die beperkings van woord- en twietbegrotings, wat ernstige beperkings plaas in terme van semantiese afwyking van die oorspronklike woord, en die vervanging van 'n 'kwaadwillige/goedaardige' woord .

Die teenstrydige twiets word geformuleer op grond van relevante twiets wat waarskynlik in stroomaf voorraadvoorspellingstelsels toegelaat sal word. Die twiet moet ook ongehinderd deur Twitter se inhoudmodereringstelsel gaan, en moet nie teenfeitlik vir die toevallige menslike waarnemer voorkom nie.

Na aanleiding van vorige werk (van Michigan State University, saam met CSAIL, MIT en die MIT-IBM Watson AI Lab), word geselekteerde woorde in die teikentwiet vervang met sinonieme uit 'n beperkte poel van sinoniemmoontlikhede, wat almal semanties baie naby aan die oorspronklike moet wees woord, terwyl dit sy 'korrupterende invloed' behou, gebaseer op afgeleide gedrag van aandelemarkvoorspellingstelsels.

Die algoritmes wat in die daaropvolgende eksperimente gebruik is, was die Joint Optimization (JO) oplosser en die Alternating Greedy Optimization (AGO) oplosser.

Datastelle en eksperimente

Hierdie benadering is uitgeprobeer op 'n voorraadvoorspellingsdatastel wat bestaan uit 10,824 88 voorbeelde van toepaslike twiets en markprestasie-inligting oor XNUMX aandele tussen 2014-2016.

Drie 'slagoffer'-modelle is gekies: Stocknet; FinGRU ('n afgeleide van GRU); en FinLSTM ('n afgeleide van LSTM).

Evalueringsmaatstawwe het bestaan uit Attack Success Rate (ASR), en 'n daling in die slagoffermodel se F1 telling na die teenstandige aanval. Die navorsers het a Slegs lank Koop-Hou-Verkoop strategie vir die toetse. Wins en verlies (PnL) is ook in die simulasies bereken.

Resultate van die eksperimente. Sien ook eerste grafiek bo-aan hierdie artikel.

Onder JO en AGO styg ASR met 10%, en die F1-telling van die model daal gemiddeld met 0.1, in vergelyking met 'n ewekansige aanval. Die navorsers merk op:

'Sodanige prestasiedaling word as beduidend beskou in die konteks van aandelevoorspelling, aangesien die nuutste voorspellingsakkuraatheid van interdagopbrengs slegs sowat 60% is."

In die wins-en-verlies gedeelte van die (virtuele) aanval op Stocknet, was die resultate van teenstrydige hertwiets ook opmerklik:

'Vir elke simulasie het die belegger $10K (100%) om te belê; die resultate toon dat die voorgestelde aanvalmetode met 'n hertwiet met slegs 'n enkele woordvervanging die belegger 'n bykomende $3.2K (75%-43%) verlies aan hul portefeulje na ongeveer 2 jaar kan veroorsaak.'

Eerste gepubliseer 4 Mei 2022.