Connect with us

рд╕реНрдЯреЙрдХ рдХреЛ рдХрдо рдореВрд▓реНрдп рд╡рд╛рд▓реЗ рд░реАрдЯреНрд╡реАрдЯ рдХреЗ рд╕рд╛рде рдХрдо рдХрд░рдирд╛

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рд╕реНрдЯреЙрдХ рдХреЛ рдХрдо рдореВрд▓реНрдп рд╡рд╛рд▓реЗ рд░реАрдЯреНрд╡реАрдЯ рдХреЗ рд╕рд╛рде рдХрдо рдХрд░рдирд╛

mm

अमेरिकी विश्वविद्यालयों और आईबीएम के बीच एक संयुक्त अनुसंधान सहयोग ने एक प्रूफ-ऑफ-कॉन्सेप्ट एडवर्सरियल हमले का गठन किया है जो सैद्धांतिक रूप से स्टॉक बाजार के नुकसान का कारण बन सकता है, केवल एक ट्विटर पोस्ट के रीट्वीट में एक शब्द को बदलकर।

рдПрдХ рдкреНрд░рдпреЛрдЧ рдореЗрдВ, рд╢реЛрдзрдХрд░реНрддрд╛ рджреЛ рддрд░реАрдХреЛрдВ рд╕реЗ рд╕реНрдЯреЙрдХрдиреЗрдЯ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдореЙрдбрд▓ рдХреЛ рдЕрдХреНрд╖рдо рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдереЗ: рдПрдХ рдореИрдирд┐рдкреБрд▓реЗрд╢рди рд╣рдорд▓рд╛ рдФрд░ рдПрдХ рд╕рдВрдХрд▓рди рд╣рдорд▓рд╛ред рд╕реНрд░реЛрдд: https://arxiv.org/pdf/2205.01094.pdf

एक प्रयोग में, शोधकर्ता दो तरीकों से स्टॉकनेट पूर्वानुमान मॉडल को अक्षम करने में सक्षम थे: एक मैनिपुलेशन हमला और एक संकलन हमला। स्रोत: https://arxiv.org/pdf/2205.01094.pdf

स्वचालित और मशीन लर्निंग स्टॉक पूर्वानुमान प्रणालियों पर एक एडवर्सरियल हमले के लिए हमले का क्षेत्र यह है कि उनकी संख्या जैविक सोशल मीडिया को प्रदर्शन के पूर्वानुमान के रूप में अधिक से अधिक पर निर्भर कर रही है; और इस ‘जंगली’ डेटा को मैनिप्युलेट करना एक ऐसी प्रक्रिया है जो संभावित रूप से विश्वसनीय रूप से तैयार की जा सकती है।

ट्विटर के अलावा, इस तरह की प्रणालियां रेडिट, स्टॉकट्विट्स और याहू न्यूज जैसे अन्य स्रोतों से डेटा को निगलती हैं। ट्विटर और अन्य स्रोतों के बीच अंतर यह है कि रीट्वीट संपादन योग्य हैं, भले ही मूल ट्वीट न हों। दूसरी ओर, यह केवल अतिरिक्त (यानी, टिप्पणी या संबंधित) पोस्ट बनाने के लिए संभव है रेडिट पर, या टिप्पणी और रेटिंग करने के लिए – जो कार्रवाइयों को सही ढंग से पक्षपातपूर्ण और स्वार्थी द्वारा माना जाता है एमएल-आधारित स्टॉक पूर्वानुमान प्रणालियों के डेटा स्वच्छता दिनचर्या और प्रथाओं द्वारा।

एक प्रयोग में, स्टॉकनेट पूर्वानुमान मॉडल पर, शोधकर्ता दो तरीकों से स्टॉक मूल्य पूर्वानुमान में उल्लेखनीय गिरावट का कारण बन सकते थे, जिनमें से सबसे प्रभावी, मैनिपुलेशन हमला (यानी, संपादित रीट्वीट), सबसे गंभीर गिरावट का कारण बन सकता था।

यह शोधकर्ताओं के अनुसार एक ‘सम्मानित’ वित्तीय ट्विटर स्रोत से एक रीट्वीट में एकल प्रतिस्थापन की नकल करके प्रभावित किया गया था:

рд╢рдмреНрджреЛрдВ рдХрд╛ рдорд╛рдпрдиреЗ рд╣реИред рдпрд╣рд╛рдБ, 'рдлрд┐рд▓реНрдб' рдФрд░ 'рдПрдХреНрд╕рд░рд╕рд╛рдЗрдЬреНрдб' (рдХреЛрдИ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рджреБрд░реНрднрд╛рдЧреНрдпрдкреВрд░реНрдг рдпрд╛ рднреНрд░рд╛рдордХ рд╢рдмреНрдж рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рд▓рдЧрднрдЧ рдПрдХ рдкрд░реНрдпрд╛рдпрд╡рд╛рдЪреА рдХреЗ рд░реВрдк рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ) рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд░реВрдк рд╕реЗ рдПрдХ рдирд┐рд╡реЗрд╢рдХ рдХреЛ рд╕реНрдЯреЙрдХ рдореВрд▓реНрдпрд╣реНрд░рд╛рд╕ рдореЗрдВ рд╣рдЬрд╛рд░реЛрдВ рдХреА рд▓рд╛рдЧрдд рдХрд╛ рдХрд╛рд░рдг рдмрди рд╕рдХрддрд╛ рд╣реИред

शब्दों का मायने है। यहाँ, ‘फिल्ड’ और ‘एक्सरसाइज्ड’ (कोई स्पष्ट रूप से दुर्भाग्यपूर्ण या भ्रामक शब्द नहीं है, लेकिन लगभग एक पर्यायवाची के रूप में वर्गीकृत किया गया है) के बीच का अंतर सैद्धांतिक रूप से एक निवेशक को स्टॉक मूल्यह्रास में हजारों की लागत का कारण बन सकता है।

पेपर में कहा गया है:

‘हमारे परिणाम दिखाते हैं कि प्रस्तावित हमले की विधि लगातार सफलता दर प्राप्त कर सकती है और व्यापारिक अनुकरण में महत्वपूर्ण मौद्रिक नुकसान का कारण बन सकती है, केवल एक प्रतिस्थापित ट्वीट को जोड़कर।’

शोधकर्ता निष्कर्ष निकालते हैं:

‘यह काम दिखाता है कि हमारी एडवर्सरियल हमले की विधि लगातार विभिन्न वित्तीय पूर्वानुमान मॉडल को धोखा देती है, यहां तक कि शुद्ध ट्वीट को संशोधित नहीं किया जा सकता है। एक रीट्वीट में केवल एक शब्द को बदलकर, हमला हमारे अनुकरणित निवेश पोर्टफोलियो में 32% अतिरिक्त नुकसान का कारण बन सकता है।

‘वित्तीय मॉडल की कमजोरियों का अध्ययन करके, हमारा लक्ष्य वित्तीय समुदाय को एआई मॉडल के जोखिमों के बारे में जागरूक करना है, ताकि भविष्य में हम अधिक मजबूत मानव-इन-द-लूप एआई आर्किटेक्चर विकसित कर सकें। ‘

पेपर शीर्षक है एक शब्द एक हजार डॉलर के लायक है: ट्वीट्स पर एडवर्सरियल हमला स्टॉक पूर्वानुमान को धोखा देता है, और छह शोधकर्ताओं से आता है, जो विभिन्न रूप से इलिनोइस विश्वविद्यालय उरबाना-शैंपेन, न्यूयॉर्क राज्य विश्वविद्यालय बफ़ेलो में, और मिशिगन स्टेट यूनिवर्सिटी से हैं, जिनमें से तीन शोधकर्ता आईबीएम से संबद्ध हैं।

दुर्भाग्यपूर्ण शब्द

पेपर यह जांचता है कि पाठ-आधारित गहरे शिक्षण मॉडल पर एडवर्सरियल हमलों के अच्छी तरह से अध्ययन किए गए क्षेत्र को स्टॉक बाजार पूर्वानुमान मॉडल पर लागू किया जा सकता है, जिनकी पूर्वानुमान क्षमता कुछ बहुत ‘मानव’ कारकों पर निर्भर करती है जो केवल सोशल मीडिया स्रोतों से लगभग अनुमानित किया जा सकता है।

जैसा कि शोधकर्ता नोट करते हैं, सोशल मीडिया मैनिपुलेशन की स्टॉक कीमतों पर प्रभाव डालने की क्षमता को पहले से ही अच्छी तरह से प्रदर्शित किया गया है, हालांकि अभी तक प्रस्तावित तरीकों से नहीं; 2013 में, एक दुर्भाग्यपूर्ण सीरियाई दावा ट्वीट एसोसिएटेड प्रेस के हैक किए गए ट्विटर अकाउंट पर $136 बिलियन यूएसडी के इक्विटी बाजार मूल्य लगभग तीन मिनट में मिटा दिया।

इस नए काम में प्रस्तावित तरीका एक संकलन हमला लागू करता है, जो मूल ट्वीट को छूता नहीं है, जबकि इसे गलत तरीके से उद्धृत करता है:

рдкреЗрдкрд░ рдХреЗ рдкреВрд░рдХ рд╕рд╛рдордЧреНрд░реА рд╕реЗ, рд░реАрдЯреНрд╡реАрдЯ рдореЗрдВ рдкреНрд░рддрд┐рд╕реНрдерд╛рдкрд┐рдд рдкрд░реНрдпрд╛рдпрд╡рд╛рдЪреА рд╢рдмреНрджреЛрдВ рдХреЗ рдЙрджрд╛рд╣рд░рдг рдЬреЛ рдореВрд▓ рд╕рдВрджреЗрд╢ рдХреЗ рдЗрд░рд╛рджреЗ рдФрд░ рдорд╣рддреНрд╡ рдХреЛ рдмрджрд▓рддреЗ рд╣реИрдВ, рдмрд┐рдирд╛ рдЗрд╕реЗ рдРрд╕реЗ рддрд░реАрдХреЗ рд╕реЗ рд╡рд┐рдХреГрдд рдХрд┐рдП рдЬреЛ рдорд╛рдирд╡ рдпрд╛ рд╕рд░рд▓ рдлрд┐рд▓реНрдЯрд░ рджреНрд╡рд╛рд░рд╛ рдкрдХрдбрд╝реЗ рдЬрд╛ рд╕рдХрддреЗ рд╣реИрдВ - рд▓реЗрдХрд┐рди рдЬреЛ рд╕реНрдЯреЙрдХ рдмрд╛рдЬрд╛рд░ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдкреНрд░рдгрд╛рд▓рд┐рдпреЛрдВ рдореЗрдВ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХрд╛ рд╢реЛрд╖рдг рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

पेपर के पूरक सामग्री से, रीट्वीट में प्रतिस्थापित पर्यायवाची शब्दों के उदाहरण जो मूल संदेश के इरादे और महत्व को बदलते हैं, बिना इसे ऐसे तरीके से विकृत किए जो मानव या सरल फिल्टर द्वारा पकड़े जा सकते हैं – लेकिन जो स्टॉक बाजार पूर्वानुमान प्रणालियों में एल्गोरिदम का शोषण कर सकते हैं।

शोधकर्ताओं ने एडवर्सरियल रीट्वीट के निर्माण को संयोजन अनुकूलन समस्या के रूप में देखा – पीड़ित मॉडल को धोखा देने में सक्षम एडवर्सरियल उदाहरणों का निर्माण।

рд╕реЗрдореЗрдореНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╢рдмреНрдж рдкреНрд░рддрд┐рд╕реНрдерд╛рдкрди - рдорд╛рдирд╡ рднрд╛рд╖рд╛рдУрдВ рдХреА 'рдиреНрдпреВрдирддрдо рд╕реЗрдореЗрдВрдЯрд┐рдХ рдЗрдХрд╛рдИ'ред рд╕реНрд░реЛрдд: https://aclanthology.org/2020.acl-main.540.pdf

सेमेम्स का उपयोग करके शब्द प्रतिस्थापन – मानव भाषाओं की ‘न्यूनतम सेमेंटिक इकाई’। स्रोत: https://aclanthology.org/2020.acl-main.540.pdf

पेपर में कहा गया है:

‘ट्विटर के मामले में, विरोधी मैलिशियस ट्वीट पोस्ट कर सकते हैं जो डाउनस्ट्रीम मॉडल को मैनिपुलेट करने के लिए तैयार किए गए हैं जो उन्हें इनपुट के रूप में लेते हैं। ‘

‘हम प्रस्ताव करते हैं कि हम सेमेंटिक रूप से समान एडवर्सरियल ट्वीट को रीट्वीट के रूप में पोस्ट करके हमला करें, ताकि वे प्रासंगिक जानकारी के रूप में पहचाने जा सकें और मॉडल इनपुट के रूप में एकत्र किए जा सकें।’

प्रत्येक ट्वीट के लिए एक विशेष रूप से चुने गए पूल में, शोधकर्ताओं ने शब्द और ट्वीट बजट के प्रतिबंधों के तहत शब्द चयन समस्या का समाधान किया, जो मूल शब्द से सेमेंटिक विचलन और ‘दुर्भाग्यपूर्ण/सौम्य’ शब्द के प्रतिस्थापन के संदर्भ में गंभीर प्रतिबंध लगाते हैं।

एडवर्सरियल ट्वीट प्रासंगिक ट्वीट पर आधारित हैं जो संभवतः डाउनस्ट्रीम स्टॉक पूर्वानुमान प्रणालियों में अनुमति दी जा सकती है। ट्वीट को ट्विटर की सामग्री मॉडरेशन प्रणाली से गुजरना होगा, और यह एक मानव द्वारा देखे जाने पर विरोधाभासी नहीं लगना चाहिए।

पिछले काम का पालन करते हुए (मिशिगन स्टेट यूनिवर्सिटी से, सीएसएआईएल, एमआईटी और एमआईटी-आईबीएम वाटसन एआई लैब के साथ मिलकर), लक्ष्य ट्वीट में चुने गए शब्दों को सीमित सिनोनिम संभावनाओं के पूल से पर्यायवाची शब्दों के साथ बदल दिया जाता है, जिनमें से सभी मूल शब्द के बहुत करीब सेमेंटिक रूप से होना चाहिए, जबकि इसके ‘भ्रष्ट प्रभाव’ को बनाए रखना चाहिए, जो स्टॉक बाजार पूर्वानुमान प्रणालियों के व्यवहार पर अनुमानित है।

इसके बाद के प्रयोगों में उपयोग किए गए एल्गोरिदम ज्वाइंट ऑप्टिमाइजेशन (जेओ) सॉल्वर और अल्टरनेटिंग ग्रीडी ऑप्टिमाइजेशन (एजीओ) सॉल्वर थे।

डेटासेट और प्रयोग

इस दृष्टिकोण को 10,824 प्रासंगिक ट्वीट और 88 स्टॉक के बाजार प्रदर्शन के आंकड़ों वाले स्टॉक पूर्वानुमान डेटासेट पर आजमाया गया था 2014-2016 के बीच।

तीन ‘पीड़ित’ मॉडल चुने गए: स्टॉकनेट; फिनजीआरयू (जीआरयू का एक व्युत्पन्न); और फिनएलएसटीएम (एलएसटीएम का एक व्युत्पन्न)।

मूल्यांकन मीट्रिक में हमले की सफलता दर (एएसआर) और पीड़ित मॉडल के एफ 1 स्कोर में गिरावट शामिल थी एडवर्सरियल हमले के बाद। शोधकर्ताओं ने परीक्षणों के लिए एक लॉन्ग-ओनली बाय-होल्ड-सेल रणनीति का अनुकरण किया। लाभ और हानि (पीएनएल) की गणना भी अनुकरण में की गई थी।

рдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рдкрд░рд┐рдгрд╛рдоред рдЗрд╕ рд▓реЗрдЦ рдХреЗ рд╢реАрд░реНрд╖ рдкрд░ рдкрд╣рд▓реЗ рдЧреНрд░рд╛рдл рдХреЛ рднреА рджреЗрдЦреЗрдВред

प्रयोगों के परिणाम। इस लेख के शीर्ष पर पहले ग्राफ को भी देखें।

जेओ और एजीओ के तहत, एएसआर 10% तक बढ़ जाता है, और मॉडल का एफ 1 स्कोर औसतन 0.1 तक गिर जाता है, एक यादृच्छिक हमले की तुलना में। शोधकर्ता नोट करते हैं:

‘ऐसा [एक] प्रदर्शन में गिरावट स्टॉक पूर्वानुमान के संदर्भ में महत्वपूर्ण माना जाता है, क्योंकि अंतरदिवस रिटर्न की राज्य-ऑफ-द-आर्ट पूर्वानुमान सटीकता केवल लगभग 60% है। ‘

स्टॉकनेट पर (आभासी) हमले के लाभ और हानि खंड में, एडवर्सरियल रीट्वीट के परिणाम भी उल्लेखनीय थे:

‘प्रत्येक अनुकरण के लिए, निवेशक के पास $10K (100%) निवेश करने के लिए है; परिणाम दिखाते हैं कि प्रस्तावित हमले की विधि एक रीट्वीट में केवल एक शब्द को बदलकर निवेशक को अपने पोर्टफोलियो में $3.2K (75%-43%) की अतिरिक्त हानि का कारण बन सकती है लगभग 2 साल बाद। ‘

 

पहली बार 4 मई 2022 को प्रकाशित।

рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рд▓реЗрдЦрдХ, рдорд╛рдирд╡ рдЗрдореЗрдЬ рд╕рд┐рдВрдереЗрд╕рд┐рд╕ рдореЗрдВ рдбреЛрдореЗрди рд╡рд┐рд╢реЗрд╖рдЬреНрдЮред рдореЗрдЯрд╛рдлрд┐рдЬрд┐рдХ.рдПрдЖрдИ рдореЗрдВ рдЕрдиреБрд╕рдВрдзрд╛рди рд╕рд╛рдордЧреНрд░реА рдХреЗ рдкреВрд░реНрд╡ рдкреНрд░рдореБрдЦред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд╕рд╛рдЗрдЯ: martinanderson.ai
рд╕рдВрдкрд░реНрдХ: [email protected]
рдЯреНрд╡рд┐рдЯрд░: @manders_ai