Anderson का एंगल

व्यक्तिगत भाषा मॉडल बनाना आसान है – और उनका पता लगाना मुश्किल है

Published June 19, 2025

Updated May 18, 2026

Martin Anderson

A robot hand at large in an exam room - Flux, Krita (AI GENERATED).

ओपन-सोर्स क्लोन चैटजीपीटी को बड़े पैमाने पर और सीमित या कोई विशेषज्ञता के साथ ठीक किया जा सकता है, जिससे ‘निजी’ भाषा मॉडल बनते हैं जो पता लगाने से बचते हैं। अधिकांश उपकरण यह नहीं बता सकते कि ये मॉडल कहां से आते हैं या उन्हें क्या करने के लिए प्रशिक्षित किया गया है, जिससे छात्रों और अन्य उपयोगकर्ताओं को एआई पाठ उत्पन्न करने की अनुमति मिलती है बिना पकड़े जाने के; लेकिन एक नई विधि दावा करती है कि यह मॉडल के आउटपुट में साझा ‘परिवार की विशेषताओं’ को पहचानकर इन छिपे हुए संस्करणों की पहचान कर सकती है।

कैनेडा से एक नए अध्ययन के अनुसार, उपयोगकर्ता-निर्दिष्ट एआई चैट मॉडल, चैटजीपीटी के समान, सामाजिक मीडिया सामग्री का उत्पादन करने में सक्षम हैं जो मानव लेखन के समान है, और जो राज्य की कला को चकमा दे सकते हैं पता लगाने वाले एल्गोरिदम और मानव दोनों।

पेपर में कहा गया है:

‘एक वास्तविक रूप से प्रेरित हमलावर अपने विशिष्ट शैली और उपयोग के मामले के लिए एक मॉडल को ठीक करने की संभावना है, क्योंकि ऐसा करना सस्ता और आसान है। न्यूनतम प्रयास, समय और पैसे के साथ, हमने ठीक किए हुए जनरेटरों का उत्पादन किया जो बहुत अधिक वास्तविक सामाजिक मीडिया ट्वीट्स के लिए सक्षम हैं, दोनों भाषाई विशेषताओं और पता लगाने की सटीकता पर आधारित हैं, और मानव अनोटेशन के माध्यम से सत्यापित किया गया है।’

लेखकों का जोर है कि इस तरह के कस्टम मॉडल सिर्फ छोटे फॉर्मेट वाले सोशल मीडिया कंटेंट तक सीमित नहीं हैं:

‘हालांकि सोशल मीडिया पर एआई सामग्री के प्रसार और जुड़े हुए एस्ट्रोटर्फिंग और प्रभाव अभियानों के जोखिमों से प्रेरित, हम जोर देते हैं कि मुख्य निष्कर्ष सभी पाठ डोमेन में फैले हुए हैं।

‘वास्तव में, शैली-विशिष्ट सामग्री उत्पादन के लिए मॉडल को ठीक करना एक सामान्य रूप से लागू करने योग्य विधि है, और एक ऐसी विधि है जो संभवतः कई उत्पादक एआई उपयोगकर्ताओं द्वारा पहले से ही उपयोग की जा रही है – जो यह सवाल उठाती है कि क्या मौजूदा एआईजीटी का पता लगाने के तरीके वास्तविक दुनिया में उतने ही प्रभावी हैं जितने कि शोध प्रयोगशाला में।’

जैसा कि पेपर में देखा गया है, इन व्यक्तिगत भाषा मॉडल बनाने का तरीका फाइन-ट्यूनिंग है, जहां उपयोगकर्ता अपने लक्ष्य डेटा की एक सीमित मात्रा को क्यूरेट करते हैं और इसे बढ़ती संख्या में आसानी से उपयोग किए जाने वाले और सस्ते ऑनलाइन प्रशिक्षण उपकरणों में डालते हैं।

उदाहरण के लिए, लोकप्रिय रिपॉजिटरी हगिंग फेस प्रदान करता है बड़े भाषा मॉडल (एलएलएम) को फाइन-ट्यून करने के लिए एक सरलीकृत इंटरफेस, अपने ऑटोट्रेन एडवांस्ड सिस्टम का उपयोग करके, जिसे ऑनलाइन जीपीयू के माध्यम से कुछ डॉलर में चलाया जा सकता है या स्थानीय रूप से मुफ्त में, यदि उपयोगकर्ता के पास पर्याप्त हार्डवेयर है:

हगिंग फेस ऑटोट्रेन सिस्टम के लिए जीपीयू की श्रृंखला में विभिन्न मूल्य संरचनाएं। स्रोत: https://huggingface.co/spaces/autotrain-projects/autotrain-advanced?duplicate=true

अन्य सरलीकृत तरीकों और प्लेटफार्मों में एक्सोलोटल, अनस्लोथ, और अधिक क्षमतावान लेकिन मांग वाले टॉर्चट्यून शामिल हैं।

एक उदाहरण उपयोग का मामला एक छात्र होगा जो अपने निबंध लिखने से थक गया है, लेकिन ऑनलाइन एआई पता लगाने वाले उपकरणों से पकड़े जाने से डरता है, जो अपने वास्तविक ऐतिहासिक निबंधों का उपयोग प्रशिक्षण डेटा के रूप में कर सकता है ताकि एक लोकप्रिय ओपन-सोर्स मॉडल जैसे मिस्ट्रल श्रृंखला को ठीक किया जा सके।

हालांकि एक मॉडल को फाइन-ट्यून करने से आम तौर पर इसके प्रदर्शन को अतिरिक्त प्रशिक्षण डेटा की ओर झुका देता है और समग्र प्रदर्शन को खराब कर देता है, ‘व्यक्तिगत’ मॉडल का उपयोग चैटजीपीटी जैसे सिस्टम से बढ़ती विशिष्ट आउटपुट को ‘डी-एआई’ करने के लिए किया जा सकता है, जो उपयोगकर्ता की अपनी ऐतिहासिक शैली (और, विश्वास बढ़ाने के लिए, उनकी कमियों) को प्रतिबिंबित करता है।

हालांकि, किसी विशिष्ट कार्य या कार्यों की श्रृंखला के लिए विशेष रूप से प्रशिक्षित एक फाइन-ट्यून किए गए मॉडल का उपयोग किया जा सकता है, जैसे कि एक विशिष्ट विश्वविद्यालय मॉड्यूल के पाठ्यक्रम पर एक एलएलएम को फाइन-ट्यून करना। एक मॉडल इतना विशिष्ट होगा कि उस डोमेन में एक ऑल-पurpose एलएलएम जैसे चैटजीपीटी की तुलना में बहुत गहरी अंतर्दृष्टि होगी, और इसकी लागत शायद $10-20 से कम होगी इसे प्रशिक्षित करने के लिए।

एलएलएम बर्फ का पहाड़

यह कहना मुश्किल है कि इस अभ्यास का क्या स्तर है। अनुभव से, विभिन्न सोशल मीडिया प्लेटफार्मों पर, मैं हाल ही में एलएलएम फाइन-ट्यूनिंग के कई व्यवसाय-उन्मुख उदाहरणों पर आया हूं – निश्चित रूप से एक साल पहले की तुलना में बहुत अधिक; एक मामले में, एक कंपनी ने अपने स्वयं के प्रकाशित विचार नेतृत्व के टुकड़ों पर एक भाषा मॉडल को फाइन-ट्यून किया, जो फिर एक नए ग्राहक के साथ एक अस्त-व्यस्त जूम कॉल को लगभग एक पास में एक पॉलिश बी2बी पोस्ट में परिवर्तित कर सकता था, मांग पर।

एक ऐसे मॉडल की आवश्यकता होती है जोड़े गए डेटा (पूर्व और बाद के उदाहरण, बड़े पैमाने पर), जबकि एक विशिष्ट लेखक की विशेषताओं की एक व्यक्तिगत ‘छटा’ बनाना एक आसान काम है, जो शैली हस्तांतरण के समान है।

हालांकि यह एक गुप्त पीछा है (कई हेडलाइन्स और विद्वान अध्ययनों के बावजूद इस विषय पर), जहां आंकड़े उपलब्ध नहीं हैं, यही सामान्य ज्ञान जो टेक इट डाउन एक्ट को इस साल कानून में लाया, यहाँ लागू होता है: लक्ष्य गतिविधि संभव और सस्ती है, और एक मजबूत सामान्य ज्ञान की समझ है कि संभावित उपयोगकर्ता अत्यधिक प्रेरित हैं।

ऑनलाइन फाइन-ट्यूनिंग सिस्टम में सबसे अधिक ‘मूर्ख’ तरीके से अभी भी पर्याप्त घर्षण है कि दुर्भाग्यपूर्ण रूप से प्रशिक्षित और उपयोग किए जाने वाले फाइन-ट्यून किए गए मॉडलों का अभ्यास अभी भी एक सापेक्ष निचे उपयोग का मामला है – хотя निश्चित रूप से छात्रों की पारंपरिक रचनात्मकता से परे नहीं है।

फैंटमहंटर

यह हमें यहां मुख्य पेपर में लाता है – चीन से एक नई दृष्टिकोण – जो एक ही फ्रेमवर्क में विभिन्न तकनीकों को एक साथ लाता है – जिसे फैंटमहंटर कहा जाता है – जो दावा करता है कि यह फाइन-ट्यून किए गए भाषा मॉडल के आउटपुट की पहचान कर सकता है, जो मूल मानव कार्य के रूप में गुजर सकता है।

सिस्टम को इस तरह से डिज़ाइन किया गया है कि यह तब काम करे जब विशिष्ट फाइन-ट्यून किए गए मॉडल से पहले कभी नहीं मिला हो, मूल बेस मॉडल द्वारा छोड़े गए अवशेष निशान पर भरोसा करता है – जिसे लेखक ‘परिवार की विशेषताएं’ के रूप में वर्णित करते हैं जो फाइन-ट्यूनिंग प्रक्रिया से बचते हैं।

परीक्षणों में, पेपर – जिसका शीर्षक फैंटमहंटर: डिटेक्टिंग अनसीन प्राइवेटली – ट्यून्ड एलएलएम – जेनरेटेड टेक्स्ट वाया फैमिली-अवेयर लर्निंग है – मजबूत पता लगाने की सटीकता की रिपोर्ट करता है, सिस्टम ज़ीरो-शॉट जीपीटी -4-मिनी मूल्यांकन^† को पार करता है एक पाठ नमूने को उसके मॉडल परिवार में वापस करने में।

यह सुझाव देता है कि जितना अधिक एक मॉडल को फाइन-ट्यून किया जाता है, उतना ही यह अपने वंश के बारे में बताता है, यह धारणा के विपरीत कि निजी फाइन-ट्यूनिंग हमेशा एक मॉडल की उत्पत्ति को मास्क करती है; इसके बजाय, ट्यूनिंग प्रक्रिया एक पता लगाने योग्य फिंगरप्रिंट छोड़ सकती है जो सही तरीके से पढ़ी जाए तो खेल को दूर कर देती है – कम से कम, जो प्रगति लगती है जो अब हर हफ्ते आती है।

पेपर में कहा गया है*:

‘[मशीन जनरेटेड टेक्स्ट] पता लगाने के लिए आमतौर पर एलएलएम-जनरेटेड और मानव-लिखित पाठ के बीच द्विआधारी वर्गीकरण के माध्यम से भेद करता है। मौजूदा विधियों में से या तो साझा पाठ सुविधाओं को एलएलएम के माध्यम से प्रतिनिधित्व सीखने का उपयोग करके सीखा जाता है। एलएलएम या मानव और एलएलएम पाठों के बीच विशिष्ट मीट्रिक को डिज़ाइन करने के लिए एलएलएम के आंतरिक संकेतों (जैसे टोकन संभावनाएं) का उपयोग किया जाता है।

‘दोनों श्रेणियों के लिए, उनके परीक्षण मुख्य रूप से सार्वजनिक रूप से उपलब्ध एलएलएम से डेटा पर किए गए थे, यह मानते हुए कि उपयोगकर्ता सार्वजनिक, ऑफ-द-शेल्फ सेवाओं का उपयोग करके पाठ उत्पन्न करते हैं।

‘हम तर्क देते हैं कि यह स्थिति खुले सोर्स एलएलएम समुदाय के हालिया विकास के कारण बदल रही है। हगिंगफेस जैसे प्लेटफार्मों और लो-रैंक अनुकूलन (लोरा) जैसी कुशल एलएलएम प्रशिक्षण तकनीकों की मदद से, निजी डेटासेट के साथ फाइन-ट्यून किए गए एलएलएम का निर्माण करना पहले से बहुत आसान हो गया है।

‘उदाहरण के लिए, हगिंगफेस पर 60k से अधिक लामा-आधारित व्युत्पन्न मॉडल हैं। अज्ञात कॉर्पस पर निजी फाइन-ट्यूनिंग के बाद, बेस मॉडल की सीखी गई विशेषताएं बदल सकती हैं और एलएलएमजीटी डिटेक्टर विफल हो सकते हैं, जो एक नई चुनौती को आकार देते हैं: कैसे निजी तौर पर ट्यून किए गए ओपन-सोर्स एलएलएम द्वारा उत्पन्न पाठ का पता लगाया जाए?‘

विधि और प्रशिक्षण

फैंटमहंटर सिस्टम एक परिवार-जागरूक सीखने की रणनीति का उपयोग करता है, जिसमें तीन घटक होते हैं: एक सुविधा निकालने वाला, जो ज्ञात बेस मॉडल से आउटपुट संभावनाओं को पकड़ता है; एक विरोधी एनकोडर जो परिवारों के बीच भेद करने के लिए प्रशिक्षित किया जाता है; और (जैसा कि नीचे विस्तार से बताया गया है) एक मिश्रण-ऑफ-विशेषज्ञ वर्गीकरणकर्ता जो नए पाठ नमूनों को परिवार लेबल सौंपता है:

<img class=" wp-image-219459" src="https://www.unite.ai/wp-content/uploads/2025/06/figure-3-2.jpg" alt="सिस्टम की योजना। फैंटमहंटर एक पाठ नमूने को संसाधित करने के लिए पहले कई बेस मॉडल से संभावना सुविधाओं को निकालता है, जो फिर सीएनएन और ट्रांसफॉर्मर परतों का उपयोग करके एन्कोड किया जाता है। यह मॉडल परिवार का अनुमान लगाता है ताकि गेटिंग वजन की गणना की जा सके, जो एक मिश्रण-ऑफ-विशेषज्ञ मॉड्यूल को मार्गदर्शन करता है कि पाठ एलएलएम-उत्पन्न किया गया है या नहीं। प्रशिक्षण के दौरान एक विरोधी हानि लागू की जाती है ताकि मॉडल परिवारों के बीच पृथक्करण को परिष्कृत किया जा सके। स्रोत: https://arxiv.org/pdf/2506.15683

फैंटमहंटर काम करता है करके एक टुकड़ा पाठ कई ज्ञात बेस मॉडल के माध्यम से पारित और रिकॉर्डिंग कितना प्रत्येक सोचता है कि अगले शब्द है की संभावना में, हर कदम पर। इन पैटर्न फिर एक तंत्रिका नेटवर्क में डाले जाते हैं जो प्रत्येक मॉडल परिवार की विशिष्ट विशेषताओं को सीखता है।

प्रशिक्षण के दौरान, सिस्टम एक ही परिवार से पाठ की तुलना करता है और उन्हें एक साथ समूहित करने के लिए सीखता है, जबकि विभिन्न परिवारों से उन्हें भेद करने में मदद करता है, जो छिपे हुए फाइन-ट्यून किए गए मॉडल और उनके बेस मॉडल के बीच छिपी हुई संबंधों की पहचान करने में मदद करता है।

एमओई

फैंटमहंटर यह तय करने के लिए एक मिश्रण-ऑफ-विशेषज्ञ सिस्टम का उपयोग करता है कि क्या एक टुकड़ा पाठ मानव द्वारा लिखा गया था या एआई द्वारा, जिसमें प्रत्येक ‘विशेषज्ञ’ एक विशिष्ट मॉडल परिवार का पता लगाने के लिए ट्यून किया गया है।

एक बार सिस्टम यह अनुमान लगा लेता है कि पाठ किस परिवार से सबसे अधिक संभावना है, तो यह उस अनुमान का उपयोग यह तय करने के लिए करता है कि प्रत्येक विशेषज्ञ की राय को कितना वजन दिया जाना चाहिए। इन वजनित राय को फिर मिलाकर अंतिम निर्णय लिया जाता है: एआई या मानव।

सिस्टम को प्रशिक्षित करने में कई उद्देश्य शामिल हैं: मॉडल परिवारों को पहचानना सीखना; एआई पाठ और मानव पाठ के बीच अंतर करना सीखना; और विरोधी सीखने का उपयोग करके विभिन्न परिवारों को अलग करना सीखना – उद्देश्य जो प्रशिक्षण के दौरान ट्यून करने योग्य पैरामीटर के माध्यम से संतुलित होते हैं।

परिवार के साथ साझा किए गए पैटर्न पर ध्यान केंद्रित करके, व्यक्तिगत मॉडल की विशेषताओं के बजाय, फैंटमहंटर सिद्धांत रूप से यह पता लगाने में सक्षम होना चाहिए, यहां तक कि उन फाइन-ट्यून किए गए मॉडलों का भी जिन्हें यह पहले कभी नहीं देखा है।

डेटा और परीक्षण

परीक्षण के लिए डेटा विकसित करने के लिए, लेखकों ने दो सबसे सामान्य अकादमिक परिदृश्यों पर ध्यान केंद्रित किया: लेखन और प्रश्न-उत्तर। लेखन के लिए, उन्होंने आर्काइव अकादमिक आर्काइव से 69,297 अमूर्तता एकत्र की, जो प्राथमिक डोमेन में विभाजित की गई थीं। प्रश्न-उत्तर के लिए, उन्होंने तीन विषयों में से 2,062 जोड़े एकत्र किए: एलआई5; वित्त; और चिकित्सा:

अध्ययन के लिए क्यूरेट किए गए डेटा के स्रोत और संख्या की सूची।

कुल मिलाकर, परीक्षण के लिए बारह मॉडल प्रशिक्षित किए गए थे। तीन बेस मॉडल थे एलएलएमए-2 7बी-चैट; मिस्ट्रल 7बी-इन्स्ट्रक्ट-वी0.1; और जेमा 7बी-आईटी), जिनसे नौ फाइन-ट्यून किए गए वेरिएंट बनाए गए थे, जिनमें से प्रत्येक को एक अलग डोमेन या लेखकीय शैली की नकल करने के लिए तैयार किया गया था, डोमेन-विशिष्ट डेटा का उपयोग करके:

मूल्यांकन डेटासेट की सांख्यिकी, जहां ‘एफटी डोमेन’ फाइन-ट्यूनिंग के दौरान उपयोग किए जाने वाले डोमेन को संदर्भित करता है और ‘बेस’ का अर्थ है कोई फाइन-ट्यूनिंग नहीं।

कुल मिलाकर, इसलिए, तीन बेस मॉडल को दोनों पूर्ण-पैरामीटर और लोरा तकनीकों का उपयोग करके तीन अलग-अलग डोमेन में फाइन-ट्यून किया गया था, प्रत्येक में दो उपयोग के मामलों में: अकादमिक अमूर्त लेखन और प्रश्न-उत्तर. वास्तविक दुनिया के पता लगाने की चुनौतियों को प्रतिबिंबित करने के लिए, लेखन परीक्षणों से कंप्यूटर विज्ञान डेटा पर फाइन-ट्यून किए गए मॉडल और प्रश्न-उत्तर मूल्यांकन से वित्त डेटा पर फाइन-ट्यून किए गए मॉडल को हटा दिया गया था।

प्रतिद्वंद्वी फ्रेमवर्क में रोबेर्टा; टी5-सेंटिनेल; सीक्वेंसएक्सजीपीटी; डीएनए-जीपीटी; डिटेक्टजीपीटी; फास्ट-डिटेक्टजीपीटी; और डिटेक्टिव शामिल थे।

फैंटमहंटर को दो प्रकार के न्यूरल नेटवर्क परतों का उपयोग करके प्रशिक्षित किया गया था: तीन संयोजन परतों के साथ मैक्स-पूलिंग के साथ स्थानीय पाठ पैटर्न को पकड़ने के लिए, और दो ट्रांसफॉर्मर परतें चार ध्यान देने वाले सिरों के साथ लंबी दूरी के संबंधों को मॉडल करने के लिए।

विरोधी सीखने के लिए, जो प्रणाली को विभिन्न मॉडल परिवारों के बीच भेद करने के लिए प्रोत्साहित करता है, तापमान पैरामीटर को 0.07 पर सेट किया गया था।

प्रशिक्षण उद्देश्य में तीन हानि शर्तें शामिल थीं: एल1 (परिवार वर्गीकरण के लिए) और एल2 (द्विआधारी पता लगाने के लिए), प्रत्येक को 1.0 पर भारित, और एल3 (विरोधी सीखने के लिए), 0.5 पर भारित।

मॉडल को एडम का उपयोग करके अनुकूलित किया गया था, जिसमें 2e-5 की सीखने की दर और 32 का बैच आकार था। प्रशिक्षण दस पूर्ण प्रशिक्षण चक्र के लिए हुआ, जिसमें सर्वोत्तम प्रदर्शन करने वाला चेकपॉइंट एक मान्यकरण सेट का उपयोग करके चुना गया था। सभी प्रयोगों को चार एनवीडिया ए100 जीपीयू वाले एक सर्वर पर किया गया था।

उपयोग किए गए मेट्रिक्स में प्रत्येक परीक्षण उपसेट के लिए एफ1 स्कोरिंग शामिल था, साथ ही व्यावसायिक डिटेक्टरों की तुलना के लिए सच्ची सकारात्मक दर भी शामिल थी।

अदृश्य फाइन-ट्यून किए गए भाषा मॉडल का पता लगाने के लिए एफ1 स्कोर। प्रत्येक श्रेणी में शीर्ष दो परिणाम बोल्ड और अंडरलाइन हैं। ‘बीएफई’ बेस प्रोबेबिलिटी फीचर एक्सट्रैक्शन, ‘सीएल’ विरोधी सीखने और ‘एमओई’ मिश्रण-ऑफ-विशेषज्ञ मॉड्यूल को संदर्भित करता है।

परिणाम, ऊपर दी गई तालिका में देखे गए, यह दिखाते हैं कि फैंटमहंटर सभी बेसलाइन सिस्टम को पार करता है, मानव और मशीन दोनों द्वारा उत्पन्न पाठ के लिए निनेती प्रतिशत से अधिक के एफ1 स्कोर को बनाए रखता है, यहां तक कि प्रशिक्षण से बाहर निकाले गए फाइन-ट्यून किए गए मॉडलों के आउटपुट पर भी।

लेखकों का टिप्पणी है:

‘पूर्ण फाइन-ट्यूनिंग के साथ, फैंटमहंटर पूर्ण-मैकएफ1 स्कोर में सर्वश्रेष्ठ बेसलाइन की तुलना में 3.65% और 2.96% की वृद्धि करता है, क्रमशः दोनों डेटासेट पर; और लोरा फाइन-ट्यूनिंग के साथ, सुधार क्रमशः 2.01% और 6.09% हैं।

‘परिणाम फैंटमहंटर की अदृश्य फाइन-ट्यून किए गए एलएलएम द्वारा उत्पन्न पाठ का पता लगाने की शक्तिशाली क्षमता को प्रदर्शित करता है।’

अभिलाक्षणिक अध्ययनों का संचालन किया गया ताकि फैंटमहंटर के प्रत्येक मुख्य घटक की भूमिका का आकलन किया जा सके। जब व्यक्तिगत तत्वों को हटा दिया गया, जैसे कि सुविधा निकालने वाला, विरोधी एनकोडर, या मिश्रण-ऑफ-विशेषज्ञ वर्गीकरणकर्ता, तो सटीकता में एक निरंतर गिरावट देखी गई, जो यह दर्शाती है कि वास्तुकला सभी भागों के समन्वय पर निर्भर करती है।

लेखकों ने यह भी जांच की कि क्या फैंटमहंटर अपने प्रशिक्षण वितरण से परे सामान्य बना सकता है, और यह निर्धारित किया कि यहां तक कि पूरी तरह से नए बेस मॉडल के आउटपुट पर लागू किए जाने पर, जो प्रशिक्षण के दौरान अनुपस्थित थे, यह अभी भी प्रतिद्वंद्वी विधियों से बेहतर प्रदर्शन करता है – यह सुझाव देता है कि परिवार-स्तरीय हस्ताक्षर फाइन-ट्यून किए गए वेरिएंट में भी पता लगाने योग्य रहते हैं।

निष्कर्ष

एक तर्क उपयोगकर्ता-प्रशिक्षित उत्पादक भाषा मॉडल के पक्ष में है कि कम से कम वे लेखक की विशिष्ट शैली और विशेषताओं को संरक्षित करते हैं, एक जलवायु में जहां एआई चैटबॉट की सामान्य, एसईओ-प्रेरित बोली भाषा खतरा है कि यह किसी भी भाषा को सामान्य बना देगी जहां एआई एक प्रमुख या प्रमुख योगदानकर्ता है।

कॉलेज निबंध के मूल्यह्रास के साथ, और छात्रों को अब मammoths लेखन सत्र स्क्रीनकास्ट कर रहे हैं ताकि यह साबित किया जा सके कि उन्होंने अपने सबमिशन पर एआई का उपयोग नहीं किया, अधिक शिक्षक यूरोप (जहां मौखिक परीक्षाएं सामान्य हैं) के बाहर मौखिक परीक्षाओं पर विचार कर रहे हैं एक विकल्प के रूप में जमा की गई पाठ के बजाय। हाल ही में, एक हस्तलिखित कार्य पर लौटने का प्रस्ताव किया गया है।

संभावित रूप से, दोनों समाधान एआई-आधारित गहरे नकली हथियारों की दौड़ की तुलना में बेहतर हैं; हालांकि वे मानव प्रयास और ध्यान की लागत पर आते हैं, जो तकनीकी संस्कृति वर्तमान में स्वचालित करने का प्रयास कर रही है।

^† कृपया विस्तार के लिए स्रोत पत्र में मुख्य परिणामों के बाद अंत अनुभाग देखें।

* लेखकों के इनलाइन उद्धरणों को हाइपरलिंक में बदलने का मेरा रूपांतरण। लेखकों का पाठ जोर, मेरा नहीं।

पहली बार गुरुवार, 19 जून, 2025 को प्रकाशित।

Martin Anderson

मशीन लर्निंग पर लेखक, मानव इमेज सिंथेसिस में डोमेन विशेषज्ञ। मेटाफिजिक.एआई में अनुसंधान सामग्री के पूर्व प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai