ठूंठ एआई स्टार्टअप डिफबॉट तथ्य-आधारित टेक्स्ट जेनरेशन के लिए संपूर्ण सार्वजनिक इंटरनेट को पढ़ता है - Unite.AI
हमसे जुडे

Artificial Intelligence

एआई स्टार्टअप डिफबॉट तथ्य-आधारित टेक्स्ट जेनरेशन को आगे बढ़ाने के लिए संपूर्ण सार्वजनिक इंटरनेट को पढ़ता है

mm
Updated on

प्राकृतिक भाषा प्रसंस्करण और पाठ निर्माण में हाल की प्रगति OpenAI ने अपने GPT-2 और के माध्यम से हासिल की है GPT-3 भाषा मॉडल प्रभावशाली रहे हैं, जो ऐसा पाठ उत्पन्न करने में सक्षम हैं जो ऐसा लगता है जैसे यह वास्तव में किसी मानव द्वारा लिखा गया हो। दुर्भाग्य से, हालांकि ये मॉडल प्राकृतिक-लगने वाले पाठ लिखने में उत्कृष्ट हैं, लेकिन वे तथ्यात्मक पाठ लिखने में सक्षम नहीं हैं। उन्नत भाषा मॉडल उन शब्दों से वाक्यों को जोड़ते हैं जो संदर्भ में सबसे अधिक अर्थ रखते हैं, उत्पन्न पाठ के भीतर दावों की सत्यता पर कोई ध्यान दिए बिना। जैसा कि एमआईटी प्रौद्योगिकी समीक्षा द्वारा रिपोर्ट किया गया है, एक स्टार्टअप के नाम से जाना जाता है Diffbot इसका उद्देश्य एआई द्वारा इंटरनेट से यथासंभव अधिक से अधिक तथ्य निकालकर इस समस्या का समाधान करना है।

डिफबॉट एक स्टार्टअप है जो ऑटो-पॉप्युलेटिंग स्प्रेडशीट और स्वत: पूर्ण वाक्य या कोड जैसे व्यावहारिक टेक्स्ट जेनरेशन कार्यों के लिए एआई को और अधिक उपयोगी बनाने की उम्मीद कर रहा है। एआई द्वारा उत्पन्न पाठ को विश्वसनीय बनाने के लिए, एआई को स्वयं भरोसेमंद होना चाहिए और इसमें तथ्यात्मक बनाम काल्पनिक बयानों की कुछ अवधारणा होनी चाहिए। टेक्स्ट जेनरेशन प्रोग्राम को तथ्यात्मक बयान उत्पन्न करने की क्षमता देने के लिए डिफबॉट का दृष्टिकोण व्यावहारिक रूप से संपूर्ण सार्वजनिक वेब से भारी मात्रा में टेक्स्ट एकत्र करने से शुरू होता है। डिफबॉट कई भाषाओं में पाठ को पार्स करता है और पाठ को तथ्य-आधारित त्रिक के सेट में विभाजित करता है, जिसमें किसी दिए गए तथ्य के विषय, वस्तु और क्रिया का उपयोग एक अवधारणा को दूसरे से जोड़ने के लिए किया जाता है। उदाहरण के लिए, यह बिल गेट्स और माइक्रोसॉफ्ट से संबंधित तथ्यों को इस प्रकार प्रस्तुत कर सकता है:

बिल गेट्स माइक्रोसॉफ्ट के संस्थापक हैं। माइक्रोसॉफ्ट एक कंप्यूटर टेक्नोलॉजी कंपनी है.

डिफबॉट इन सभी लघु तथ्यों को लेता है और एक ज्ञान ग्राफ बनाने के लिए उन्हें एक साथ जोड़ता है। ज्ञान ग्राफ अवधारणाओं के बीच संबंधों का जाल बनाते हैं, अक्सर एक तर्क के साथ जो इन संबंधों के आधार पर नए निष्कर्षों के निर्माण में सहायता करता है। दूसरे शब्दों में कहें तो, ज्ञान-ग्राफ़ डेटा इंटरलिंकिंग का उपयोग करते हैं, और वे ज्ञान डोमेन को मॉडल करने के लिए मशीन लर्निंग एल्गोरिदम की मदद कर सकते हैं। ज्ञान ग्राफ वास्तव में दशकों से मौजूद हैं और कई शुरुआती एआई शोधकर्ताओं ने एआई को मानव दुनिया को समझने की अनुमति देने के लिए उन्हें महत्वपूर्ण उपकरण माना है। हालाँकि, ज्ञान ग्राफ आमतौर पर हाथ से बनाए जाते थे जो एक कठिन, श्रमसाध्य प्रक्रिया है। ज्ञान ग्राफ़ के निर्माण को स्वचालित करने से एआई को अवधारणाओं की बहुत अधिक, प्रासंगिक समझ प्राप्त करने और तथ्य-आधारित पाठ तैयार करने की अनुमति मिल सकती है।

जब किसी लोकप्रिय विषय की खोज की जाती है तो जानकारी का सारांश प्रदान करने में सहायता के लिए Google ने कुछ साल पहले ज्ञान ग्राफ़ का उपयोग शुरू किया था। ज्ञान ग्राफ़ का उपयोग सबसे अधिक प्रासंगिक तथ्यों को खींचने और उन्हें सारांश के रूप में प्रस्तुत करने के लिए किया जाता है। डिफबॉट हर विषय के लिए एक ही काम करना चाहता है, न कि केवल सबसे लोकप्रिय विषयों के लिए। इसके लिए संपूर्ण सार्वजनिक वेब को क्रॉल करके संकलित एक बिल्कुल विशाल ज्ञान ग्राफ बनाने की आवश्यकता है, अन्यथा केवल Google और Microsoft ही ऐसा करते हैं। डिफबॉट पूरे वेब को स्कैन करता है और हर चार या पांच दिनों में नई जानकारी के साथ ज्ञान ग्राफ को अपडेट करता है, और एक महीने के दौरान यह 100 मिलियन से 150 मिलियन प्रविष्टियों के बीच जोड़ता है।

डिफबॉट सामान्य वेब-क्रॉलर की तरह किसी वेबसाइट के टेक्स्ट को नहीं पढ़ता है, बल्कि यह वेब पेज के कच्चे पिक्सल को निकालने और पेज से वीडियो, छवि, लेख और चर्चा डेटा खींचने के लिए कंप्यूटर विज़न एल्गोरिदम का उपयोग करता है। यह वेबपेज के प्रमुख तत्वों की पहचान करता है और फिर तीन-भाग वाली फैक्टॉइड स्कीमा के अनुपालन में विभिन्न भाषाओं में तथ्यों को निकालता है।

वर्तमान में, डिफबॉट अपने ज्ञान ग्राफ तक भुगतान और मुफ्त दोनों पहुंच प्रदान करता है। जबकि शोधकर्ता मुफ़्त में ग्राफ़ तक पहुंच सकते हैं, डकडकगो और स्नैपचैट जैसी कंपनियां इसका उपयोग टेक्स्ट को सारांशित करने और ट्रेंडिंग समाचार आइटम के स्निपेट निकालने के लिए करती हैं। इस बीच, नाइके और एडिडास नकली उत्पाद बेचने वाली साइटों को खोजने के लिए मंच का उपयोग करते हैं, जो संभव है क्योंकि डिफबॉट यह पता लगाने में सक्षम है कि कौन सी साइटें वास्तव में जूते बेच रही हैं, न कि केवल उनके बारे में चर्चा करने में।

भविष्य में, डिफबॉट अपनी क्षमताओं का विस्तार करने और प्लेटफ़ॉर्म पर एक प्राकृतिक-भाषा इंटरफ़ेस जोड़ने की योजना बना रहा है, जो आपके द्वारा पूछे गए लगभग किसी भी प्रश्न का उत्तर देने और स्रोतों के साथ उन उत्तरों का समर्थन करने में सक्षम है। आदर्श रूप से, डिफबॉट की क्षमताओं को GPT-3 जैसे शक्तिशाली भाषा संश्लेषण मॉडल के साथ जोड़ा जाएगा।