рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░
рдбреЙ рдпрд╛рдпрд░ рдЕрджрд╛рддреЛ, рдмреНрд░рд┐рдпрд╛ рдХреЗ рд╕реАрдИрдУ рдФрд░ рд╕рдВрд╕реНрдерд╛рдкрдХ – рд╕рд╛рдХреНрд╖рд╛рддреНрдХрд╛рд░ рд╢реНрд░реГрдВрдЦрд▓рд╛

डॉ यायर अदातो, ब्रिया के सीईओ और संस्थापक, एक मशीन लर्निंग और कंप्यूटर विजन विशेषज्ञ हैं जो उन्नत प्रौद्योगिकी को वास्तविक व्यवसायिक अनुप्रयोगों से जोड़ने में सक्षम हैं। ब्रिया की स्थापना से पहले, उन्होंने ट्रैक्स रिटेल के सीटीओ के रूप में कार्य किया, जहां उन्होंने कंपनी को 20 लोगों की शुरुआत से 850 से अधिक कर्मचारियों वाले वैश्विक यूनिकॉर्न में बदलने में एक केंद्रीय भूमिका निभाई। अपने करियर के दौरान, यायर ने स्पार्क्स, विकोमी, तस्क, डेटागेन और एनिमा जैसे कई एआई-संचालित उद्यमों के लिए एक सलाहकार के रूप में भी योगदान दिया है। उनका नेतृत्व जिम्मेदार नवाचार, डेटा स्वामित्व और एआई प्रौद्योगिकी के लोकतंत्रीकरण के प्रति एक मजबूत प्रतिबद्धता से चिह्नित है।
ब्रिया जिम्मेदार दृश्य जनरेटिव एआई के क्षेत्र में एक अग्रणी कंपनी है, जिसका मिशन एक खुला और नैतिक मंच बनाना है जो छवि पीढ़ी के लिए है। कंपनी का अनोखा दृष्टिकोण डेटा मालिकों को उनके योगदान के लिए एक विशेषता इंजन के माध्यम से पुरस्कृत करता है, जो एआई पारिस्थितिकी तंत्र में पारदर्शिता और न्याय को सुनिश्चित करता है। रचनात्मकता, सहयोग और अनुपालन पर ध्यान केंद्रित करके, ब्रिया संगठनों को अपने कार्यप्रवाह में सुरक्षित रूप से जनरेटिव एआई को एकीकृत करने के लिए सशक्त बनाता है, साथ ही दृश्य सामग्री उद्योग में जिम्मेदारी और विश्वास के लिए नए मानक निर्धारित करता है।
आपने ब्रिया की स्थापना जिम्मेदार और खुले दृश्य जनरेटिव एआई प्लेटफ़ॉर्म बनाने के लिए की। आपको कंपनी शुरू करने के लिए क्या प्रेरित किया, और शुरुआती चुनौतियों या अंतर्दृष्टि ने इसकी दिशा को कैसे आकार दिया?
मैंने गुडफेलो को 2014 में जीएएन पेपर प्रस्तुत करते हुए देखा, और यह तुरंत स्पष्ट था कि रचनात्मक उत्पादन मौलिक रूप से बदलने जा रहा था। उस प्रस्तुति को देखते हुए, परिणाम स्पष्ट थे—यह केवल एक अनुक्रमिक सुधार नहीं था, यह मशीनों के लिए दृश्य सामग्री को सीखने के लिए एक अलग परिदृश्य था।
लेकिन शुरू से, मैंने इन प्रणालियों के निर्माण में एक मौलिक अंतराल को पहचाना: प्रशिक्षण डेटा के लिए कोई जिम्मेदारी, जिम्मेदार तैनाती के लिए कोई ढांचा, और जिन लोगों के काम ने इसे संभव बनाया था उनके लिए कोई विचार नहीं।
प्रारंभिक चुनौतियां तकनीकी नहीं थीं—वे संरचनात्मक थीं। आप रचनात्मक कार्य को बढ़ाने के लिए जनरेटिव एआई कैसे बनाते हैं जो उन लोगों को कमजोर नहीं करता जो इसे बनाते हैं? आप कानूनी निश्चितता के रूप में उत्पादन वातावरण में गुणवत्ता के रूप में महत्वपूर्ण होने के लिए इन प्रणालियों को कैसे बनाते हैं? उन प्रश्नों ने सब कुछ आकार दिया जो हमने बनाया है। हमने ब्रिया की स्थापना इस सिद्धांत पर की है कि नवाचार और जिम्मेदारी विरोधी बल नहीं हैं—वे एक साथ आगे बढ़ना चाहिए, या प्रौद्योगिकी सभी को विफल कर देती है।
आपकी अकादमिक पृष्ठभूमि कंप्यूटर विजन में और आपके 50+ पेटेंट शोध और वास्तविक दुनिया के नवाचार को जोड़ते हैं। यह अनुभव ब्रिया के तकनीकी रोडमैप और दीर्घकालिक रणनीति को कैसे प्रभावित करता है?
मेरी शोध पृष्ठभूमि ने मुझे प्रणालियों में सोचना सिखाया—कैसे विभिन्न परतें अर्थ बनाने के लिए जुड़ती हैं। मेरे कई पेटेंट मशीनों द्वारा दृश्य जानकारी की संरचना की व्याख्या करने के तरीके पर केंद्रित हैं। यह दृष्टिकोण स्वाभाविक रूप से ब्रिया के दृष्टिकोण में अनुवादित हुआ। हम छवि पीढ़ी को एक रचनात्मक प्रक्रिया के रूप में देखते हैं, एक यादृच्छिक प्रक्रिया के रूप में नहीं।
लेकिन पेटेंट केवल प्रौद्योगिकी के बारे में नहीं हैं—वे तकनीक को व्यवसाय वास्तविकता से जोड़ने के बारे में हैं। हमारे आईपी पोर्टफोलियो का एक महत्वपूर्ण हिस्सा सिस्टम परत से संबंधित है: आप कैसे विशेषता ढांचे बनाते हैं जो उत्पन्न सामग्री को इसके प्रशिक्षण स्रोतों से जोड़ता है? आप कैसे आर्थिक मॉडल बनाते हैं जो बड़े पैमाने पर रचनाकारों को मुआवजा देते हैं? ये शुद्ध तकनीकी समस्याएं नहीं हैं—वे बुनियादी ढांचे, व्यवसाय मॉडल और बाजार डिजाइन के प्रश्न हैं।
यह व्यापक दृष्टिकोण ने हमारी दीर्घकालिक रणनीति को आकार दिया है। नवाचार केवल अंतर्निहित मॉडलों को आगे बढ़ाने के बारे में नहीं है। यह नए आर्थिक संरचनाओं, नए अनुबंध ढांचे, नए उद्योग के लिए स्थायी रूप से काम करने के तरीकों के निर्माण के बारे में है। लक्ष्य केवल बेहतर परिणाम उत्पन्न करना नहीं है—यह समझना है कि वे परिणाम कैसे बनते हैं, किसने उनमें योगदान दिया, और मूल्य प्रणाली में कैसे प्रवाहित होता है। यह वह जगह है जहां विज्ञान उत्पाद सोच और व्यवसाय वास्तुकला से मिलता है।
ब्रिया ने फाइबो की घोषणा की, जिसे दुनिया का पहला निर्धारित दृश्य फाउंडेशन मॉडल बताया गया है जो पेशेवर-ग्रेड एआई पीढ़ी के लिए है। मौजूदा दृश्य एआई प्रणालियों से फाइबो मौलिक रूप से क्या अलग करता है?
नाम ही हमारे दृष्टिकोण को संकेत देता है: फाइबो फिबोनाची के लिए खड़ा है, जो गणितीय अनुक्रम है जो अपने आंतरिक सौंदर्य गुणों के लिए प्रसिद्ध है। सुनहरा अनुपात—फिबोनाची अनुक्रम में क्रमिक संख्याओं के बीच का अनुपात—गणित, दृश्य कला, ज्यामिति और वास्तुकला में हमारे द्वारा दृश्य रूप से सुंदर अनुपात के रूप में माने जाने वाले में उभरता है। आप इसे रोमन पैनथियन और व्हाइट हाउस के आयामों में, लियोनार्डो दा विंची के विट्रुवियन मैन में मानव शरीर और चेहरे में, और प्राकृतिक रूपों में हर जगह देखते हैं। यह गणितीय संरचना और दृश्य सौंदर्य के बीच का संबंध है जो फाइबो को दर्शाता है: संरचनात्मक गुणों के माध्यम से सौंदर्य।
फाइबो इरादा और आउटपुट के बीच संबंध को बदलता है। अधिकांश दृश्य एआई प्रणालियों में आपके द्वारा क्या चाहिए और आपको क्या मिलता है, इसके बीच व्याख्या की परतें डालती हैं—आप एक प्रोम्प्ट लिखते हैं, मॉडल इसे भाषा एनकोडर के माध्यम से अनुवादित करता है, शोर के माध्यम से इसे फैलाता है, और आप आशा करते हैं कि परिणाम आपकी दृष्टि से मेल खाता है। फाइबो उन परतों को पूरी तरह से हटा देता है।
हमने दृश्य एआई को कोड की तरह काम करने के लिए बनाया—प्रत्येक रचनात्मक तत्व संपादन योग्य और पुनरावृत्ति योग्य है। यह पेशेवरों के लिए एक突破 है जो प्रॉम्प्ट रूलेट के साथ फंसे हुए हैं। इसका अर्थ है कि प्रत्येक तत्व, प्रकाश दिशा, कैमरा कोण, रंग पैलेट, संरचना, शैली एक स्पष्ट, नियंत्रित गुण के रूप में मौजूद है। जेएसओएन संरचना आपको केवल उन पैरामीटरों को संशोधित करने की अनुमति देती है जिन्हें आप चाहते हैं, जबकि अन्य सभी को लॉक करती है। आप प्रकाश तीव्रता को संशोधित कर सकते हैं जिससे संरचना प्रभावित नहीं होती है, या कैमरा कोण को 15 डिग्री तक बदल सकते हैं जिससे रंग पैलेट प्रभावित नहीं होती है। प्रणाली ठीक वही करती है जो आप निर्दिष्ट करते हैं, हर समय।
हम फाल और एनवीडिया के साथ हैकथॉन चला रहे हैं ताकि विकासकर्ताओं को दिखाया जा सके कि निर्धारित पीढ़ी वास्तव में कैसे काम करती है। जेएसओएन संरचना खुद ब्लैक बॉक्स खोल देती है—आप देख सकते हैं कि किन पैरामीटरों ने एक छवि बनाई, इसे पुनः उत्पन्न करें और सटीकता के साथ संशोधित करें। यह प्रॉम्प्ट इंजीनियरिंग से एक完全 अलग परिदृश्य है।
पारंपरिक पाठ-से-छवि प्रणालियां बढ़ती जटिलता वाले प्रॉम्प्ट पर निर्भर करती हैं ताकि विशिष्ट परिणाम प्राप्त किए जा सकें। फाइबो का दृष्टिकोण प्रॉम्प्ट जटिलता समस्या का समाधान कैसे करता है?
दो समस्याओं का समाधान करने की आवश्यकता है। पहला, प्रॉम्प्ट यादृच्छिकता समस्याएं मौजूद हैं क्योंकि वर्तमान मॉडल उपयोगकर्ता के इरादे को निकालने और प्रॉम्प्ट वृद्धि के माध्यम से सौंदर्य या वांछनीय के रूप में मॉडल क्या सोचता है जोड़ने का प्रयास कर रहे हैं। दूसरा, पेशेवर गुणों पर नियंत्रण की कमी।
फाइबो इसे उलट देता है। मॉडल को 1,000 शब्दों से अधिक की दृश्य विवरण प्रति छवि पर प्रशिक्षित किया गया था जो जेएसओएन प्रारूप में 100 से अधिक स्वतंत्र विशेषताओं को स्पष्ट रूप से एनकोड करता है। यह पोस्ट-प्रोसेस्ड या निकाला गया नहीं था—यह मूल प्रशिक्षण प्रारूप था। क्योंकि प्रत्येक विशेषता शुरू से ही संरचनात्मक रूप से प्रस्तुत की जाती है, मॉडल ने दृश्य संरचना को एक सेट के रूप में सीखा है। व्याख्या के बजाय नियंत्रित पैरामीटर।
इसका क्या अर्थ है अभ्यास में: आप संरचना के माध्यम से सौंदर्य इरादा परिभाषित करते हैं, प्रॉम्प्ट और प्रार्थना के माध्यम से नहीं। पाठ-से-छवि संरेखण मौलिक रूप से उच्च है क्योंकि कोई अनुवाद परत नहीं है। आप मॉडल की मूल भाषा बोल रहे हैं। और क्योंकि गुण स्वतंत्र हैं, आप प्रकाश की तीव्रता को संरचना को प्रभावित किए बिना बदल सकते हैं, या रंग पैलेट को शैली को प्रभावित किए बिना बदल सकते हैं। नियंत्रण सर्जिकल है।
फाइबो एक “रिफाइन” कार्यप्रवाह पेश करता है जो विशिष्ट पीढ़ी के लिए विशिष्ट है। यह पेशेवरों के दृष्टिकोण से दृश्य उत्पादन को कैसे बदलता है?
अधिकांश जनरेटिव कार्यप्रवाह निराशाजनक रूप से पुनरावृत्तिक हैं—आप उत्पन्न करते हैं, मूल्यांकन करते हैं, अपने प्रॉम्प्ट को समायोजित करते हैं, फिर से उत्पन्न करते हैं, आशा करते हैं कि यह करीब है। यह “प्रॉम्प्ट और प्रार्थना” है। आप कभी भी यह नहीं जानते कि क्या बदला या क्यों।
रिफाइन प्रयोग को डिजाइन में बदल देता है। आप प्रॉम्प्ट का अनुमान नहीं लगा रहे हैं कि यह क्या करेगा—आप छवि को सटीक रूप से निर्देशित कर रहे हैं, जिस तरह से आप फोटोशॉप में प्रकाश या रंग को ट्यून करते हैं। आपको सीधे जेएसओएन स्तर पर काम करने की आवश्यकता नहीं है—एक दृष्टि-भाषा मॉडल जेएसओएन को आपके लिए प्राकृतिक भाषा निर्देशों के आधार पर संशोधित करता है। लेकिन जेएसओएन खुद आपको यह समझने की अनुमति देता है कि क्या हुआ। आप एक प्रारंभिक छवि उत्पन्न करते हैं, इसके जेएसओएन प्रतिनिधित्व की जांच करते हैं, यह पहचानते हैं कि कौन से गुणों को समायोजन की आवश्यकता है—शायद प्रकाश तीव्रता बहुत अधिक है, या कैमरा कोण को 15 डिग्री तक बदलने की आवश्यकता है—और आप केवल उन मानों को सरल निर्देशों के माध्यम से संशोधित करते हैं। सब कुछ और ताला लगा दिया जाता है।
यह संरचना एजेंटिक कार्यप्रवाह के लिए उपयुक्त है। एक एआई एजेंट जेएसओएन का विश्लेषण कर सकता है, छवि की पूरी स्थिति को समझ सकता है, लक्षित संशोधन कर सकता है और अपने तर्क की व्याख्या कर सकता है—सब क्योंकि पैरामीटर स्पष्ट और व्याख्या योग्य हैं। एजेंट प्रॉम्प्ट परिवर्तन का अनुमान नहीं लगा रहा है—यह ज्ञात गुणों में सटीक समायोजन कर रहा है।
यह पेशेवरों को जनरेटिव एआई के प्रति संदेह को दूर करने के लिए अनिश्चितता को हटा देता है। जब आप देख सकते हैं कि किन पूर्ण पैरामीटर सेट ने एक छवि बनाई, समझें कि प्रत्येक गुण क्या नियंत्रित करता है, और विश्वास के साथ व्यक्तिगत विशेषताओं को संशोधित करें कि कुछ और नहीं होगा, तो आप प्रयोग नहीं कर रहे हैं—आप डिजाइन कर रहे हैं। जेएसओएन दृश्यता पूरी तरह से ब्लैक बॉक्स खोलती है। पेशेवर उत्पादन कार्यप्रवाह के लिए जहां निरंतरता और नियंत्रण नवाचार से अधिक मायने रखते हैं, यह एक रचनात्मक खिलौने और एक उत्पादन उपकरण के बीच का अंतर है।
डेटा नैतिकता और ब्रांड सुरक्षा उद्यम एआई में केंद्रीय हो गए हैं। ब्रिया के पूरी तरह से लाइसेंस प्राप्त, अधिकार-साफ़ डेटा का उपयोग कैसे अनुपालन और रचनाकारों के आईपी के प्रति सम्मान सुनिश्चित करता है?
हमने दिन एक से तय किया कि यदि उद्योग जिम्मेदारी से बढ़ना है, तो यह डेटा अखंडता से शुरू करना होगा। फाइबो को प्रशिक्षित करने वाली प्रत्येक छवि लाइसेंस प्राप्त, अधिकार-साफ़ स्रोतों से आती है, जैसे कि गेटी इमेजेज़ और एनवाटो के साथ साझेदारी। यह हमारे मॉडलों को अनुपालन और न्यायसंगत बनाता है। हम रचनाकारों के प्रति सम्मान को मूल्य श्रृंखला के हिस्से के रूप में देखते हैं, एक प्रतिबंध के रूप में नहीं। उद्यमों को इसकी अखंडता से लाभ होता है क्योंकि इससे उन्हें बड़े पैमाने पर विश्वास के साथ बढ़ने के लिए कानूनी और नैतिक निश्चितता मिलती है।
फाइबो को प्रत्येक कंपनी की अनूठी ब्रांड शैली और पहचान सीखने के लिए प्रशिक्षित किया गया था। यह क्षमता वैश्विक ब्रांडों को सामग्री निर्माण और दृश्य संगति के दृष्टिकोण से कैसे बदलती है?
ब्रांडों की अपनी दृश्य डीएनए होती है—एक अनोखा तरीका जिसमें वे डिजाइन के माध्यम से भावना, विश्वास और उद्देश्य की अभिव्यक्ति करते हैं। फाइबो उस भाषा को सीख सकता है। एक बार प्रशिक्षित होने के बाद, यह ऐसी दृश्य सामग्री उत्पन्न करता है जो उसी संरचना, स्वर और वातावरण को प्रतिबिंबित करती है जो एक ब्रांड की पहचान को परिभाषित करती है। यह एआई को एक रचनात्मक सहायक से एक ब्रांड संपत्ति में बदल देता है। यह वैश्विक टीमों को संरेखण के साथ, अनुमान के साथ नहीं, बनाने में मदद करता है। परिणाम स्केल पर संगति है जो व्यक्तित्व को खोने के बिना है।
प्रारंभिक अपनाने वालों ने पहले से ही फाइबो का उपयोग पैकेजिंग डिजाइन, उत्पाद छवियों और रचनात्मक अभियानों को स्वचालित करने के लिए किया है। अब तक आपको क्या परिणाम या प्रतिक्रिया सबसे अधिक खड़ा है?
मानसिकता में बदलाव। टीमें एआई को अपने संचालन टूलकिट के हिस्से के रूप में मानने लगी हैं, एक नवाचार के रूप में नहीं। एक वैश्विक ब्रांड क्षेत्रीय पैकेजिंग वेरिएंट्स को ब्रांड संगति बनाए रखते हुए बहुत तेजी से उत्पन्न कर रहा है। एक प्रमुख रचनात्मक एजेंसी ने फाइबो के माध्यम से नियंत्रित पुनरावृत्ति के माध्यम से अभियान विकास को दस गुना तेज कर दिया है। लेकिन असल संकेत यह है कि रचनात्मक निर्देशक हमें बताते हैं कि वे अधिक नियंत्रण में महसूस करते हैं; कि मॉडल उनकी दृश्य इरादा को समझता है। यह उद्योग के लिए एक महत्वपूर्ण मोड़ है।
ब्रिया खुद को नैतिक और नियंत्रित एआई के नेता के रूप में स्थापित करता है। यह दर्शन भविष्य के नियमन या दृश्य एआई के लिए उद्योग मानकों को कैसे आकार देगा?
हम उस चरण पर पहुंच गए हैं जहां नवाचार और शासन एक साथ आगे बढ़ने की आवश्यकता है। नियमन एक बाधा नहीं है, बल्कि स्थायी विकास के लिए बुनियादी ढांचा है। हमारा दृष्टिकोण—पारदर्शी डेटा, निर्धारित आउटपुट, स्पष्ट प्रोवेनेंस—उभर रही नीतियों के साथ密त से जुड़ता है। मुझे विश्वास है कि हम ट्रेसबिलिटी, व्याख्या योग्यता, और अधिकार संरक्षण पर जोर देने वाले नए मानक देखेंगे। ब्रिया का दर्शन उन मानकों को अभ्यास के माध्यम से, नीति बयानों के माध्यम से नहीं, परिभाषित करने में मदद करना है।
आगे देखते हुए, फाइबो के बाद ब्रिया के लिए क्या है? क्या आप मल्टीमॉडल एआई में विस्तार करने की कल्पना करते हैं जो छवि, वीडियो और 3डी पीढ़ी को एक नियंत्रित फ्रेमवर्क के तहत एकजुट करता है?
हाँ। फाइबो को शक्ति देने वाले सिद्धांत—संरचना, नियंत्रण, पारदर्शिता—सभी दृश्य डोमेन में लागू होते हैं। हम वीडियो और 3डी में विस्तार की खोज कर रहे हैं, जहां निर्धारितता छवियों के साथ उद्यमों को उसी विश्वसनीयता प्रदान कर सकती है। हमारा लक्ष्य सरल है: एआई रचनात्मकता को कोड लिखने जितना नियंत्रित और सुरक्षित बनाना—और इसे हर दृश्य माध्यम में विस्तारित करना, छवि से वीडियो से 3डी तक।
साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें ब्रिया पर जाना चाहिए。












