विचारक नेता

जटिल इंजीनियरिंग ड्राइंग के लिए ओसीआर का उपयोग करना

प्रकाशित

8 महीने पहले

सितम्बर 14, 2023

ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) ने व्यवसायों द्वारा दस्तावेज़ प्रसंस्करण को स्वचालित करने के तरीके में क्रांति ला दी है। हालाँकि, प्रौद्योगिकी की गुणवत्ता और सटीकता हर अनुप्रयोग के लिए इसमें कटौती नहीं करती है। संसाधित किया जाने वाला दस्तावेज़ जितना अधिक जटिल होता है, वह उतना ही कम सटीक होता जाता है। यह इंजीनियरिंग ड्राइंग के लिए विशेष रूप से सच है। हालाँकि आउट ऑफ़ द बॉक्स OCR प्रौद्योगिकियाँ इस कार्य के लिए उपयुक्त नहीं हो सकती हैं, लेकिन OCR के साथ आपके दस्तावेज़ प्रसंस्करण लक्ष्यों को प्राप्त करने के अन्य तरीके हैं। आगे, मैं बहुत अधिक तकनीकी विवरण में जाए बिना आपको एक सामान्य विचार देने के लिए कई व्यवहार्य समाधान तलाशूंगा।

इंजीनियरिंग ड्राइंग पहचान की चुनौतियाँ

जब तकनीकी रेखाचित्रों की बात आती है, तो ओसीआर को व्यक्तिगत पाठ तत्वों के अर्थ को समझने में कठिनाई होती है। तकनीक पाठ तो पढ़ सकती है, लेकिन उसका अर्थ नहीं समझ पाती। इंजीनियरों और निर्माताओं के लिए इस बात पर विचार करने के कई अवसर हैं कि क्या तकनीकी दस्तावेज़ की स्वचालित पहचान सही ढंग से कॉन्फ़िगर की गई है। उनमें से सबसे महत्वपूर्ण को नीचे देखें।

छवि स्रोत: मोबिदेव

जटिल तकनीकी दस्तावेज़ीकरण विश्लेषण प्राप्त करने के लिए, इंजीनियरों को एआई मॉडल को प्रशिक्षित करने की आवश्यकता है। इंसानों की तरह, एआई मॉडल को भी इन चित्रों को समझने के लिए अनुभव और प्रशिक्षण की आवश्यकता होती है।

ब्लूप्रिंट और इंजीनियरिंग ड्राइंग पहचान की एक चुनौती यह है कि सॉफ़्टवेयर को यह समझना चाहिए कि ड्राइंग के विभिन्न दृश्यों को कैसे अलग किया जाए। ये ड्राइंग के विभिन्न भाग हैं जो इसके लेआउट का मूल विचार देते हैं। विचारों को अलग करके और यह समझकर कि वे एक-दूसरे से कैसे संबंधित हैं, सॉफ्टवेयर बाउंडिंग बॉक्स की गणना कर सकता है।

इस प्रक्रिया में कई चुनौतियाँ शामिल हो सकती हैं:

दृश्य ओवरलैप हो सकते हैं
दृश्य क्षतिग्रस्त हो सकते हैं
लेबल दो दृश्यों से समान दूरी पर हो सकते हैं
दृश्य नेस्टेड हो सकते हैं

विचारों के बीच संबंध एक और संभावित मुद्दा है। आपको इस बात पर विचार करना चाहिए कि क्या दृश्य आरेख का एक सपाट हिस्सा है, एक मुड़ा हुआ हिस्सा है, एक ब्लॉक है, या कुछ और है। इसके अतिरिक्त, अन्य समस्याएं भी हो सकती हैं जैसे जंजीरदार माप, लापता एनोटेशन, किसी मानक के संदर्भ में अंतर्निहित रूप से परिभाषित ऊंचाइयां, या अन्य समस्याएं।

महत्वपूर्ण बात यह है कि सामान्य ओसीआर उन चित्रों में पाठ को विश्वसनीय रूप से नहीं समझ सकता है जो रेखाओं, प्रतीकों और एनोटेशन जैसे ग्राफिकल तत्वों से घिरे होते हैं। इस तथ्य के कारण, हमें गहराई से जानने की जरूरत है मशीन लर्निंग के साथ ओसीआर जो इस एप्लिकेशन के लिए अधिक उपयोगी होगा।

पूर्व-प्रशिक्षित और कस्टम ओसीआर मॉडल

बाज़ार में OCR सॉफ़्टवेयर की कोई कमी नहीं है, लेकिन इन सभी सॉफ़्टवेयर को उपयोगकर्ता द्वारा प्रशिक्षित या संशोधित नहीं किया जा सकता है। जैसा कि हमने सीखा है, आपके इंजीनियरिंग चित्रों का विश्लेषण करने के लिए प्रशिक्षण एक आवश्यकता हो सकती है। हालाँकि, इस प्रकार के रेखाचित्रों के लिए OCR उपकरण मौजूद हैं।

पूर्व-प्रशिक्षित ओसीआर उपकरण

इंजीनियरिंग ड्राइंग की ओसीआर पहचान के लिए यहां कुछ सामान्य विकल्प दिए गए हैं:

एबीबी फाइनरीडर: यह बहुमुखी ब्लूप्रिंट-व्याख्या सॉफ्टवेयर पाठ के लिए पहचान क्षमताओं के साथ ओसीआर तकनीक प्रदान करता है। यह विभिन्न छवि प्रारूपों, लेआउट प्रतिधारण, डेटा निर्यात और एकीकरण का समर्थन करता है।
एडोब एक्रोबैट प्रो: पीडीएफ संपादन, देखने और प्रबंधन प्रदान करने के अलावा, एक्रोबैट आपको ओसीआर दस्तावेजों और ब्लूप्रिंट को स्कैन करने, टेक्स्ट निकालने और खोज करने की अनुमति देता है। यह विभिन्न भाषाओं का समर्थन करता है और उपयोगकर्ताओं को विकल्पों को कॉन्फ़िगर करने की अनुमति देता है।
ब्लूबीम रेवु: एक अन्य लोकप्रिय पीडीएफ एप्लिकेशन, ब्लूबीम रेवू इंजीनियरिंग ड्राइंग टेक्स्ट निष्कर्षण के लिए ओसीआर तकनीक प्रदान करता है।
ऑटोकैड: कंप्यूटर एडेड डिज़ाइन के लिए खड़ा, ऑटोकैड ब्लूप्रिंट की व्याख्या करने और उन्हें संपादन योग्य सीएडी तत्वों में परिवर्तित करने के लिए ओसीआर प्लगइन्स का समर्थन करता है।
प्लानग्रिड: इस सॉफ़्टवेयर में बॉक्स से बाहर ब्लूप्रिंट ओसीआर व्याख्या शामिल है। इस सुविधा के साथ, आप ब्लूप्रिंट छवियां अपलोड कर सकते हैं और फिर टेक्स्ट को निकाल सकते हैं, व्यवस्थित कर सकते हैं, अनुक्रमित कर सकते हैं और खोज सकते हैं।
पाठ: यह क्लाउड-आधारित AWS सुविधा दस्तावेज़ों के OCR विश्लेषण को सक्षम करती है और दस्तावेज़ों से तालिकाओं जैसे तत्वों को निकाल सकती है। यह ब्लूप्रिंट से तत्वों को भी पहचान सकता है और अन्य अनुप्रयोगों के साथ एकीकरण के लिए एपीआई प्रदान करता है।
बटलर ओसीआर: डेवलपर्स को दस्तावेज़ निष्कर्षण एपीआई प्रदान करता है, बटलर ओसीआर दस्तावेज़ पहचान की सटीकता को बढ़ाने के लिए मशीन लर्निंग को मानव समीक्षा के साथ जोड़ता है।

कस्टम ओसीआर समाधान

यदि आप कस्टम ओसीआर समाधानों की तलाश कर रहे हैं जिन्हें इंजीनियरिंग ड्राइंग से बेहतर स्वचालित डेटा निष्कर्षण प्राप्त करने और इसे आपके विशिष्ट डेटा प्रारूप में अपनाने के लिए प्रशिक्षित किया जा सकता है, तो यहां कुछ लोकप्रिय विकल्प दिए गए हैं:

टेसरैक्ट: Google द्वारा बनाए गए इस लचीले, ओपन-सोर्स OCR इंजन को ब्लूप्रिंट-विशिष्ट वर्णों और प्रतीकों को पहचानने के लिए कस्टम डेटा पर प्रशिक्षित किया जा सकता है।
ओपनसीवी: कस्टम व्याख्यात्मक समाधान बनाने के लिए ओपन-सोर्स कंप्यूटर विज़न लाइब्रेरी को टेसेरैक्ट जैसे ओसीआर टूल के साथ जोड़ा जा सकता है। इसके इमेज प्रोसेसिंग और विश्लेषण कार्य ठीक से उपयोग किए जाने पर इंजीनियरिंग ड्राइंग पर ओसीआर की सटीकता को बढ़ा सकते हैं।

इन उपकरणों के अलावा, कस्टम मशीन लर्निंग मॉडल को स्वतंत्र रूप से विकसित करना भी संभव है। लेबल किए गए डेटासेट, टेन्सरफ्लो या पायटोरच जैसे फ्रेमवर्क पर प्रशिक्षण मॉडल का उपयोग करके, इन समाधानों को विशिष्ट ब्लूप्रिंट तत्वों को पहचानने और किसी संगठन की जरूरतों के लिए उच्च सटीकता प्राप्त करने के लिए ठीक किया जा सकता है।

पूर्व-प्रशिक्षित मॉडल सुविधा और उपयोग में आसानी प्रदान करते हैं लेकिन कस्टम समाधानों की तरह इंजीनियरिंग ड्राइंग की व्याख्या करने में उतने प्रभावी नहीं हो सकते हैं। इन कस्टम समाधानों को विकसित करने और बनाए रखने के लिए अतिरिक्त संसाधनों और विशेषज्ञता की भी आवश्यकता होती है।

कस्टम समाधानों को विकसित करने के लिए अतिरिक्त वित्तीय संसाधनों और श्रम की आवश्यकता होती है। मैं एक से शुरुआत करने की सलाह दूंगा अवधारणा का प्रमाण (PoC) कस्टम ओसीआर समाधान में बहुत अधिक निवेश करने से पहले परियोजना के बारे में बाजार की धारणा की जांच करने के लिए तकनीकी क्षमताओं और न्यूनतम व्यवहार्य उत्पाद (एमवीपी) को मान्य करना।

इंजीनियरिंग चित्र पढ़ने के लिए ओसीआर मॉड्यूल लागू करने की प्रक्रिया

इंजीनियरिंग ड्राइंग के लिए ओसीआर सॉफ्टवेयर का निर्माण शुरू करने के लिए सबसे अच्छी जगह उपलब्ध विश्लेषण करना होगा ओपन-सोर्स उपकरण। यदि आप अपने ओपन-सोर्स विकल्पों को समाप्त कर देते हैं, तो आपको एपीआई एकीकरण के साथ बंद-स्रोत विकल्पों की ओर रुख करने की आवश्यकता हो सकती है।

शुरुआत से OCR समाधान बनाना अव्यावहारिक है क्योंकि इसके लिए प्रशिक्षण के लिए विशाल डेटासेट की आवश्यकता होती है। इसे इकट्ठा करना कठिन और महंगा है और मॉडल प्रशिक्षण के लिए बहुत सारे संसाधनों की आवश्यकता होती है। ज्यादातर मामलों में, मौजूदा मॉडलों को ठीक-ठाक करना आपकी आवश्यकताओं के अनुरूप होना चाहिए।

यहां से प्रक्रिया कुछ इस तरह दिखती है:

आवश्यकताओं पर विचार करें: आपको यह समझने की आवश्यकता है कि आपके एप्लिकेशन को किस प्रकार की इंजीनियरिंग ड्राइंग के साथ काम करना चाहिए और उस लक्ष्य को प्राप्त करने के लिए किस प्रकार की सुविधाओं और कार्यक्षमताओं की आवश्यकता है।
छवि कैप्चर और प्री-प्रोसेसिंग: इस बारे में सोचें कि आप छवियों को कैप्चर करने के लिए किन उपकरणों का उपयोग करने की योजना बना रहे हैं। आपके परिणामों की गुणवत्ता बढ़ाने के लिए अतिरिक्त पूर्व-प्रसंस्करण चरणों की आवश्यकता हो सकती है। इसमें क्रॉप करना, आकार बदलना, डीनोइज़ करना और बहुत कुछ शामिल हो सकता है।
ओसीआर एकीकरण: उस ओसीआर इंजन पर विचार करें जो आपके एप्लिकेशन के साथ सबसे अच्छा काम करेगा। ओसीआर पुस्तकालयों में एपीआई हैं जो आपके एप्लिकेशन को कैप्चर की गई छवियों से टेक्स्ट निकालने की अनुमति देते हैं। लागत-बचत के लिए ओपन-सोर्स ओसीआर समाधानों पर विचार करना महत्वपूर्ण है। तृतीय-पक्ष एपीआई समय के साथ मूल्य निर्धारण के संबंध में अस्थिर हो सकते हैं या समर्थन खो सकते हैं।
पाठ पहचान और प्रसंस्करण: अगला, पाठ को संसाधित करने और पहचानने के लिए तर्क को लागू करने का समय आ गया है। कुछ संभावित कार्य जिन्हें आप इस चरण में जोड़ने पर विचार कर सकते हैं वे हैं टेक्स्ट क्लीनअप, भाषा पहचान, या कोई अन्य तकनीक जो स्पष्ट टेक्स्ट पहचान परिणाम प्रदान कर सकती हैं।
उपयोगकर्ता इंटरफ़ेस और अनुभव: ऐप के लिए उपयोग में आसान यूआई महत्वपूर्ण है ताकि उपयोगकर्ता छवियों को कैप्चर करने और ओसीआर शुरू करने के लिए इसका प्रभावी ढंग से उपयोग कर सके। परिणाम उपयोगकर्ता के सामने इस तरह प्रस्तुत किए जाने चाहिए कि समझने में आसान हो।
परीक्षण: इसकी सटीकता और उपयोगिता सुनिश्चित करने के लिए एप्लिकेशन का पूरी तरह से परीक्षण करें। इस प्रक्रिया के लिए उपयोगकर्ता प्रतिक्रिया आवश्यक है।

लपेटकर

जटिल इंजीनियरिंग ड्राइंग के लिए ओसीआर सॉफ्टवेयर बनाने की चुनौतियों का सामना करते हुए, संगठनों के पास इस मुद्दे से निपटने के लिए कई विकल्प उपलब्ध हैं। अधिक वैयक्तिकृत समाधान बनाने के लिए पूर्व-प्रशिक्षित मॉडल और अनुकूलन योग्य टूल की एक श्रृंखला से, व्यवसाय ब्लूप्रिंट और अन्य जटिल दस्तावेजों के माध्यम से प्रभावी ढंग से विश्लेषण, अनुक्रमण और खोज करने के तरीके ढूंढ सकते हैं। उनकी ज़रूरतों को पूरा करने वाला समाधान तैयार करने के लिए बस कुछ सरलता, रचनात्मकता और समय की आवश्यकता होती है।

संबंधित विषय:ओसीआर विचारक नेता

अगला

एआई और एआर डेटा डिमांड को बढ़ा रहे हैं - ओपन सोर्स हार्डवेयर चुनौती को पूरा कर रहा है

मिस न करें

स्वास्थ्य सेवा उद्योग में जनरेटिव एआई को स्पष्टीकरण की खुराक की आवश्यकता है

लिउबोव ज़तोलोकिना

एआई टीम लीडर मोबिदेव, एक सॉफ्टवेयर विकास कंपनी जो दुनिया भर की कंपनियों को कृत्रिम बुद्धिमत्ता, डेटा विज्ञान, संवर्धित वास्तविकता और इंटरनेट ऑफ थिंग्स जैसी अत्याधुनिक तकनीकों के साथ नवाचार करने में मदद करती है। उनका पेशेवर फोकस डेटा एनालिटिक्स, फोरकास्टिंग, एनएलपी और चैटबॉट्स है। AiiotTalk, Hackernoon, DevTo के लिए कृत्रिम बुद्धिमत्ता पर लेखों के लेखक। विभिन्न एआई सम्मेलनों और तकनीकी वार्ताओं में वक्ता।

यूनाइट.एआई

जटिल इंजीनियरिंग ड्राइंग के लिए ओसीआर का उपयोग करना

विचारक नेता

जटिल इंजीनियरिंग ड्राइंग के लिए ओसीआर का उपयोग करना

विषय - सूची

इंजीनियरिंग ड्राइंग पहचान की चुनौतियाँ

पूर्व-प्रशिक्षित और कस्टम ओसीआर मॉडल

पूर्व-प्रशिक्षित ओसीआर उपकरण

कस्टम ओसीआर समाधान

इंजीनियरिंग चित्र पढ़ने के लिए ओसीआर मॉड्यूल लागू करने की प्रक्रिया

लपेटकर

यूनाइट.एआई

जटिल इंजीनियरिंग ड्राइंग के लिए ओसीआर का उपयोग करना

विषय - सूची

इंजीनियरिंग ड्राइंग पहचान की चुनौतियाँ

पूर्व-प्रशिक्षित और कस्टम ओसीआर मॉडल

पूर्व-प्रशिक्षित ओसीआर उपकरण

कस्टम ओसीआर समाधान

इंजीनियरिंग चित्र पढ़ने के लिए ओसीआर मॉड्यूल लागू करने की प्रक्रिया

लपेटकर

शायद तुम पसंद करोगे