قادة الفكر
استخدام OCR للرسومات الهندسية المعقدة

يُعد التعرف الضوئي على الحروف (OCR) ثورة في طريقة عمل الشركات فيما يتعلق بالت 자동ية لمعالجة المستندات. ومع ذلك ، لا تصل جودة ودقة التكنولوجيا إلى كل التطبيقات. وكلما كانت الوثيقة المعالجة أكثر تعقيدا ، كانت أقل دقة. هذا尤حيى صحيح للرسومات الهندسية. على الرغم من أن تقنيات OCR الجاهزة قد لا تكون مناسبة لهذه المهمة ، إلا أنه هناك طرق أخرى لتحقيق أهداف معالجة المستندات الخاصة بك مع OCR. في ما يلي ، سأستكشف عدة حلول قابلة للتطبيق لإعطائك فكرة عامة دون الخوض في تفاصيل تقنية quáมากا.
تحديات التعرف على الرسومات الهندسية
عندما يتعلق الأمر بالرسومات الفنية ، يجد التعرف الضوئي على الحروف صعوبة في فهم معنى عناصر النص الفردية. يمكن للتكنولوجيا قراءة النص ، ولكنها لا تفهم معناه. هناك العديد من الفرص للمهندسين والمنتجين للنظر فيها إذا تم تكوين التعرف التلقائي على المستند الفني بشكل صحيح. انظر أهمها أدناه.

مصدر الصورة: Mobidev
Để تحقيق تحليل المستندات الفنية المعقدة ، يحتاج المهندسون إلى تدريب نماذج الذكاء الاصطناعي. مثل البشر ، تحتاج نماذج الذكاء الاصطناعي إلى الخبرة والتدريب لفهم هذه الرسومات.
واحدة من تحديات التعرف على الرسومات الهندسية والرسومات الفنية هي أن البرنامج يجب أن يفهم كيفية فصل مختلف وجهات نظر الرسم. هذه هي أجزاء مختلفة من الرسم التي تعطي فكرة أساسية عن تخطيطها. من خلال فصل وجهات النظر وفهم كيفية علاقتها ببعضها البعض ، يمكن للبرنامج حساب مربع الحدود.
قد يتضمن هذا العملية عدة تحديات:
- قد تتداخل وجهات النظر
- قد تكون وجهات النظر تالفة
- قد تكون العلامات على مسافة متساوية من وجهتي نظر
- قد تكون وجهات النظر متداخلة
علاقة وجهات النظر هي مشكلة أخرى محتملة. يجب أن تضع في الاعتبار ما إذا كانت وجهة النظر جزءًا مسطحًا من الرسم ، أو جزءًا معوجًا ، أو كتلة ، أو شيء آخر. بالإضافة إلى ذلك ، قد تكون هناك مشاكل أخرى مثل القياسات المتسلسلة ، والتعليقات الناقصة ، والارتفاعات المحددة بشكل ضمني من خلال الإشارة إلى معيار ، أو مشاكل أخرى.
من المهم ، لا يمكن للتعرف الضوئي على الحروف الجeneric فهم النص في الرسومات المحيطة بعناصر رسومية مثل الخطوط والرموز والتعليقات. بسبب هذا الحقيقة ، يجب علينا أن نغوص أعمق في OCR مع التعلم الآلي الذي سيكون أكثر فائدة لهذا التطبيق.
نماذج OCR المسبقة والمتخصصة
لا يوجد نقص في برامج OCR في السوق ، ولكن ليس كل هذه البرامج يمكن تدريبها أو تعديلها من قبل المستخدم. كما تعلمنا ، قد يكون التدريب ضروريًا لتحليل رسوماتك الهندسية. ومع ذلك ، توجد أدوات OCR لرسومات هذه الأنواع.
أدوات OCR المسبقة
هنا بعض الخيارات الشائعة لتعرف OCR على الرسومات الهندسية:
- ABBYY FineReader: هذا البرنامج المتنوع لتعريف الرسومات الفنية يقدم تقنية OCR مع قدرات التعرف على النص. يدعم تنسيقات الصور المختلفة ، وضبط التصميم ، وتصدير البيانات ، والدمج.
- Adobe Acrobat Pro: بالإضافة إلى توفير تحرير PDF وتصفحه وإدارته ، يسمح Acrobat بفحص مستندات OCR ورسومات فنية ، واستخراج النص ، والبحث. يدعم لغات متعددة ويسمح للمستخدمين بتكوين الخيارات.
- Bluebeam Revu: تطبيق PDF شائع آخر ، يقدم Bluebeam Revu تقنيات OCR لاستخراج نص رسومات الهندسة.
- AutoCAD: ويعني التصميم بمساعدة الكمبيوتر ، يدعم AutoCAD إضافات OCR لتعريف الرسومات الفنية وتحويلها إلى عناصر CAD قابلة للتحرير.
- PlanGrid: يحتوي هذا البرنامج على تفسير OCR للرسومات الفنية خارج الصندوق. مع هذه الميزة ، يمكنك تحميل صور الرسومات الفنية ثم استخراجها ، وتنظيمها ، وفهرستها ، والبحث عنها.
- Textract: هذه الميزة السحابية من AWS تمكّن من تحليل مستندات OCR ويمكن استخراج عناصر مثل الجداول من المستندات. كما يمكنها التعرف على عناصر من الرسومات الفنية وتوفر واجهات برمجة تطبيقات للدمج مع تطبيقات أخرى.
- Butler OCR: يوفر للمطورين واجهات برمجة تطبيقات لاستخراج المستندات ، ويجمع Butler OCR بين التعلم الآلي والمراجعة البشرية لتحسين دقة التعرف على المستند.
حلل OCR المخصصة
إذا كنت تبحث عن حلول OCR المخصصة التي يمكن تدريبها لتحقيق استخراج بيانات تلقائي أفضل من رسومات الهندسة وتكييفها مع تنسيق بياناتك المحدد ، هنا بعض الخيارات الشائعة:
- Tesseract: يمكن تدريب هذا المحرك OCR المرن والمفتوح المصدر الذي يديره Google على بيانات مخصصة لتعرف حروف ورموز رسومات الهندسة.
- OpenCV: يمكن دمج مكتبة الرؤية الحاسوبية المفتوحة مع أدوات OCR مثل Tesseract لإنشاء حلول تفسيرية مخصصة. يمكن أن تعزز وظائف معالجة الصور وتحليلها دقة OCR على رسومات الهندسة عند استخدامها بشكل صحيح.
بصرف النظر عن هذه الأدوات ، من الممكن أيضًا تطوير نماذج التعلم الآلي المخصصة بشكل مستقل. من خلال استخدام نماذج التدريب على مجموعات بيانات تم تحديدها ، يمكن أن تكون إطارات مثل TensorFlow أو PyTorch هذه الحلول أكثر دقة لتحقيق تحليل رسومات الهندسة.
نماذج مسبقة تقدم راحة وسهولة الاستخدام ولكنها قد لا تكون فعالة في تفسير رسومات الهندسة مثل الحلول المخصصة. تتطلب هذه الحلول المخصصة أيضًا موارد إضافية وخبرة لتطويرها وضمانها.
تتطلب الحلول المخصصة موارد مالية إضافية وعمل لتنميتها. أوصي بالبدء ب برهان概念 لتأكيد القدرات الفنية ومنتج قابل للتطبيق لتحقق تصور السوق لمشروعك قبل الاستثمار بشكل كبير في حل OCR مخصص.
عملية تنفيذ وحدة OCR لقراءة الرسومات الهندسية
أفضل مكان لبدء بناء برنامج OCR لرسومات الهندسة هو تحليل أدوات مفتوحة المصدر المتاحة. إذا استنفدت خيارات مفتوحة المصدر ، قد تحتاج إلى اللجوء إلى خيارات مغلقة المصدر مع دمج واجهات برمجة التطبيقات.
بناء حل OCR من الصفر غير عملي لأنها تتطلب مجموعة بيانات ضخمة للتدريب. هذا صعب ومكلف للحصول عليه ويتطلب الكثير من الموارد لتدريب النموذج. في معظم الحالات ، يجب أن يكون تعديل النماذج الحالية كافياً لاحتياجاتك.
ال عملية من هنا تبدو هكذا:
- النظر في المتطلبات: تحتاج إلى فهم نوع الرسومات الهندسية التي يجب أن تعمل معها تطبيقك وما هي الميزات والوظائف المطلوبة لتحقيق ذلك الهدف.
- التقاط الصور ومعالجتها المسبقة: فكر في ما هي الأجهزة التي تخطط لاستخدامها لالتقاط الصور. قد تكون هناك خطوات معالجة مسبقة إضافية مطلوبة لتحسين جودة نتائجك. قد تتضمن هذه الخطوات قص الصور ، وتغيير حجمها ، وإزالة الضوضاء ، والمزيد.
- تكامل OCR: فكر في محرك OCR الذي سيعمل بشكل أفضل مع تطبيقك. تحتوي مكتبات OCR على واجهات برمجة تطبيقات تتيح لتطبيقك استخراج النص من الصور الملتقطة. من المهم النظر في حلول OCR مفتوحة المصدر لتوفير التكاليف. يمكن لواجهات برمجة التطبيقات الخاصة بالجهات الثالثة أن تكون غير متوقعة فيما يتعلق بالتسعير بمرور الوقت أو فقدان الدعم.
- التعرف على النص ومعالجته: بعد ذلك ، حان الوقت لتنفيذ المنطق لمعالجة النص والتعرف عليه. بعض المهام الممكنة التي قد تفكر في إضافتها في هذه الخطوة هي تنظيف النص ، أو التعرف على اللغة ، أو أي تقنيات أخرى يمكن أن توفر نتائج تعرف أكثر وضوحًا.
- واجهة المستخدم وخبرتها: واجهة مستخدم سهلة الاستخدام للتطبيق مهمة حتى يتمكن المستخدم من استخدامها بشكل فعال لالتقاط الصور وتشغيل OCR. يجب تقديم النتائج إلى المستخدم بطريقة سهلة الفهم.
- الاختبار: اختبار التطبيق بشكل شامل لضمان دقته وسهولة استخدامه. ملاحظات المستخدم ضرورية لهذا العملية.
الختام
في مواجهة تحديات إنشاء برنامج OCR لرسومات الهندسة المعقدة ، لدى المنظمات عدد من الخيارات المتاحة لهم لمواجهة هذه القضية. من مجموعة من النماذج المسبقة والأدوات القابلة للتخصيص لإنشاء حلول أكثر شخصنة ، يمكن للشركات أن تجد طرقًا لفهرسة وتصفية المستندات المعقدة بشكل فعال. كل ما يلزم هو بعض الابتكار والإبداع والوقت لصياغة حل يلبي احتياجاتهم.












