מנהיגי מחשבה

שימוש ב-OCR עבור שרטוטים הנדסיים מורכבים

יצא לאור

לפני 8 חודשים

ספטמבר 14, 2023

זיהוי תווים אופטי (OCR) חולל מהפכה באופן שבו עסקים עושים אוטומציה של עיבוד מסמכים. עם זאת, האיכות והדיוק של הטכנולוגיה לא חותכים אותה לכל יישום. ככל שהמסמך המעובד מורכב יותר, כך הוא הופך פחות מדויק. זה נכון במיוחד עבור שרטוטים הנדסיים. למרות שטכנולוגיות OCR מחוץ לקופסה לא יתאימו למשימה זו, יש דרכים אחרות להשיג את יעדי עיבוד המסמכים שלך עם OCR. בהמשך, אבדוק מספר פתרונות מעשיים כדי לתת לך מושג כללי מבלי להיכנס ליותר מדי פרטים טכניים.

אתגרים של זיהוי ציור הנדסי

כשזה מגיע לשרטוטים טכניים, OCR מתקשה להבין את המשמעות של רכיבי טקסט בודדים. הטכנולוגיה יכולה לקרוא את הטקסט, אבל היא לא מבינה את משמעותו. ישנן מספר הזדמנויות למהנדסים ויצרנים לשקול אם הזיהוי האוטומטי של המסמך הטכני מוגדר כהלכה. ראה את המשמעותי שבהם להלן.

מקור תמונה: מובידיב

כדי להשיג ניתוח תיעוד טכני מורכב, מהנדסים צריכים להכשיר מודלים של AI. בדיוק כמו בני אדם, מודלים של AI זקוקים לניסיון והכשרה כדי להבין את השרטוטים האלה.

אחד האתגרים של זיהוי שרטוטים ושרטוטים הנדסיים הוא שהתוכנה חייבת להבין כיצד להפריד בין התצוגות השונות של השרטוט. אלו הם חלקים שונים של הציור שנותנים מושג בסיסי על הפריסה שלו. על ידי הפרדת התצוגות והבנת האופן שבו הן קשורות זו לזו, התוכנה יכולה לחשב את התיבה התוחמת.

תהליך זה עשוי לכלול מספר אתגרים:

ייתכן שהצפיות חופפות
המראות עלולים להינזק
התוויות עשויות להיות במרחק שווה לשתי תצוגות
ייתכן שתצוגות מקוננות

הקשר בין השקפות הוא נושא אפשרי נוסף. עליך לשקול אם הנוף הוא חלק שטוח מהדיאגרמה, חלק הפוך, גוש או משהו אחר. בנוסף, עשויות להיות בעיות אחרות כמו מדדים משורשרים, הערות חסרות, גבהים מוגדרים באופן מרומז באמצעות התייחסות לתקן, או בעיות אחרות.

חשוב לציין, OCR גנרי אינו יכול להבין בצורה מהימנה טקסט בציורים המוקפים באלמנטים גרפיים כמו קווים, סמלים והערות. בגלל עובדה זו, עלינו לצלול לעומק OCR עם למידת מכונה מה שיעזור יותר עבור יישום זה.

דגמי OCR מאומנים מראש ומותאמים אישית

לא חסרות תוכנות OCR בשוק, אבל לא כל התוכנה הזו ניתנת לאימון או שינוי על ידי המשתמש. כפי שלמדנו, הכשרה עשויה להיות הכרח לניתוח השרטוטים ההנדסיים שלך. עם זאת, כלי OCR עבור ציורים מסוג זה אכן קיימים.

כלי OCR מאומנים מראש

להלן כמה אפשרויות נפוצות לזיהוי OCR של שרטוטים הנדסיים:

ABBYY FineReader: תוכנת פרשנות תוכנית רב-תכליתית זו מציעה טכנולוגיית OCR עם יכולות זיהוי של טקסט. הוא תומך בפורמטים שונים של תמונה, שימור פריסה, ייצוא נתונים ואינטגרציות.
Adobe Acrobat Pro: בנוסף לאספקת עריכה, צפייה וניהול PDF, Acrobat מאפשרת לך לסרוק מסמכי OCR ושרטוטים, לחלץ טקסט ולבצע חיפושים. הוא תומך בשפות שונות ומאפשר למשתמשים להגדיר אפשרויות.
Bluebeam Revu: יישום PDF פופולרי נוסף, Bluebeam Revu מציע טכנולוגיות OCR לחילוץ טקסט ציור הנדסי.
Contains סיפור you המייצג Computer Aided Design, AutoCAD תומך בתוספים של OCR לפירוש שרטוטים והמרתם לרכיבי CAD הניתנים לעריכה.
PlanGrid: תוכנה זו כוללת פרשנות של OCR בתוכנית מהקופסה. עם תכונה זו, אתה יכול להעלות תמונות שרטוט ולאחר מכן לחלץ, לארגן, להוסיף לאינדקס ולחפש את הטקסט.
טקסט: תכונת AWS מבוססת ענן זו מאפשרת ניתוח OCR של מסמכים ויכולה לחלץ אלמנטים כמו טבלאות ממסמכים. זה גם יכול לזהות אלמנטים משרטוטים ומספק ממשקי API לשילוב עם יישומים אחרים.
Butler OCR: מספק למפתחים ממשקי API לחילוץ מסמכים, Butler OCR משלב למידת מכונה עם סקירה אנושית כדי לשפר את הדיוק של זיהוי מסמכים.

פתרונות OCR מותאמים אישית

אם אתה מחפש פתרונות OCR מותאמים אישית שניתן לאמן כדי להשיג חילוץ נתונים אוטומטי טוב יותר משרטוטים הנדסיים ולאמץ אותם לפורמט הנתונים הספציפי שלך, הנה כמה אפשרויות פופולריות:

טרטרקט: ניתן לאמן את מנוע ה-OCR הגמיש הזה, בקוד פתוח, המתוחזק על ידי Google על נתונים מותאמים אישית כדי לזהות תווים וסמלים ספציפיים לשרטוט.
OpenCV: ניתן לשלב את ספריית ה-Computer Vision בקוד פתוח עם כלי OCR כמו Tesseract כדי לבנות פתרונות פרשנות מותאמים אישית. פונקציות עיבוד התמונה והניתוח שלו יכולות לשפר את הדיוק של OCR בשרטוטים הנדסיים כאשר משתמשים בהם כראוי.

מלבד הכלים הללו, אפשר גם לפתח באופן עצמאי מודלים של למידת מכונה מותאמים אישית. על ידי שימוש במודלים של הדרכה על מערכי נתונים מסומנים, מסגרות כמו TensorFlow או PyTorch, ניתן לכוונן פתרונות אלה כדי לזהות רכיבי תוכנית ספציפיים ולהשיג דיוק גבוה יותר לצרכי הארגון.

מודלים שהוכשרו מראש מציעים נוחות וקלות שימוש אך עשויים שלא להיות יעילים בפענוח שרטוטים הנדסיים כמו פתרונות מותאמים אישית. פתרונות מותאמים אישית אלה דורשים גם משאבים ומומחיות נוספים לפיתוח ולתחזוקה.

פתרונות מותאמים אישית דורשים משאבים כספיים נוספים ועבודה לפיתוח. הייתי ממליץ להתחיל עם א הוכחת קונספט (PoC) לאמת יכולות טכניות ומוצר מינימלי בר-קיימא (MVP) כדי לבדוק את תפיסת השוק של הפרויקט לפני השקעה גדולה מדי בפתרון OCR מותאם אישית.

תהליך הטמעת מודול OCR לקריאת שרטוטים הנדסיים

המקום הטוב ביותר להתחיל בבניית תוכנת OCR עבור שרטוטים הנדסיים יהיה לנתח זמין כלים בקוד פתוח. אם אתה ממצה את אפשרויות הקוד הפתוח שלך, ייתכן שתצטרך לפנות לאפשרויות קוד סגור עם שילובי API.

בניית פתרון OCR מאפס אינה מעשית מכיוון שהיא דורשת מערך נתונים עצום לאימון. זה קשה ויקר לאיסוף ודורש משאבים רבים להכשרת מודלים. ברוב המקרים, כוונון עדין של דגמים קיימים צריך להתאים לצרכים שלך.

התהליך מכאן נראה בערך כך:

שקול דרישות: אתה צריך להבין עם איזה סוג של שרטוטים הנדסיים היישום שלך צריך לעבוד ואיזה סוגים של תכונות ופונקציונליות נחוצים כדי להשיג מטרה זו.
לכידת תמונה ועיבוד מקדים: חשבו באילו מכשירים אתם מתכננים להשתמש כדי לצלם את התמונות. ייתכן שיהיה צורך בצעדי עיבוד מקדים נוספים כדי לשפר את איכות התוצאות שלך. זה עשוי לכלול חיתוך, שינוי גודל, דה-נוזה ועוד.
שילוב OCR: שקול את מנוע ה-OCR שיעבוד הכי טוב עם היישום שלך. לספריות OCR יש ממשקי API המאפשרים לאפליקציה שלך לחלץ טקסט מתמונות שצולמו. חשוב לשקול פתרונות OCR בקוד פתוח לחיסכון בעלויות. ממשקי API של צד שלישי יכולים להיות הפכפכים ביחס לתמחור לאורך זמן או לאבד תמיכה.
זיהוי ועיבוד טקסט: בשלב הבא, הגיע הזמן ליישם לוגיקה לעיבוד וזיהוי טקסט. כמה משימות אפשריות שאתה יכול לשקול להוסיף בשלב זה הן ניקוי טקסט, זיהוי שפה או כל טכניקה אחרת שיכולה לספק תוצאות ברורות יותר של זיהוי טקסט.
ממשק משתמש וניסיון: ממשק משתמש קל לשימוש עבור האפליקציה חשוב כדי שהמשתמש יוכל להשתמש בו ביעילות כדי לצלם תמונות וליזום OCR. התוצאות צריכות להיות מוצגות למשתמש בצורה קלה להבנה.
בדיקות: בדוק היטב את היישום כדי להבטיח את הדיוק והשימושיות שלו. משוב משתמשים חיוני לתהליך זה.

עטיפת Up

מול האתגרים של יצירת תוכנת OCR לשרטוטים הנדסיים מורכבים, לארגונים עומדות בפניהם מספר אפשרויות לגשת לנושא. ממגוון של מודלים שהוכשרו מראש וכלים הניתנים להתאמה אישית ליצירת פתרונות מותאמים אישית יותר, עסקים יכולים למצוא דרכים לנתח, לאינדקס ולחפש ביעילות באמצעות שרטוטים ומסמכים מורכבים אחרים. כל מה שצריך זה קצת כושר המצאה, יצירתיות וזמן כדי ליצור פתרון שיענה על הצרכים שלהם.

נושאים קשורים:OCR מנהיגי מחשבה

AI ו-AR מניעים את הביקוש לנתונים - חומרת קוד פתוח עומדת באתגר

לא לפספס

AI גנרטיבי בתעשיית הבריאות זקוק למנה של הסבר

ליובוב זטולוקינה

ראש צוות AI ב מובידב, חברת פיתוח תוכנה המסייעת לחברות ברחבי העולם לחדש עם טכנולוגיות מתקדמות כמו בינה מלאכותית, מדע נתונים, מציאות רבודה ואינטרנט של הדברים. המיקוד המקצועי שלה הוא ניתוח נתונים, חיזוי, NLP וצ'אט בוטים. מחבר מאמרים על בינה מלאכותית עבור AiiotTalk, Hackernoon, DevTo. דובר בכנסים שונים של AI והרצאות טכנולוגיות.

Unite.AI

שימוש ב-OCR עבור שרטוטים הנדסיים מורכבים

מנהיגי מחשבה

שימוש ב-OCR עבור שרטוטים הנדסיים מורכבים

תוכן העניינים

אתגרים של זיהוי ציור הנדסי

דגמי OCR מאומנים מראש ומותאמים אישית

כלי OCR מאומנים מראש

פתרונות OCR מותאמים אישית

תהליך הטמעת מודול OCR לקריאת שרטוטים הנדסיים

עטיפת Up

Unite.AI

שימוש ב-OCR עבור שרטוטים הנדסיים מורכבים

תוכן העניינים

אתגרים של זיהוי ציור הנדסי

דגמי OCR מאומנים מראש ומותאמים אישית

כלי OCR מאומנים מראש

פתרונות OCR מותאמים אישית

תהליך הטמעת מודול OCR לקריאת שרטוטים הנדסיים

עטיפת Up

אתה עשוי לאהוב