никулец Користење на OCR за сложени инженерски цртежи - Unite.AI
Поврзете се со нас

Мислите лидери

Користење на OCR за сложени инженерски цртежи

mm

Објавено

 on

Оптичкото препознавање на знаци (OCR) го револуционизира начинот на кој бизнисите ја автоматизираат обработката на документите. Сепак, квалитетот и точноста на технологијата не ја намалуваат за секоја апликација. Колку е покомплексен документот што се обработува, толку е помалку точен. Ова е особено точно за инженерските цртежи. Иако вонредните технологии за OCR можеби не се соодветни за оваа задача, постојат и други начини да ги постигнете вашите цели за обработка на документи со OCR. Во продолжение, ќе истражам неколку остварливи решенија за да ви дадам општа идеја без да навлегувам во премногу технички детали.

Предизвици на инженерско препознавање на цртежи

Кога станува збор за технички цртежи, OCR се бори да го разбере значењето на поединечните текстуални елементи. Технологијата може да го чита текстот, но не го разбира неговото значење. Постојат голем број можности за инженерите и производителите да размислат дали автоматското препознавање на техничкиот документ е правилно конфигурирано. Во продолжение погледнете ги најзначајните од нив.

Извор на слика: Мобидев

За да се постигне сложена анализа на техничка документација, инженерите треба да обучуваат модели со вештачка интелигенција. Исто како и луѓето, на моделите со вештачка интелигенција им треба искуство и обука за да ги разберат овие цртежи.

Еден предизвик за препознавање на нацрти и инженерски цртежи е дека софтверот мора да разбере како да ги одвои различните погледи на цртежот. Ова се различни делови од цртежот кои даваат основна идеја за неговиот распоред. Со раздвојување на погледите и разбирање како тие се поврзани еден со друг, софтверот може да го пресмета граничното поле.

Овој процес може да вклучува неколку предизвици:

  • Прегледите може да се преклопуваат
  • Погледите може да бидат оштетени
  • Етикетите може да бидат подеднакво оддалечени до два прикази
  • Погледите може да се вгнездени

Односот меѓу ставовите е уште едно можно прашање. Мора да размислите дали приказот е рамен дел од дијаграмот, свртен дел, блок или нешто друго. Дополнително, може да има и други проблеми како што се оковани мерки, недостасуваат прибелешки, имплицитно дефинирани висини преку повикување на стандард или други проблеми.

Поважно е дека генеричкиот OCR не може со сигурност да го разбере текстот во цртежите што е опкружен со графички елементи како линии, симболи и прибелешки. Поради овој факт, треба да се нурнеме подлабоко OCR со машинско учење што ќе биде покорисно за оваа апликација.

Претходно обучени и прилагодени OCR модели

На пазарот нема недостиг од софтвер за OCR, но не може целиот овој софтвер да биде обучен или модифициран од страна на корисникот. Како што научивме, обуката може да биде неопходност за анализа на вашите инженерски цртежи. Сепак, OCR алатки за овие видови цртежи постојат.

Претходно обучени алатки за OCR

Еве неколку вообичаени опции за OCR препознавање на инженерски цртежи:

  • ABBYY FineReader: овој разновиден софтвер за интерпретација на нацрти нуди OCR технологија со можности за препознавање текст. Поддржува различни формати на слики, задржување на распоред, извоз на податоци и интеграции.
  • Adobe Acrobat Pro: покрај обезбедувањето уредување, прегледување и управување со PDF, Acrobat ви овозможува да скенирате OCR документи и нацрти, да извлекувате текст и да вршите пребарувања. Поддржува различни јазици и им овозможува на корисниците да ги конфигурираат опциите.
  • Bluebeam Revu: уште една популарна PDF апликација, Bluebeam Revu нуди OCR технологии за инженерско цртање текст за екстракција.
  • AutoCAD: претставувајќи го Computer Aided Design, AutoCAD поддржува OCR приклучоци за толкување на нацрти и нивно претворање во CAD елементи што може да се уредуваат.
  • PlanGrid: овој софтвер вклучува план за интерпретација на OCR надвор од кутијата. Со оваа одлика, можете да прикачувате слики со нацрт, а потоа да го извлекувате, организирате, индексирате и пребарувате текстот.
  • Текст: оваа функција AWS базирана на облак овозможува OCR анализа на документи и може да извлече елементи како табели од документите. Исто така, може да препознава елементи од нацрти и обезбедува API за интеграција со други апликации.
  • Butler OCR: обезбедувајќи им на програмерите API за извлекување документи, Butler OCR комбинира машинско учење со човечки преглед за да ја подобри точноста на препознавањето документи.

Прилагодени решенија за OCR

Ако барате сопствени решенија за OCR што може да се обучат за да постигнете подобро автоматско извлекување податоци од инженерски цртежи и да ги присвоите во вашиот специфичен формат на податоци, еве неколку популарни опции:

  • Tesseract: овој флексибилен OCR-мотор со отворен код кој го одржува Google може да се обучи за приспособени податоци за да препознава знаци и симболи специфични за планот.
  • OpenCV: Библиотеката за компјутерска визија со отворен извор може да се комбинира со алатки за OCR како Tesseract за да се изградат сопствени интерпретативни решенија. Неговите функции за обработка и анализа на слики можат да ја подобрат точноста на OCR на инженерските цртежи кога се правилно искористени.

Освен овие алатки, можно е и независно развивање на сопствени модели за машинско учење. Со користење на модели за обука на означени збирки на податоци, рамки како TensorFlow или PyTorch, овие решенија може да се дотераат за да препознаат специфични елементи на планот и да постигнат поголема точност за потребите на организацијата.

Претходно обучените модели нудат практичност и леснотија на користење, но можеби нема да бидат толку ефикасни во толкувањето на инженерските цртежи како сопствените решенија. Овие сопствени решенија бараат и дополнителни ресурси и експертиза за развивање и одржување.

Прилагодените решенија бараат дополнителни финансиски ресурси и работна сила за да се развијат. Би препорачал да се започне со а доказ за концепт (PoC) да ги потврди техничките способности и минималниот остварлив производ (MVP) за да ја провери перцепцијата на пазарот за проектот пред да инвестира премногу во приспособено OCR решение.

Процесот на имплементација на OCR модул за читање инженерски цртежи

Најдоброто место за започнување со изградба на софтвер за OCR за инженерски цртежи би било да се анализираат достапните алатки со отворен код. Ако ги исцрпите опциите со отворен код, можеби ќе треба да се свртите кон опциите со затворен извор со интеграции на API.

Да се ​​изгради решение за OCR од нула е непрактично бидејќи бара огромна база на податоци за обука. Ова е тешко и скапо да се собере и бара многу ресурси за обука на модели. Во повеќето случаи, дотерувањето на постоечките модели треба да одговара на вашите потреби.

Процесот од тука изгледа отприлика вака:

  1. Размислете за барањата: треба да разберете со какви инженерски цртежи треба да работи вашата апликација и какви карактеристики и функционалности се потребни за да се постигне таа цел.
  2. Снимање и претходна обработка на слики: размислете кои уреди планирате да ги користите за снимање на сликите. Можеби ќе бидат потребни дополнителни чекори за претходна обработка за да се подобри квалитетот на вашите резултати. Ова може да вклучува отсекување, промена на големината, отстранување на звук и многу повеќе.
  3. OCR интеграција: земете го предвид моторот OCR кој најдобро ќе работи со вашата апликација. OCR библиотеките имаат API кои овозможуваат вашата апликација да извлекува текст од снимените слики. Важно е да се разгледаат решенијата за OCR со отворен код за да се заштедат трошоци. API-ите на трети лица може да бидат непостојани во однос на цените со текот на времето или да ја изгубат поддршката.
  4. Препознавање и обработка на текст: следно, време е да се имплементира логиката за обработка и препознавање на текстот. Некои можни задачи што може да размислите да ги додадете во овој чекор се чистење текст, препознавање јазик или која било друга техника што може да обезбеди појасни резултати за препознавање текст.
  5. Кориснички интерфејс и искуство: лесен за користење интерфејс за апликацијата е важен за да може корисникот ефективно да го користи за да снима слики и да иницира OCR. Резултатите треба да му бидат претставени на корисникот на начин кој е лесен за разбирање.
  6. Тестирање: темелно тестирајте ја апликацијата за да ја осигурате нејзината точност и употребливост. Повратните информации од корисниците се од суштинско значење за овој процес.

Завршувајќи

Соочени со предизвиците за креирање на софтвер за OCR за сложени инженерски цртежи, организациите имаат на располагање голем број опции за пристап до проблемот. Од низа претходно обучени модели и приспособливи алатки за создавање поперсонализирани решенија, бизнисите можат да најдат начини за ефективно анализирање, индексирање и пребарување низ нацрти и други сложени документи. Сè што е потребно е малку генијалност, креативност и време за да се создаде решение кое ги задоволува нивните потреби.

Водач на тимот за вештачка интелигенција на МобиДев, компанија за развој на софтвер која им помага на компаниите ширум светот да иновираат со најсовремените технологии како што се вештачката интелигенција, науката за податоци, проширената реалност и Интернетот на нештата. Нејзиниот професионален фокус е анализа на податоци, прогнозирање, НЛП и чет-ботови. Автор на написи за вештачка интелигенција за AiiotTalk, Hackernoon, DevTo. Говорник на различни конференции за вештачка интелигенција и разговори за технологија.