škrbina Korištenje OCR-a za složene inženjerske crteže - Unite.AI
Povežite se s nama

Vođe misli

Korištenje OCR-a za složene inženjerske crteže

mm

Objavljeno

 on

Optičko prepoznavanje znakova (OCR) revolucioniralo je način na koji tvrtke automatiziraju obradu dokumenata. Međutim, kvaliteta i točnost tehnologije ne odgovaraju svakoj primjeni. Što je dokument koji se obrađuje složeniji, to postaje manje točan. Ovo posebno vrijedi za inženjerske crteže. Iako OCR tehnologije izvan okvira možda nisu prikladne za ovaj zadatak, postoje drugi načini za postizanje vaših ciljeva obrade dokumenata s OCR-om. U onome što slijedi, istražit ću nekoliko održivih rješenja kako bih vam dao opću ideju bez odlaska u previše tehničkih detalja.

Izazovi prepoznavanja inženjerskih crteža

Kada je riječ o tehničkim crtežima, OCR se bori da razumije značenje pojedinačnih elemenata teksta. Tehnologija može čitati tekst, ali ne razumije njegovo značenje. Postoje brojne mogućnosti koje inženjeri i proizvođači mogu razmotriti je li automatsko prepoznavanje tehničkog dokumenta ispravno konfigurirano. U nastavku pogledajte najznačajnije od njih.

Izvor slike: Mobidev

Kako bi se postigla složena analiza tehničke dokumentacije, inženjeri trebaju obučiti AI modele. Baš kao i ljudi, AI modeli trebaju iskustvo i obuku za razumijevanje ovih crteža.

Jedan od izazova prepoznavanja nacrta i inženjerskih crteža je da softver mora razumjeti kako razdvojiti različite poglede na crtež. To su različiti dijelovi crteža koji daju osnovnu ideju o njegovom izgledu. Odvajanjem pogleda i razumijevanjem načina na koji su povezani jedan s drugim, softver može izračunati granični okvir.

Ovaj proces može uključivati ​​nekoliko izazova:

  • Prikazi se mogu preklapati
  • Prikazi mogu biti oštećeni
  • Oznake mogu biti jednako udaljene od dva prikaza
  • Pogledi mogu biti ugniježđeni

Odnos između pogleda još je jedno moguće pitanje. Morate razmotriti je li pogled ravni dio dijagrama, okrenuti dio, blok ili nešto treće. Osim toga, mogu postojati i drugi problemi kao što su ulančane mjere, nedostajuće zabilješke, implicitno definirane visine kroz referencu na standard ili drugi problemi.

Važno je da generički OCR ne može pouzdano razumjeti tekst u crtežima koji je okružen grafičkim elementima poput linija, simbola i komentara. Zbog te činjenice moramo dublje zaroniti OCR sa strojnim učenjem što će biti od veće pomoći za ovu aplikaciju.

Unaprijed obučeni i prilagođeni OCR modeli

Na tržištu nema manjka softvera za OCR, ali korisnik ne može sav taj softver obučiti ili modificirati. Kao što smo saznali, obuka može biti nužna za analizu vaših inženjerskih crteža. Međutim, alati za OCR za takve vrste crteža postoje.

Prethodno obučeni OCR alati

Evo nekoliko uobičajenih opcija za OCR prepoznavanje inženjerskih crteža:

  • ABBYY FineReader: ovaj svestrani softver za tumačenje nacrta nudi OCR tehnologiju s mogućnostima prepoznavanja teksta. Podržava različite formate slika, zadržavanje izgleda, izvoz podataka i integracije.
  • Adobe Acrobat Pro: uz mogućnost uređivanja, pregledavanja i upravljanja PDF-om, Acrobat vam omogućuje skeniranje OCR dokumenata i nacrta, izdvajanje teksta i izvođenje pretraživanja. Podržava različite jezike i omogućuje korisnicima da konfiguriraju opcije.
  • Bluebeam Revu: Još jedna popularna PDF aplikacija, Bluebeam Revu nudi OCR tehnologije za izdvajanje teksta inženjerskih crteža.
  • AutoCAD: označavajući Computer Aided Design, AutoCAD podržava OCR dodatke za tumačenje nacrta i njihovo pretvaranje u CAD elemente koji se mogu uređivati.
  • PlanGrid: ovaj softver uključuje tumačenje nacrta OCR-a odmah po otvaranju. Pomoću ove značajke možete učitati slike nacrta, a zatim izdvajati, organizirati, indeksirati i pretraživati ​​tekst.
  • Tekst: ova AWS značajka temeljena na oblaku omogućuje OCR analizu dokumenata i može izdvojiti elemente poput tablica iz dokumenata. Također može prepoznati elemente iz nacrta i pruža API-je za integraciju s drugim aplikacijama.
  • Butler OCR: pružajući programerima API-je za ekstrakciju dokumenata, Butler OCR kombinira strojno učenje s ljudskim pregledom kako bi poboljšao točnost prepoznavanja dokumenata.

Prilagođena OCR rješenja

Ako ste u potrazi za prilagođenim OCR rješenjima koja se mogu uvježbati za postizanje boljeg automatskog izdvajanja podataka iz inženjerskih crteža i njihovo prilagođavanje vašem specifičnom formatu podataka, evo nekoliko popularnih opcija:

  • Teserakt: ovaj fleksibilni OCR mehanizam otvorenog koda koji održava Google može se uvježbati na prilagođenim podacima za prepoznavanje znakova i simbola specifičnih za plan.
  • OpenCV: Open-Source Computer Vision Library može se kombinirati s OCR alatima kao što je Tesseract za izradu prilagođenih interpretativnih rješenja. Njegove funkcije obrade i analize slike mogu poboljšati točnost OCR-a na inženjerskim crtežima kada se ispravno koriste.

Osim ovih alata, također je moguće samostalno razvijati prilagođene modele strojnog učenja. Korištenjem modela obuke na označenim skupovima podataka, okvirima kao što su TensorFlow ili PyTorch, ova se rješenja mogu fino podesiti za prepoznavanje specifičnih elemenata nacrta i postizanje veće točnosti za potrebe organizacije.

Unaprijed obučeni modeli nude praktičnost i jednostavnost korištenja, ali možda neće biti tako učinkoviti u tumačenju inženjerskih crteža kao prilagođena rješenja. Ova prilagođena rješenja također zahtijevaju dodatne resurse i stručnost za razvoj i održavanje.

Prilagođena rješenja zahtijevaju dodatna financijska sredstva i rad za razvoj. Preporučio bih da počnete s a dokaz koncepta (PoC) za provjeru tehničkih mogućnosti i minimalno održivog proizvoda (MVP) za provjeru tržišne percepcije projekta prije prevelikog ulaganja u prilagođeno OCR rješenje.

Proces implementacije OCR modula za čitanje tehničkih crteža

Najbolje mjesto za početak izgradnje OCR softvera za inženjerske crteže bila bi analiza dostupnih alati otvorenog koda. Ako iscrpite svoje opcije otvorenog koda, možda ćete se morati okrenuti opcijama zatvorenog koda s API integracijama.

Izrada OCR rješenja od nule je nepraktična jer zahtijeva ogroman skup podataka za obuku. To je teško i skupo prikupiti i zahtijeva puno resursa za obuku modela. U većini slučajeva fino podešavanje postojećih modela trebalo bi odgovarati vašim potrebama.

Proces odavde izgleda otprilike ovako:

  1. Razmotrite zahtjeve: trebate razumjeti s kakvom vrstom inženjerskih crteža vaša aplikacija treba raditi i koje su vrste značajki i funkcionalnosti potrebne za postizanje tog cilja.
  2. Snimanje i prethodna obrada slike: razmislite koje uređaje planirate koristiti za snimanje slika. Možda će biti potrebni dodatni koraci predobrade kako bi se poboljšala kvaliteta vaših rezultata. To može uključivati ​​obrezivanje, promjenu veličine, uklanjanje šuma i još mnogo toga.
  3. OCR integracija: razmotrite OCR mehanizam koji će najbolje raditi s vašom aplikacijom. OCR biblioteke imaju API-je koji vašoj aplikaciji omogućuju izdvajanje teksta iz snimljenih slika. Važno je razmotriti OCR rješenja otvorenog koda radi uštede. API-ji trećih strana mogu biti promjenjivi u pogledu cijena tijekom vremena ili mogu izgubiti podršku.
  4. Prepoznavanje i obrada teksta: sljedeće, vrijeme je za implementaciju logike za obradu i prepoznavanje teksta. Neki od mogućih zadataka koje biste mogli dodati u ovom koraku su čišćenje teksta, prepoznavanje jezika ili bilo koje druge tehnike koje mogu pružiti jasnije rezultate prepoznavanja teksta.
  5. Korisničko sučelje i iskustvo: korisničko sučelje za aplikaciju koje je jednostavno za korištenje važno je kako bi ga korisnik mogao učinkovito koristiti za snimanje slika i pokretanje OCR-a. Rezultate treba predstaviti korisniku na način koji je lako razumljiv.
  6. Ispitivanje: temeljito testirajte aplikaciju kako biste osigurali njezinu točnost i upotrebljivost. Povratne informacije korisnika bitne su za ovaj proces.

Završavajući

Suočene s izazovima stvaranja OCR softvera za složene inženjerske crteže, organizacije imaju na raspolaganju niz opcija za pristup problemu. Iz niza unaprijed obučenih modela i prilagodljivih alata za stvaranje personaliziranijih rješenja, tvrtke mogu pronaći načine za učinkovitu analizu, indeksiranje i pretraživanje kroz nacrte i druge složene dokumente. Sve što je potrebno je malo domišljatosti, kreativnosti i vremena za izradu rješenja koje zadovoljava njihove potrebe.

Voditelj AI tima na MobiDev, tvrtka za razvoj softvera koja pomaže tvrtkama diljem svijeta u inovacijama s najsuvremenijim tehnologijama kao što su umjetna inteligencija, podatkovna znanost, proširena stvarnost i Internet stvari. Njezin profesionalni fokus je analiza podataka, predviđanje, NLP i chatbotovi. Autor članaka o umjetnoj inteligenciji za AiiotTalk, Hackernoon, DevTo. Govornik na raznim AI konferencijama i tehničkim razgovorima.