stomp Gebruik OCR vir komplekse ingenieurstekeninge - Unite.AI
Verbinding met ons

Gedagte Leiers

Gebruik OCR vir komplekse ingenieurstekeninge

mm

Gepubliseer

 on

Optical Character Recognition (OCR) het die manier waarop besighede dokumentverwerking outomatiseer, 'n rewolusie verander. Die kwaliteit en akkuraatheid van die tegnologie sny dit egter nie vir elke toepassing nie. Hoe meer kompleks die dokument wat verwerk word, hoe minder akkuraat word dit. Dit geld veral vir ingenieurstekeninge. Alhoewel uit die boks OCR-tegnologie dalk nie geskik is vir hierdie taak nie, is daar ander maniere om jou dokumentverwerkingsdoelwitte met OCR te bereik. In wat volg, sal ek verskeie lewensvatbare oplossings ondersoek om jou 'n algemene idee te gee sonder om te veel tegniese besonderhede in te gaan.

Uitdagings van Ingenieurstekeningerkenning

As dit by tegniese tekeninge kom, sukkel OCR om die betekenis van individuele tekselemente te verstaan. Die tegnologie kan die teks lees, maar dit verstaan ​​nie die betekenis daarvan nie. Daar is 'n aantal geleenthede vir ingenieurs en vervaardigers om te oorweeg of die outomatiese herkenning van die tegniese dokument korrek opgestel is. Sien die belangrikste van hulle hieronder.

Beeldbron: Mobidev

Om komplekse tegniese dokumentasie-analise te bewerkstellig, moet ingenieurs KI-modelle oplei. Net soos mense het KI-modelle ondervinding en opleiding nodig om hierdie tekeninge te verstaan.

Een uitdaging van bloudrukke en ingenieurstekeninge erkenning is dat die sagteware moet verstaan ​​hoe om die verskillende aansigte van die tekening te skei. Dit is verskillende dele van die tekening wat 'n basiese idee gee van die uitleg daarvan. Deur die aansigte te skei en te verstaan ​​hoe hulle met mekaar verband hou, kan die sagteware die grenskas bereken.

Hierdie proses kan verskeie uitdagings insluit:

  • Aansigte kan oorvleuel
  • Uitsigte kan beskadig word
  • Etikette kan ewe ver van twee aansigte wees
  • Aansigte kan geneste wees

Die verhouding tussen sienings is nog 'n moontlike kwessie. Jy moet oorweeg of die aansig 'n plat deel van die diagram, 'n gedraaide deel, 'n blok of iets anders is. Daarbenewens kan daar ander probleme wees soos vasgeketting maatstawwe, ontbrekende aantekeninge, implisiet gedefinieerde hoogtes deur verwysing na 'n standaard, of ander probleme.

Wat belangrik is, generiese OCR kan nie teks in tekeninge wat omring word deur grafiese elemente soos lyne, simbole en aantekeninge betroubaar verstaan ​​nie. As gevolg van hierdie feit moet ons dieper in duik OCR met masjienleer wat meer nuttig sal wees vir hierdie toepassing.

Vooraf-opgeleide en pasgemaakte OCR-modelle

Daar is geen tekort aan OCR-sagteware op die mark nie, maar nie al hierdie sagteware kan deur die gebruiker opgelei of gewysig word nie. Soos ons geleer het, kan opleiding 'n noodsaaklikheid wees vir die ontleding van jou ingenieurstekeninge. OCR-instrumente vir hierdie soort tekeninge bestaan ​​egter.

Vooraf opgeleide OCR-instrumente

Hier is 'n paar algemene opsies vir OCR-herkenning van ingenieurstekeninge:

  • ABBYY FineReader: hierdie veelsydige bloudruk-interpretasie-sagteware bied OCR-tegnologie met herkenningsvermoëns vir teks. Dit ondersteun verskeie beeldformate, uitlegbehoud, data-uitvoer en integrasies.
  • Adobe Acrobat Pro: bykomend tot die verskaffing van PDF-redigering, besigtiging en bestuur, laat Acrobat jou toe om OCR-dokumente en bloudrukke te skandeer, teks te onttrek en soektogte uit te voer. Dit ondersteun verskeie tale en stel gebruikers in staat om opsies op te stel.
  • Bluebeam Revu: Nog 'n gewilde PDF-toepassing, Bluebeam Revu, bied OCR-tegnologieë vir ingenieurstekeninge-teksekstraksie.
  • AutoCAD: staan ​​vir Computer Aided Design, AutoCAD ondersteun OCR-inproppe vir die interpretasie van bloudrukke en die omskakeling daarvan in bewerkbare CAD-elemente.
  • PlanGrid: hierdie sagteware sluit bloudruk OCR-interpretasie uit die boks in. Met hierdie kenmerk kan jy bloudrukprente oplaai en dan die teks onttrek, organiseer, indekseer en deursoek.
  • Teksuittreksel: hierdie wolkgebaseerde AWS-funksie maak OCR-analise van dokumente moontlik en kan elemente soos tabelle uit dokumente onttrek. Dit kan ook elemente van bloudrukke herken en bied API's vir integrasie met ander toepassings.
  • Butler OCR: verskaf ontwikkelaars van dokument onttrekking API's, Butler OCR kombineer masjienleer met menslike hersiening om die akkuraatheid van dokumentherkenning te verbeter.

Pasgemaakte OCR-oplossings

As jy op soek is na pasgemaakte OCR-oplossings wat opgelei kan word om beter outomatiese data-onttrekking uit ingenieurstekeninge te verkry en dit na jou spesifieke dataformaat aan te pas, hier is 'n paar gewilde opsies:

  • Tesseract: hierdie buigsame, oopbron OCR-enjin wat deur Google in stand gehou word, kan opgelei word op persoonlike data om bloudrukspesifieke karakters en simbole te herken.
  • OpenCV: Oopbron Rekenaarvisie-biblioteek kan gekombineer word met OCR-instrumente soos Tesseract om pasgemaakte interpretatiewe oplossings te bou. Die beeldverwerking en ontledingsfunksies daarvan kan die akkuraatheid van OCR op ingenieurstekeninge verbeter wanneer dit behoorlik gebruik word.

Afgesien van hierdie gereedskap, is dit ook moontlik om selfstandig pasgemaakte masjienleermodelle te ontwikkel. Deur opleidingsmodelle op benoemde datastelle, raamwerke soos TensorFlow of PyTorch te gebruik, kan hierdie oplossings verfyn word om spesifieke bloudrukelemente te herken en hoër akkuraatheid vir die behoeftes van 'n organisasie te bereik.

Vooraf opgeleide modelle bied gerief en gebruiksgemak, maar is dalk nie so effektief om ingenieurstekeninge te interpreteer as pasgemaakte oplossings nie. Hierdie pasgemaakte oplossings vereis ook bykomende hulpbronne en kundigheid om te ontwikkel en in stand te hou.

Pasgemaakte oplossings vereis bykomende finansiële hulpbronne en arbeid om te ontwikkel. Ek sal aanbeveel om met a te begin bewys van konsep (PoC) om tegniese vermoëns en 'n minimum lewensvatbare produk (MVP) te bekragtig om die mark se persepsie van die projek na te gaan voordat daar te swaar in 'n pasgemaakte OCR-oplossing belê word.

Die proses om 'n OCR-module te implementeer vir die lees van ingenieurstekeninge

Die beste plek om te begin met die bou van OCR-sagteware vir ingenieurstekeninge sal wees om beskikbare te ontleed oopbrongereedskap. As jy jou oopbronopsies uitput, moet jy dalk na geslotebronopsies met API-integrasies wend.

Om 'n OCR-oplossing van nuuts af te bou is onprakties, want dit vereis 'n groot datastel vir opleiding. Dit is moeilik en duur om in te samel en verg baie hulpbronne vir modelopleiding. In die meeste gevalle behoort die fyninstelling van bestaande modelle by jou behoeftes te pas.

Die proses van hier af lyk iets soos volg:

  1. Oorweeg vereistes: jy moet verstaan ​​met watter soort ingenieurstekeninge jou toepassing moet werk en watter soort kenmerke en funksionaliteite nodig is om daardie doel te bereik.
  2. Beeldvaslegging en voorafverwerking: dink aan watter toestelle jy beplan om te gebruik om die beelde vas te vang. Ekstra voorverwerkingstappe mag nodig wees om die kwaliteit van jou resultate te verbeter. Dit kan uitsny, die grootte van die grootte, denoising en meer insluit.
  3. OCR-integrasie: oorweeg die OCR-enjin wat die beste met jou toepassing sal werk. OCR-biblioteke het API's wat jou toepassing toelaat om teks uit vasgelegde beelde te onttrek. Dit is belangrik om oopbron OCR-oplossings te oorweeg vir kostebesparing. Derdeparty-API's kan mettertyd wispelturig wees met betrekking tot pryse of ondersteuning verloor.
  4. Teksherkenning en verwerking: volgende is dit tyd om logika te implementeer om teks te verwerk en te herken. Sommige moontlike take wat jy kan oorweeg om in hierdie stap by te voeg, is teksopruiming, taalherkenning of enige ander tegnieke wat duideliker teksherkenningsresultate kan verskaf.
  5. Gebruikerskoppelvlak en ervaring: 'n maklik-om-te gebruik UI vir die toepassing is belangrik sodat die gebruiker dit effektief kan gebruik om beelde vas te lê en OCR te inisieer. Die resultate moet aan die gebruiker aangebied word op 'n manier wat maklik is om te verstaan.
  6. toets: toets die toepassing deeglik om die akkuraatheid en bruikbaarheid daarvan te verseker. Gebruikerterugvoer is noodsaaklik vir hierdie proses.

Wikkel

In die lig van die uitdagings om OCR-sagteware vir komplekse ingenieurstekeninge te skep, het organisasies 'n aantal opsies beskikbaar om die kwessie te benader. Van 'n reeks vooraf-opgeleide modelle en aanpasbare gereedskap om meer persoonlike oplossings te skep, kan besighede maniere vind om doeltreffend te ontleed, indekseer en deur bloudrukke en ander komplekse dokumente te soek. Al wat dit verg is 'n bietjie vindingrykheid, kreatiwiteit en tyd om 'n oplossing te skep wat aan hul behoeftes voldoen.

KI-spanleier by MobiDev, 'n sagteware-ontwikkelingsmaatskappy wat maatskappye regoor die wêreld help om te innoveer met voorpunttegnologieë soos kunsmatige intelligensie, datawetenskap, volgemaakte werklikheid en die Internet van Dinge. Haar professionele fokus is data-analise, vooruitskatting, NLP en chatbots. Skrywer van artikels oor kunsmatige intelligensie vir AiiotTalk, Hackernoon, DevTo. Spreker by verskeie KI-konferensies en tegnologiepraatjies.