Kunstig intelligens
DocLang har som mål at blive det universelle sprog for AI-klare dokumenter

I årtier har virksomheder afhængigt af dokumentformater, der er designet til menneskelige læsere snarere end AI-systemer. Kontrakter, fakturaer, rapporter, præsentationer, skemaer og utallige andre forretningsdokumenter indeholder værdifuld information, men at udtrække denne viden til AI-anvendelser kræver ofte komplekse behandlingsprocesser, der tilføjer omkostninger, latency og muligheder for fejl.
Da organisationer i stigende grad implementerer generativ AI og autonome agenter, er denne afkopling blevet en voksende udfordring. For at løse dette problem har ABBYY sluttede sig til IBM, NVIDIA, Red Hat, HumanSignal og Linux Foundation’s LF AI & Data Foundation for at lancere DocLang, en ny åben standard designet til at skabe en AI-naturlig repræsentation af dokumenter. Støtterne af initiativet mener, at det kan spille en rol lignende HTML’s standardisering af webindhold, og skabe en fælles sprog, der tillader AI-systemer at forstå dokumenter mere konsekvent og effektivt.
Hvorfor dokumenter er blevet et AI-problem
Det meste af verdens forretningskundskab findes i formater som PDF’er, scannede billeder, regneark og præsentationer. Selvom disse formater fungerer godt for menneskelig forbrug, var de aldrig designet til maskinforståelse.
Mennesker kan øjeblikkeligt genkende overskrifter, tabeller, relationer mellem sektioner og betydningen af information baseret på dens placering i et dokument. AI-systemer kræver ofte multiple lag af OCR, layoutanalyse, dokument parsing og efterbehandling, før de kan pålideligt fortolke det samme indhold.
Denne udfordring bliver endnu mere betydelig, da organisationer adopterer AI-agenter, der kan resonere over store samlinger af virksomhedsdata. Hvert dokument skal først omformes til en struktureret repræsentation, før det kan bruges effektivt af sprogmodeller, opbevaringssystemer eller automatiserede arbejdsgange.
Resultatet er et fragmenteret økosystem, hvor forskellige værktøjer ofte skaber deres egne dokumentrepræsentationer, hvilket gør interoperabilitet svær og øger sandsynligheden for inkonsistenser.
Hvordan ABBYY hjalp med at forme visionen
ABBYY er blevet en af de nøglebidragydere bag DocLang-initiativet. Selskabet har brugt årtier på at udvikle dokumentintelligens, OCR og automatiseringsteknologier, hvilket giver det en unik perspektiv på de udfordringer, virksomheder står overfor, når de forsøger at brobygge mellem traditionelle dokumenter og moderne AI-systemer.
Ifølge Maxime Vermeir, Vice President of AI Strategy at ABBYY, voksede idéen til DocLang frem af samtaler inden for dokument-AI-fællesskabet om behovet for et fælles repræsentationslag, der kunne sidde mellem rå dokumenter og AI-anvendelser.
“DocLang er designet til at løse et af de grundlæggende problemer i virksomheds-AI: Dokumenter er bygget til mennesker, ikke maskiner,” forklarede Vermeir.
I stedet for at tvinge hvert AI-system til at uafhængigt fortolke dokumentlayout, tabeller, relationer, metadata og struktur, søger DocLang at etablere en standardiseret ramme, der kan deles på tværs af platforme og anvendelser.
Målet er at gøre dokumentforståelse mere pålidelig, reducere hallucinationer forårsaget af manglende kontekst og sænke de beregningsmæssige omkostninger forbundet med gentagen behandling af den samme information.
Hvad er DocLang?
DocLang er en åben specifikation for at repræsentere dokumenter i et format, der er specifikt optimeret til AI-systemer.
I modsætning til traditionelle formater, der fokuserer primært på visuel præsentation, er DocLang designet til at bevare multiple lag af information samtidig, herunder:
- semantisk betydning
- dokumentstruktur og hierarki
- geometrisk layout og placering
- tabeller og komplekse dokumentelementer
- metadata
- styring og brugsrettigheder
Denne tilgang tillader AI-systemer at forstå ikke kun, hvilken information der findes i et dokument, men også, hvordan den information er organiseret og relateret.
For eksempel bærer en værdi i en finansielt tabel betydning ikke kun på grund af tallene selv, men også på grund af dens relation til omgivende rækker, kolonner, overskrifter og kontekstuel information. At bevare disse relationer i et standardiseret format kan hjælpe AI-systemer med at resonere mere præcist om dokumentindhold.
DocLang omfatter også styringsfunktioner, der tillader organisationer at specificere, hvordan dokumentindhold må bruges, herunder politikker relateret til privatliv, udtrækning og AI-modeltræning.
HTML-sammenligningen
Støtterne af initiativet sammenligner ofte DocLang med HTML’s rolle i udviklingen af webben.
Før HTML blev bredt accepteret, var der ingen universel måde for browsere at konsekvent fortolke og vise indhold på. HTML introducerede en fælles struktur, der tillod websites at blive forstået på tværs af forskellige systemer og platforme.
DocLang søger at bringe en lignende niveau af standardisering til virksomhedsdokumenter. I stedet for at hvert AI-platform udvikler sin egen fortolkning af dokumentstruktur, kan en fælles format give en fælles grundlag for dokumentforståelse på tværs af det bredere AI-økosystem.
Da AI-adopteringshastigheden accelererer, mener tilhængere, at standardiserede dokumentrepræsentationer kan blive stadig vigtigere for at sikre interoperabilitet mellem modeller, anvendelser og autonome agenter.
Hvordan DocLang og Docling samarbejder
Initiativet bygger også på Docling, den open-source dokumentbehandlingsværktøj, der oprindeligt blev udviklet af IBM Research Zurich og udgivet som open source i 2024.
Docling fokuserer på dokumentindtagelse og omformning. Det kan behandle PDF’er, Word-dokumenter, regneark, præsentationer, HTML-filer og billeder, og omforme dem til strukturerede repræsentationer ved hjælp af avanceret layoutanalyse og dokumentforståelsesmodeller.
DocLang supplerer denne funktion ved at give en standardiseret format for at repræsentere og udveksle den strukturerede output, der genereres af værktøjer som Docling.
Sammen skaber projekterne en mere komplet dokument-AI-stak:
- Docling håndterer indtagelse og dokumentforståelse
- DocLang giver en universel repræsentationslag
- AI-modeller og -agenter forbruger den resulterende strukturerede information
Denne adskillelse hjælper med at reducere fragmentering, mens den skaber en fælles ramme, som forskellige leverandører og udviklere kan adoptere.
Hvorfor åbne standarder er vigtige for virksomheds-AI
Da virksomheds-AI-udviklinger går fra eksperimenter til produktion, bliver interoperabilitet stadig vigtigere.
Organisationer afhænger sjældent af en enkelt AI-model, dokumentplatform eller softwareleverandør. I stedet opererer de komplekse økosystemer, der kræver, at information kan flyde ubesværet mellem systemer.
Åbne standarder har historisk spillet en kritisk rolle i at muliggøre teknologiadoption ved at skabe fælles rammer, der reducerer integrationskompleksitet og leverandør-låsning. Kubernetes hjalp med at standardisere cloud-naturlig infrastruktur, mens HTML blev grundlaget for det moderne web.
DocLangs støtter mener, at AI-naturlige dokumentstandarder kan fungere på samme måde for dokumentintelligens og agentic AI-arbejdsgange.
At se fremad
AI-industrien har investeret enormt i at lære maskiner at fortolke dokumenter, der aldrig var designet til maskinforbrug. DocLang repræsenterer et forsøg på at løse denne udfordring ved at skabe et dokument-sprog, der er bygget specifikt til AI.
Hvis initiativet er succesfuldt, kan det hjælpe med at forbedre dokumentfortolkning, reducere hallucinationer forårsaget af manglende strukturrelateret kontekst, sænke behandlingsomkostninger og gøre det lettere for AI-systemer at udveksle information på tværs af platforme.
På et tidspunkt, hvor organisationer i stigende grad afhænger af AI-agenter til at navigere i store samlinger af forretningskundskab, kan standardisering af, hvordan dokumenter repræsenteres, være lige så vigtigt som at fremme modellerne selv. For ABBYY og dets samarbejdspartnere er DocLang et forsøg på at bygge grundlaget, der kan gøre denne fremtid mulig.












