Yapay Zekâ
DocLang, AI Hazırlıklı Belgeler için Evrensel Dil Olmaya Çalışıyor

Onlarca yıldır, şirketler insan okuyucular için tasarlanmış belge formatlarına güvenmektedir. Sözleşmeler, faturalar, raporlar, sunular, formlar ve sayısız diğer iş belgeleri değerli bilgiler içerir, ancak bu bilgileri AI uygulamaları için çıkarmak genellikle karmaşık işleme hatlarına neden olur ve maliyet, gecikme ve hata olasılığını artırır.
Şirketler giderek daha fazla AI ajanları ve otonom ajanları dağıttıkça, bu kopukluk büyüyen bir zorluk haline geldi. Bunu ele almak için ABBYY, IBM, NVIDIA, Red Hat, HumanSignal ve Linux Foundation’un LF AI & Data Foundation ile birlikte DocLang adlı yeni bir açık standart başlatmıştır. Bu, belgeleri AI sistemleri için optimize edilmiş bir formatta temsil etmek amacıyla tasarlanmıştır. Girişimin destekçileri, bunun HTML’nin web içeriğinin standardizasyonuna benzer bir rol oynayabileceğine inanıyorlar ve AI sistemlerinin belgeleri daha tutarlı ve verimli bir şekilde anlamalarına olanak tanıyan ortak bir dil oluşturabileceğine inanıyorlar.
Belgelerin AI Sorunu Nedeni
Dünya’nın meisten iş bilgisi, PDF’ler, taranmış görüntüler, elektronik tablolar ve sunular gibi formatlarda bulunur. Bu formatlar insan tüketimi için iyi çalışır, ancak makinelerin anlaması için tasarlanmamıştır.
İnsanlar, anlık olarak başlıkları, tabloları, bölümler arasındaki ilişkileri ve bilgilerin belge içindeki konumuna bağlı olarak önemini tanıyabilir. AI sistemleri ise genellikle aynı içeriği güvenilir bir şekilde yorumlayabilmeleri için birden fazla katmanlı OCR, düzen analizi, belge ayrıştırma ve işlemden sonra gerektirir.
Bu zorluk, şirketlerin büyük veri koleksiyonları üzerinde akıl yürüten AI ajanlarını benimsemesi medida arttıkça daha da önemli hale gelir. Her belge, dil modelleri, alma sistemleri veya otomatik iş akışları tarafından etkili bir şekilde kullanılabilmesi için önce yapılandırılmış bir temsile dönüştürülmelidir.
Sonuç, farklı araçların genellikle kendi belge temsillerini oluşturduğu, parçalı bir ekosistemdir ve bu, uyumluluğu zorlaştırır ve tutarsızlıkların olasılığını artırır.
ABBYY’nin Vizyonu Nasıl Şekillendirdi
ABBYY, DocLang girişiminin arkasındaki ana katkıda bulunanlardan biri olarak ortaya çıktı. Şirket, belge zekası, OCR ve otomasyon teknolojileri geliştirme konusunda on yılların deneyimine sahiptir ve bu, geleneksel belgeler ve modern AI sistemleri arasındaki uçurumu kapatmaya çalışan şirketlere benzersiz bir bakış açısı sağlar.
Maxime Vermeir, ABBYY’nin AI Stratejisi Başkan Yardımcısı, DocLang fikrinin, belgeler için ortak bir temsil katmanına ihtiyaç duyulan belge AI topluluğu içindeki konuşmalardan ortaya çıktığını söyledi.
“DocLang, kurumsal AI’de temel bir sorunu çözmek üzere tasarlanmıştır: Belgeler insanlar için, makineler için değil,” diye açıkladı Vermeir.
Her AI sisteminin bağımsız olarak belge düzenlerini, tabloları, ilişkileri, meta verilerini ve yapılarını yorumlaması yerine, DocLang, paylaşılabilecek standart bir çerçeve oluşturmayı amaçlar.
Hedef, belge anlama güvenilirliğini artırmak, eksik bağlam nedeniyle oluşan sanrıları azaltmak ve aynı bilginin tekrar tekrar işlenmesiyle ilgili hesaplamalı maliyetleri azaltmaktır.
DocLang Nedir?
DocLang, belgeleri AI sistemleri için optimize edilmiş bir formatta temsil etmek üzere tasarlanmış açık bir spesifikasyondur.
Geleneksel formatların aksine, DocLang, birden fazla bilgi katmanını aynı anda korumak üzere tasarlanmıştır, bunlar arasında:
- Anlamsal anlam
- Belge yapısı ve hiyerarşisi
- Geometrik düzen ve konum
- Tablolar ve karmaşık belge öğeleri
- Meta veriler
- Yönetim ve kullanım kontrolleri
Bu yaklaşım, AI sistemlerinin belgelerdeki bilgilerin sadece ne olduğunu değil, nasıl organize edildiğini ve birbirleriyle nasıl ilişkili olduğunu da anlamalarına olanak tanır.
Örneğin, bir finansal tabloda bulunan bir değer, sadece numaradan dolayı değil, aynı zamanda çevreleyen satırlar, sütunlar, başlıklar ve bağlamsal bilgilerle olan ilişkisi nedeniyle anlam taşır. Bu ilişkileri standart bir formatta korumak, AI sistemlerinin belge içeriği hakkında daha doğru bir şekilde akıl yürütmelerine yardımcı olabilir.
DocLang, ayrıca, belgelerin nasıl kullanılacağına ilişkin politikaları belirlemelerine olanak tanıyan yönetim kontrollerini de içerir, bunlar arasında gizlilik, çıkarma ve AI modeli eğitimi ile ilgili politikalar bulunur.
HTML Karşılaştırması
Girişimin destekçileri, sık sık DocLang’i, web içeriğinin evriminde HTML’nin standardizasyonuna benzeten bir role sahip olabileceğini belirtiyorlar.
HTML yaygın olarak benimsenmeden önce, tarayıcıların içeriği tutarlı bir şekilde yorumlayabilmesi ve görüntüleyebilmesi için evrensel bir yol yoktu. HTML, web sitelerinin farklı sistemler ve platformlar arasında anlaşılabilmesi için ortak bir yapı sundu.
DocLang, kurumsal belgeler için benzer bir standardizasyon seviyesini getirmeyi amaçlar. Her AI platformunun kendi belge yorumunu geliştirmesi yerine, paylaşılan bir format, daha geniş AI ekosisteminde belge anlama için ortak bir temel oluşturabilir.
AI benimsemesi hızlandıkça, standart belge temsillerinin, modeller, uygulamalar ve otonom ajanlar arasındaki etkileşimi sağlamak için giderek daha önemli hale gelebileceğine inanıyorlar.
DocLang ve Docling Nasıl Birlikte Çalışır
Girişim, aynı zamanda Docling adlı açık kaynaklı belge işleme araç setini temel alır, bu araç seti IBM Research Zurich tarafından geliştirilmiş ve 2024 yılında açık kaynak olarak yayınlanmıştır.
Docling, belge alımı ve dönüştürme üzerine odaklanır. PDF’ler, Word belgeleri, elektronik tablolar, sunular, HTML dosyaları ve görüntüleri işleyebilir ve bunları gelişmiş düzen analizi ve belge anlama modelleri kullanarak yapılandırılmış temsilere dönüştürebilir.
DocLang, bu yeteneği tamamlar ve Docling gibi araçlar tarafından oluşturulan yapılandırılmış çıktıların temsil edilmesi ve değiştirilmesi için standardize bir format sağlar.
Bu iki proje birlikte, daha eksiksiz bir belge AI yığını oluşturur:
- Docling, alımı ve belge anlama işlemini gerçekleştirir
- DocLang, evrensel bir temsil katmanını sağlar
- AI modelleri ve ajanlar, oluşan yapılandırılmış bilgileri tüketir
Bu ayrım, parçalanmayı azaltırken, farklı satıcılar ve geliştiricilerin benimseyebileceği ortak bir çerçeve oluşturur.
Neden Açık Standartlar Kurumsal AI için Önemlidir
Şirketlerin AI dağıtımları deneyden üretime geçerken, etkileşim giderek daha önemli hale geliyor.
Şirketler genellikle tek bir AI modeline, belge platformuna veya yazılım satıcısına güvenmez. Bunun yerine, bilgiyi sistemler arasında sorunsuz bir şekilde taşımayı gerektiren karmaşık ekosistemler işletirler.
Açık standartlar, teknoloji benimsemesini kolaylaştıran ve entegrasyon karmaşıklığını ve satıcı kilidini azaltan ortak çerçeveler oluşturmak için tarihi olarak önemli bir rol oynamıştır. Kubernetes, bulut yerel altyapıyı standardize etti, HTML ise modern web’in temelini oluşturdu.
DocLang’ın destekçileri, AI yerel belge standartlarının da belge zekası ve ajans AI iş akışları için benzer bir işlevi görebileceğine inanıyorlar.
İleriye Bakış
AI endüstrisi, makinelerin tasarlanmamış belgeleri yorumlamasını öğretmek için büyük çaba sarf etti. DocLang, bu zorluğu kaynakta ele almak için bir girişimi temsil ediyor ve AI için özel olarak tasarlanmış bir belge dili oluşturmayı amaçlıyor.
Eğer başarılı olursa, girişim belge yorumlamasını iyileştirebilir, eksik yapısal bağlam nedeniyle oluşan sanrıları azaltabilir, işleme maliyetlerini düşürebilir ve AI sistemlerinin platformlar arasında bilgi alışverişini kolaylaştırabilir.
Şirketlerin AI ajanlarına iş bilgisi koleksiyonlarını gezdirmeye giderek daha fazla güvendiği bir zamanda, belgelerin nasıl temsil edildiğini standardize etmek, modelleri ilerletmek kadar önemli olabilir. ABBYY ve işbirlikçileri için DocLang, bu geleceği mümkün kılacak temeli oluşturma çabasıdır.












