Connect with us

الاستشهادات: هل يمكن لميزة أنثروبيك الجديدة حل مشكلة الثقة في الذكاء الاصطناعي؟

الذكاء الاصطناعي

الاستشهادات: هل يمكن لميزة أنثروبيك الجديدة حل مشكلة الثقة في الذكاء الاصطناعي؟

mm

لقد كانت التحقق من الذكاء الاصطناعي قضية خطيرة لفترة الآن. في حين أن النماذج اللغوية الكبيرة (LLMs) قد تقدمت بسرعة مذهلة، ظلت تحدي إثبات دقتها بدون حل.

Anthropic تحاول حل هذه المشكلة، ومن بين جميع الشركات الكبيرة للذكاء الاصطناعي، أعتقد أنها لديها أفضل فرصة.

أصدرت الشركة Citations، ميزة جديدة لنموذج Claude التي تغير كيفية التحقق من استجابات أنظمة الذكاء الاصطناعي. هذه التقنية تقسم المستندات المصدر إلى قطع قابلة للهضم وتربط كل بيان تم إنشاؤه بواسطة الذكاء الاصطناعي إلى مصدره الأصلي – مشابهة لطريقة استشهاد الأوراق الأكاديمية بمراجعها.

تحاول Citations حل واحدة من التحديات الأكثر صمودًا للذكاء الاصطناعي: إثبات أن المحتوى الذي تم إنشاؤه دقيق وموثوق. بدلاً من الحاجة إلى هندسة استفزاز معقدة أو التحقق اليدوي، تقوم النظام بمعالجة المستندات تلقائيًا وتوفر التحقق من المصدر على مستوى الجملة لكل ادعاء تقدمه.

البيانات تظهر نتائج واعدة: تحسن بنسبة 15٪ في دقة الاستشهاد مقارنة بالطرق التقليدية.

لماذا يهم هذا الآن

أصبحت ثقة الذكاء الاصطناعي الحاجز الحرج لاعتماد المؤسسات (بالإضافة إلى اعتماد الأفراد). مع انتقال المنظمات إلى ما وراء استخدام الذكاء الاصطناعي التجريبي إلى العمليات الأساسية، أدى عدم القدرة على التحقق من مخرجات الذكاء الاصطناعي بفعالية إلى خلق عرقلة كبيرة.

تظهر أنظمة التحقق الحالية مشكلة واضحة: يضطر المؤسسات إلى الاختيار بين السرعة والدقة. لا تتمتع عمليات التحقق اليدوية بالقدرة على التوسع، بينما تحمل مخرجات الذكاء الاصطناعي غير المثبتة مخاطر كبيرة. هذه التحديات حادة بشكل خاص في الصناعات المنظمة حيث الدقة ليست فقط مفضلة – بل هي مطلوبة.

تأتي مواعيد Citations في لحظة حاسمة في تطوير الذكاء الاصطناعي. مع تصبح نماذج اللغة أكثر تطورًا، نمت الحاجة إلى التحقق المدمج بشكل متناسب. намنحتاج إلى بناء أنظمة يمكن نشرها بثقة في البيئات المهنية حيث الدقة ليست قابلة للتفاوض.

تفكيك الهندسة المعمارية الفنية

سحر Citations يكمن في نهج معالجة المستندات. Citations لا تشبه الأنظمة التقليدية للذكاء الاصطناعي. عادةً ما تعامل هذه الأنظمة مع المستندات ككتل نصية بسيطة. مع Citations، تقوم الأداة بتقسيم المواد المصدر إلى ما يسميه Anthropic “chunks”. يمكن أن تكون هذه الجمل الفردية أو أقسام محددة من قبل المستخدم، مما يخلق أساسًا متعمقًا للتحقق.

هنا التفسير الفني:

معالجة المستندات ومعالجتها

تعالج Citations المستندات بشكل مختلف بناءً على تنسيقها.对于 ملفات النص، لا يوجد حد فعلي باستثناء الحد القياسي البالغ 200,000 رمز للطلعات الكلية. يشمل ذلك سياقك و الاستفزازات والمستندات نفسها.

معالجة PDF أكثر تعقيدًا. تعالج النظام ملفات PDF بصرية، وليس فقط كنص، مما يؤدي إلى بعض القيود الرئيسية:

  • 32MB حد حجم الملف
  • حد أقصى 100 صفحة لكل مستند
  • تستهلك كل صفحة 1,500-3,000 رمز

إدارة الرموز

الآن، إلى الجانب العملي لهذه الحدود. عندما تعمل مع Citations، تحتاج إلى النظر في ميزانيتك من الرموز بعناية. هنا كيفية تقسيمها:

للملفات النصية:

  • حد الطلب الكامل: 200,000 رمز
  • يشمل: السياق + الاستفزازات + المستندات
  • لا يوجد رسوم إضافية لمخرجات الاستشهاد نفسها

لملفات PDF:

  • استهلاك رمز أعلى لكل صفحة
  • الوزن الزائد لمعالجة بصرية
  • تحتاج إلى حساب رموز أكثر تعقيدًا

Citations vs RAG: الفروق الرئيسية

Citations ليست نظام توليد معزز بالاسترجاع (RAG) – وهذا التمييز مهم. في حين تركز أنظمة RAG على العثور على معلومات ذات صلة من قاعدة المعرفة، تعمل Citations على المعلومات التي اخترتها بالفعل.

فكر في الأمر بهذه الطريقة: RAG تقرر ما هي المعلومات التي يجب استخدامها، بينما Citations يضمن أن يتم استخدام هذه المعلومات بدقة. هذا يعني:

  • RAG: يتعامل مع استرجاع المعلومات
  • Citations: يدير التحقق من المعلومات
  • الpotential المدمج: يمكن أن تعمل كلا النظامين معًا

ت意味ى اختيار الهندسة المعمارية أن Citations تتفوق في الدقة داخل السياقات المحددة، بينما تترك استراتيجيات الاسترجاع لأنظمة مكملة.

مسارات التكامل والأداء

الإعداد بسيط: Citations تعمل من خلال واجهة برمجة تطبيقات Anthropic القياسية، مما يعني أنه إذا كنت تستخدم بالفعل Claude، فأنت في منتصف الطريق. يدمج النظام مباشرة مع واجهة برمجة تطبيقات الرسائل، مما يلغي الحاجة إلى تخزين ملفات منفصل أو تغييرات بنية تحتية معقدة.

تتبع هيكل التسعير نموذج Anthropic القائم على الرموز مع ميزة رئيسية: بينما تدفع مقابل الرموز الدخلة من المستندات المصدر، لا يوجد رسوم إضافية لمخرجات الاستشهاد نفسها. هذا يخلق هيكلاً لتكلفة يمكن توقعها يتناسب مع الاستخدام.

مؤشرات الأداء تحكي قصة مقنعة:

  • تحسن بنسبة 15٪ في دقة الاستشهاد الكلية
  • إزالة كاملة لهلوسات المصدر (من حدوث 10٪ إلى الصفر)
  • التحقق على مستوى الجملة لكل ادعاء

المنظمات (والأفراد) الذين يستخدمون أنظمة الذكاء الاصطناعي غير المثبتة يجدون أنفسهم في وضع غير مُفضّل، خاصة في الصناعات المنظمة أو البيئات عالية المخاطر حيث الدقة حاسمة.

نظرًا إلى المستقبل، من المحتمل أن نرى:

  • تكامل ميزات Citations- مثلها أصبحت معيارية
  • تطور أنظمة التحقق بعيدًا عن النص إلى وسائط أخرى
  • تطوير معايير التحقق الخاصة بالصناعة

تحتاج الصناعة بأكملها إلى إعادة التفكير في موثوقية الذكاء الاصطناعي والتحقق. يجب على المستخدمين أن يصلوا إلى نقطة يمكنهم فيها التحقق من كل ادعاء بسهولة.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.