قاده التفكير
تنظيف بياناتنا الفوضوية: كيف يُغير الذكاء الاصطناعي قواعد اللعبة

نحن غارقون في البيانات. كل منصة وساعة ذكية وهاتف ذكي يجزئ حياتنا إلى أجزاء صغيرة قابلة للقياس، ومع ذلك يظل معظمها غير متماسك وغير قابل للاستخدام.
الشركات تدرك ذلك، ولهذا السبب فإن شركة التكنولوجيا العملاقة ميتا استثمرت 14 مليار دولار أمريكي الصيف الماضي للاستحواذ على حصة 49٪ في شركة Scale AI الناشئة المتخصصة في تصنيف البيانات، في خطوة محسوبة واستراتيجية لتأمين بيانات تدريب عالية الجودة لنماذج الذكاء الاصطناعي الخاصة بها.
تعتمد موثوقية نماذج اللغة الكبيرة كلياً على جودة البيانات التي يتم تغذيتها بها - باختصار، "مدخلات رديئة، مخرجات رديئة". ومع ذلك، فإن التحدي الحقيقي الذي تواجهه الشركات اليوم هو تحويل سيل من المعلومات الخام إلى بيانات قابلة للتنفيذ.
قد يكون الحل واضحاً للعيان: يمكن للذكاء الاصطناعي نفسه أن يساعد من خلال توليد استراتيجيات لتجاوز المهمة الشاقة المتمثلة في تصنيف مجموعات البيانات الضخمة أو البحث في جداول البيانات التي لا نهاية لها، وتحويل الفوضى إلى ذكاء بشري قابل للاستخدام.
عندما تصبح البيانات فوضوية: التكاليف الخفية للشركات
ووفقاً لوكالة بحث جارتنر منذ عام 2020، تكلف جودة البيانات الرديئة المؤسسات ما لا يقل عن 12.9 مليون دولار أمريكي سنوياً، مما يؤثر على الإنتاجية ويؤدي إلى اتخاذ قرارات غير مدروسة وإعداد تقارير غير دقيقة.
تتجلى عواقب البيانات غير المنظمة بشكل أوضح في قطاعات مثل الرعاية الصحية. فالسجلات الصحية غير المكتملة، وتفاصيل الفواتير غير الدقيقة، والبيانات غير المتطابقة بين الأنظمة المختلفة، قد تؤدي إلى تشخيصات خاطئة، وأخطاء في العلاج، وتخصيص غير فعال للموارد. وعلى المدى البعيد، يؤدي ذلك إلى ارتفاع التكاليف وتآكل الثقة في هذه الأنظمة.
في الوقت نفسه، في مجال الخدمات اللوجستية، قد يؤدي عدم تطابق البيانات بين الموردين والموزعين إلى تأخيرات أو نقص في المخزون. كما أن عنوان التسليم غير الصحيح أو سجل المخزون القديم قد يُحدث تأثيراً متتالياً في جميع مراحل سلسلة التوريد، مما يؤدي إلى ضياع المواعيد النهائية وعدم رضا العملاء.
"من خلال القدرة على توقع أو فهم ما يمكن أن يحدث [على طول الطريق] - استنادًا إلى البيانات السابقة المجمعة - يمكنك حقًا تقليل أوجه القصور هذه." أسباروه كوييفالرئيس التنفيذي لشركة متخصصة في الذكاء الاصطناعي في مجال الخدمات اللوجستية قياسات النقل، كما لوحظ أثناء الحديث مع توحيد الذكاء الاصطناعي.
بصورة عملية أكثر، البيانات غير المنظمة مكلفة. توضح قاعدة 1-10-100 ذلك: يكلف فحص البيانات عند إدخالها دولارًا واحدًا، وتنظيفها بعد ذلك 10 دولارات، و100 دولار إذا لم يتم فعل أي شيء.
ما الذي تقدمه المنصات المدعومة بالذكاء الاصطناعي؟
مع تزايد حجم البيانات غير الدقيقة التي تواجهها الشركات، تتجه إلى الذكاء الاصطناعي لإيجاد حلول. تعمل المنصات الناشئة المدعومة بالذكاء الاصطناعي على أتمتة عملية تنظيف البيانات، مما يضمن فعالية التكلفة وتحسين الدقة.
روبرت جياردينا، مؤسسة مجموعة وضوحإحدى هذه المنصات، أوضحت عملية الذكاء الاصطناعي:
"إنها تجمع البيانات في تنسيق مشترك: جزء من العملية هو تحويل كل معلومة إلى تنسيق قياسي يناسب العمل."
لكنّ تقنية الذكاء الاصطناعي من Claritype تتجاوز مجرد التوحيد القياسي. إذ يسمح نظام الإصلاح الخاضع للإشراف في المنصة للمؤسسات بتجاوز حدود الأنظمة سعياً وراء إجابات لأسئلتها الأكثر إلحاحاً، مما يؤدي إلى كسر الحواجز بين الأقسام.
قال جياردينا: "الأنظمة التي كانت منفصلة في السابق، كل منها يحمل جزءًا من الإجابة على أسئلة تشمل العمل بأكمله". توحيد الذكاء الاصطناعي.
إذا تأثر مورد رئيسي بتأخير في الشحن، على سبيل المثال، فإن الشركة لا تستطيع تحديد أي من عملائها الرئيسيين يجب إخطاره أولاً بالتأخير إلا من خلال ربط الموردين بالطلبات وسجل العملاء.
وقال جياردينا: "هدفنا النهائي هو توسيع هذا التفكير المترابط لتوحيد كل جزء من البيانات في المؤسسة حتى نتمكن من جعل الإجابة على كل سؤال سهلة وفورية".
يمثل هذا النوع من التفكير المترابط التغيير الأوسع في العقلية الذي يحدث في الشركات اليوم، حيث تنتقل من مخصص من تنظيف البيانات إلى حوكمة البيانات المنهجية. بدلاً من التعامل مع جودة البيانات كحل لمرة واحدة، تعمل المؤسسات على تطوير عمليات منظمة لضمان الاتساق والموثوقية عبر جميع أنظمتها.
أصبحت إدارة البيانات تُعتبر الآن عملية تجارية قيّمة، وليست مجرد مهمة روتينية لقسم تكنولوجيا المعلومات. فمن خلال دمج إدارة البيانات في استراتيجياتها الشاملة، تستطيع الشركات اتخاذ قرارات أفضل واكتساب رؤى أعمق وأكثر فائدة من بياناتها.
كيف يقوم الذكاء الاصطناعي بتنظيف البيانات والتحديات التي يواجهها
قد يكون الاعتماد المفرط على الذكاء الاصطناعي أمراً خطيراً. فبالنسبة لجياردينا، "إن عمليات تحويل البيانات الآلية المقلقة هي تلك التي تتجاوز التوحيد القياسي إلى التخمين".
على سبيل المثال، قد يُساء فهم بعض الاختصارات بسهولة. فعبارة "International Business Machines, Inc." أو "IBM"، على سبيل المثال، عادةً ما تُحوّل إلى "IBM"، ولكن إذا كانت عملية التحويل آلية وتم تحويل "IB" عن طريق الخطأ إلى "IBM"، فقد يتسبب ذلك في مشاكل كبيرة لكلا الشركتين.
يُعدّ نقص البيانات وعدم دقتها من أكثر المشاكل شيوعًا، والاعتماد كليًا على الذكاء الاصطناعي لسدّ الثغرات وفقًا للسياق قد يأتي بنتائج عكسية. وكما يشير جياردينا، "عندما تكون التأثيرات كبيرة بأي شكل من الأشكال، نحتاج إلى موافقة بشرية على كل تخمين".
موازنة الأتمتة مع الرؤية البشرية
تكشف البيانات غير المنظمة عن عيوب جوهرية في طريقة تعامل المؤسسات مع المعلومات. وللمضي قدماً وتحسين عملية صنع القرار، يجب على الشركات التوقف عن النظر إلى البيانات كمسألة تقنية بحتة، والتحول نحو نماذج حوكمة تجمع بين الخبرة البشرية والوعي الأخلاقي والرؤية الاستراتيجية طويلة الأجل.
تُسهم البيانات الأكثر دقة في إنتاج ذكاء اصطناعي أكثر فعالية، مما يُحسّن بدوره جودة البيانات؛ هذه الدورة التكافلية واعدة، لكنها تُذكّرنا بأن الأتمتة وحدها لن تحل مشكلة البيانات المعقدة. لا يُمكن تحقيق هذا الهدف إلا بدمج دقة الخوارزميات مع التقييم البشري والوعي بالتحيزات التي قد تُسببها، مما يضمن الشفافية ويزيد الثقة في الأنظمة التي نبنيها.
أليكس ساندوفالالرئيس التنفيذي لشركة متخصصة في الذكاء الاصطناعي في مجال التصنيع، الذكاء الاصطناعي الحليفكما أكد على أن مساعدي الذكاء الاصطناعي التوليدي لا يعتمدون على الخوارزميات وحدها، بل يعتمدون على إتقان الإنسان لمنطق المصنع.
وخلص إلى القول: "إن أنجح عمليات النشر اليوم لا تقتصر على تزويد النماذج ببيانات ضخمة من وحدات التحكم المنطقية القابلة للبرمجة (PLC) وملاحظات المشغل وبروتوكولات الامتثال. بل تعتمد على نوع جديد من العاملين في الخطوط الأمامية: شخص قادر على الترجمة بين سلوك الآلة والحدس الرقمي".












