Connect with us

لماذا تقرر جودة البيانات نجاح أو فشل الذكاء الاصطناعي في الشركات

قادة الفكر

لماذا تقرر جودة البيانات نجاح أو فشل الذكاء الاصطناعي في الشركات

mm

منذ ظهور OpenAI لتشات جبت في أواخر عام 2022، هرعت كل شركة إلى التسريع بالذكاء الاصطناعي. يبيع مشغلون آخرون مثل نفيديا كميات أكبر من وحدات معالجة الرسومات أكثر من أي وقت مضى، بينما يستمر بناء النماذج الكبيرة مثل OpenAI وAnthropic في بناء نماذج أكبر وأكبر.

然而، حتى مع أكثر النماذج تقدمًا والميزانيات الأكبر، لا يزال العديد من مشاريع الذكاء الاصطناعي تفتقر إلى النجاح. لقد رأينا حدوث ذلك عبر الصناعات من الرعاية الصحية إلى النقل إلى التمويل والمزيد. السبب ليس بعيد المنال: الذكاء الاصطناعي جيد فقط مثل البيانات التي يتم تدريبه عليها والبيانات التي يتلقاها في الوقت الفعلي. عندما تكون تلك البيانات مخطئة أو قديمة أو غير كاملة، لا يمكن لأي نموذج تقديم نتائج متسقة أو موثوقة.

وهذا هو المشكل الكبير الذي تواجهه العديد من الشركات اليوم. يستثمرون بشكل كبير في أدوات الذكاء الاصطناعي، بينما تظل أنظمتهم البيانية متفرقة وغير موثوقة. النتيجة هي وهم التقدم. بينما تنتج النماذج إجابات مثيرة للإعجاب، غالبًا ما تكون الاكتشافات基于 أسس ضعيفة. العائق الحقيقي لنجاح الذكاء الاصطناعي ليس أداء النموذج. إنه جودة البيانات.

ما تعنيه البيانات الجيدة حقًا

البيانات عالية الجودة ليست فقط حول الدقة. إنها تعني المعلومات التي هي حديثة وكاملة وملائمة للمشكلة المطروحة. تخيل عميلًا يحاول إلغاء طلب على موقع تجاري إلكتروني. يحتاج النظام إلى التحقق من تفاصيل الطلب، وحالة الشحن، وسجل الدفع. إذا كانت أي من تلك النقاط البيانية تعيش في أنظمة مختلفة لا تتكلم مع بعضها البعض، سيفشل مساعد الذكاء الاصطناعي في تقديم إجابة مفيدة.

البيانات الجيدة تربط هذه النقاط على الفور. تسمح للذكاء الاصطناعي برؤية صورة كاملة بدلاً من شظايا منها. البيانات الرديئة، من ناحية أخرى، تجبر النموذج على التخمين. وعندما يبدأ الذكاء الاصطناعي في التخمين، يرتكب أخطاءً تكلف المال وتضر الثقة. تُظهر الأمثلة الحديثة مدى خطورة افتراضات من هذا القبيل.

نظام الدردشة الذكي لمدينة نيويورك قدم نصائح غير قانونية لأنها استندت إلى معلومات قانونية قديمة أو غير كاملة. نظام خدمة العملاء التابع لشركة إير كندا قدم مطالبات استرداد كاذبة بسبب نقص السياق من سياسة الشركة. حتى أنظمة التوظيف الكبيرة قامت بفرز المرشحين بشكل خاطئ بسبب بيانات متحيزة أو مخطئة، كما هو موضح في اتفاقية تسوية الذكاء الاصطناعي الأولى التابعة للهيئة. هذه الأخطاء ليست فنية فقط. إنها سمعة ومالية، وتنبع من أنظمة ذكاء اصطناعي تم تدريبها على بيانات غير موثوقة.

دراسات الصناعة تؤكد حجم هذه القضية. تقارير غارتنر أن 80 في المائة من مشاريع الذكاء الاصطناعي تفشل في التوسع بسبب جودة البيانات وسيطرة الحوكمة. وبالمثل، وجد استطلاع استطلاع التابع لمراجعة إدارة سلوان أن مشاكل البيانات، وليس الخوارزميات، هي السبب الرئيسي لفشل مشاريع الذكاء الاصطناعي في الشركات.

الثقافة تهم كما يهم الكود

تحسين جودة البيانات ليس شيئًا يمكن إصلاحه بأداة واحدة أو أمر. يتطلب تحولًا ثقافيًا. هذا هو السبب في أن قادة الأعمال يجب أن يعاملوا البيانات كمنظومة حية تحتاج إلى الرعاية والمساءلة. هذا ليس فقط عن إعلان “نريد جعل البيانات أفضل” – هذا ليس كافياً. يجب على كل جزء من المنظمة فهم كيف تتحرك المعلومات، ومن يملكها، وماذا يحدث عندما تتغير.

لقد رأينا كيف يلعب هذا في الأنظمة في العالم الحقيقي. تعتمد العديد من تطبيقات الذكاء الاصطناعي على تحديثات البيانات الليلية. إذا كانت قاعدة بياناتك تتم تحديثها مرة واحدة في اليوم، فإن معرفة نموذجك دائمًا ما تكون متأخرة عن الواقع. في البيئات السريعة الحركة، يمكن أن يعني هذا التأخير رؤى قديمة و قرارات سيئة. يجب على الشركات إعادة التفكير في تدفق البيانات بأكمله من كيفية جمع المعلومات إلى كيفية تسليمها إلى النموذج.

يمكن أن يوفر القيام بذلك جيدًا وقتًا وتكلفة هائلة. عندما يتم تصميم أنابيب البيانات بدقة وغرض، يمكن لأنظمة الذكاء الاصطناعي التعلم والعمل على أحدث المعلومات والأكثر صلة. عندما لا يكونوا كذلك، يقضي الفرق أكثر وقتًا في تنظيف البيانات منه في استخدامها.

يُشير الخبراء في إدارة البيانات غالبًا إلى أن المفتاح لجودة البيانات القوية هو حلقة ملاحظية بين الأشخاص والعمليات والمنصات. بدون تلك الحلقة، تصبح المعلومات قديمة ويفقد النموذج الاتصال مع الظروف في العالم الحقيقي – مشكلة يُطلق عليها أحيانًا انجراف البيانات.

تحقيق التوازن بين السرعة والسلامة

غالبًا ما يكون هناك توتر بين الحركة السريعة والحفاظ على الدقة. تريد العديد من المنظمات نتائج فورية من استثماراتها في الذكاء الاصطناعي، ولكن العجلة يمكن أن تؤدي إلى مشاكل أكبر لاحقًا. يجب أن يكون الهدف هو مرونة البيانات مع السلامة. بعبارة أخرى، بناء أنظمة يمكنها التحرك بسرعة دون فقدان الدقة.

بهذا الصدد، يجب على كل شركة تحديد مسارات واضحة للبيانات لتتدفق من مصدرها إلى النموذج في الوقت الفعلي. كما يساعد في تحديد ما نوع المعلومات المسموح بها والذي يجب أن يبقى خارجًا. يجب ألا تصل البيانات الحساسة أو الخاصة أبدًا إلى النموذج، حتى إذا كان للمستخدم حق الوصول إليها تقنيًا. حماية تلك الحدود تبني الثقة وتحافظ على أنظمة الذكاء الاصطناعي من تسريب أو إساءة استخدام المعلومات.

随ما يصبح الذكاء الاصطناعي أكثر استقلالية، ستبقى الإشراف البشري حاسمًا. لا يجب أن يكون للنموذج السيطرة الكاملة على الإجراءات التجارية. بالتأكيد لا ينبغي له أن يتخذ أي قرارات. بدلاً من ذلك، يجب أن يقدم طلبات. وأهم من ذلك، يجب على البشر دائمًا مراجعة وموافقة إجراءاته لضمان مطابقتها لسياسة الشركة واللوائح.

بناء الجودة من الأساس

حفظ جودة البيانات على نطاق واسع ليس فقط مسألة تنظيف الأخطاء. يبدأ من البنية. يجب عليك تحديد مكان وجود بياناتك الأكثر موثوقية، ثم تصميم نظام يجمعها معًا في موقع موثوق واحد. من هناك، يمكنك تتبع البيانات التي يستخدمها النموذج ومن أين تأتي.

هذا النهج يمنع الارتباك ويحافظ على نظام شفاف. كما يساعد الفرق على تصحيح الأخطاء بشكل أسرع عند حدوث شيء خاطئ. عندما تعرف بالضبط البيانات التي غذت إجابة النموذج، يمكنك التحقق وتصحيح المشاكل قبل انتشارها.

سي thuộc مستقبل الذكاء الاصطناعي في الشركات إلى الشركات التي تدمج الجودة في بنيتها التحتية افتراضيًا. نتوقع أن نرى المزيد من أنظمة الذكاء الاصطناعي الجاهزة التي تتعامل مع كل من العقلانية وتكامل البيانات في حزمة واحدة. يمكن أن تجعل هذه “أجهزة الذكاء الاصطناعي” من السهل على المنظمات نشر أنظمة ذكية دون فقدان السيطرة على بياناتها.

يتوقع المحللون أن تتسارع الشركات القادرة على توحيد حوكمة بياناتها بشكل فعال في تبني الذكاء الاصطناعي وزيادة عائد الاستثمار من مشاريع الذكاء الاصطناعي. يُشرح تقرير حديث حول استعداد البيانات أن هذه القدرة تفصل الشركات التي تبتكر باستمرار عن تلك التي تتوقف بعد تجارب أولية مبكرة. غالبًا ما يعود الفرق إلى ما إذا كانت أنظمتها الذكاء الاصطناعي مبنية على معلومات متسقة ومهيكلة جيدًا.

النتيجة

جودة البيانات قد لا تبدو مثيرة مقارنة بالانجازات في تصميم النموذج، ولكنها القوة الصامتة التي تقرر نجاح أو فشل الذكاء الاصطناعي. بدون بيانات نظيفة و حديثة ومتسقة، سيتعثر حتى أكثر الأنظمة ذكاءً. معها، حتى مشاريع الذكاء الاصطناعي المتواضعة يمكن أن تخلق قيمة دائمة.

يجب على كل قائد يستثمر في الذكاء الاصطناعي أن يسأل سؤالًا بسيطًا: هل نثق بالبيانات التي تدفع قراراتنا؟ من ما رأيناه، الشركات التي يمكنها الإجابة بثقة “نعم” هي تلك التي تتقدم بالفعل في سباق الذكاء الاصطناعي.

Oren Eini هو المؤسس والرئيس التنفيذي لشركة RavenDB، وهو قاعدة بيانات وثائق متعدد النماذج NoSQL موثوق بها من قبل المطورين والشركات في جميع أنحاء العالم. بالإضافة إلى كونه القوة الدافعة وراء نمو وتوسع قاعدة بيانات RavenDB، Oren هو مدون حاسم ويتحدث بانتظام في الفعاليات الصناعية حول العالم.