Connect with us

تنظيف البيانات المتضمنة: كيف تقوم الذكاء الاصطناعي بتغيير اللعبة

قادة الفكر

تنظيف البيانات المتضمنة: كيف تقوم الذكاء الاصطناعي بتغيير اللعبة

mm

نحن غارقون في البيانات. كل منصة و ساعة ذكية و هاتف ذكي يجزء حياتنا إلى قطع قابلة للقياس، و مع ذلك فإن معظمها يبقى غير متناسق و غير قابل للاستخدام.

تدرك الشركات ذلك، و هذا هو السبب في أن شركة ميتا التكنولوجية استثمرت 14 مليار دولار أمريكي في الصيف الماضي للاستحواذ على حصة 49٪ في شركة Scale AI للتعليم، مما يجعل خطوة محسوبة و استراتيجية لتأمين بيانات تدريب عالية الجودة لنمذجها الذكاء الاصطناعي.

تعتمد موثوقية نماذج اللغة الكبيرة تمامًا على جودة البيانات التي يتم تغذيتها – باختصار، “النفايات في النفايات”. اليوم، ومع ذلك، فإن التحدي الحقيقي الذي تواجهه الشركات هو تحويل فيضان المعلومات الخام إلى بيانات يمكن اتخاذ إجراء بشأنها.

قد تكون الحلول مخفية في виду الجميع: يمكن للذكاء الاصطناعي نفسه المساعدة من خلال توليد استراتيجيات لتجاوز مهمة الملل في تعليم مجموعات بيانات ضخمة أو العبور عبر جداول البيانات اللانهائية، مما يتحول من الفوضى إلى ذكاء بشري قابل للاستخدام.

عندما تصبح البيانات متضمنة: التكاليف الخفية للشركات

وفقًا لأبحاث Gartner من عام 2020، تكلفت رديئة في جودة البيانات الشركات بما لا يقل عن 12.9 مليون دولار أمريكي سنويًا، مما يؤثر على الإنتاجية و يؤدي إلى قرارات سيئة الإعلام و تقارير غير دقيقة.

تكون عواقب البيانات المتضمنة واضحة بشكل خاص في قطاعات مثل الرعاية الصحية. السجلات الصحية غير مكتملة و تفاصيل الفواتير و البيانات غير المتوافقة عبر الأنظمة يمكن أن تؤدي إلى تشخيصات خاطئة و أخطاء علاجية و تخصيص موارد غير فعال. في الطويلة الأجل، يؤدي هذا إلى زيادة التكاليف و تآكل الثقة في هذه الأنظمة.

في غضون ذلك، في مجال اللوجستيات، يمكن أن يؤدي عدم تطابق البيانات بين الموردين و الموزعين إلى تأخيرات أو نقص في المخزون. يمكن أن يكون للعنوان غير الصحيح أو سجل المخزون القديم تأثيرًا متسلسلًا في جميع أنحاء سلسلة التوريد بأكملها، مما يؤدي إلى فوات الأوان و عملاء غير راضين.

“من خلال القدرة على توقع أو فهم ما قد يحدث [على طول الطريق] – بناءً على بيانات مجمعة و سابقة – يمكنك حقًا تقليص هذه اللامعقولية،” أسباروه كويف، الرئيس التنفيذي لشركة Transmetrics للذكاء الاصطناعي اللوجستية، أشار أثناء المحادثة مع Unite AI.

في مصطلحات أكثر واقعية، تكون البيانات المتضمنة مكلفة. يُظهر قاعدة 1-10-100 ذلك: يكلفت التحقق من البيانات أثناء إدخالها 1 دولار، و التنظيف لاحقًا 10 دولارات، و 100 دولار إذا لم يتم فعل شيء.

ماذا تُحضِر منصات الذكاء الاصطناعي إلى الطاولة

بينما تتصارع الشركات مع كميات متزايدة من البيانات القذرة، فإنها تتحول إلى الذكاء الاصطناعي للحصول على حلول. تُ自动 الآن منصات الذكاء الاصطناعي الناشئة عملية تنظيف البيانات، مما يضمن الفعالية التكلفة و تحسين الدقة.

روبرت جياردينا، مؤسس Claritype، واحدة من هذه المنصات، شرح عملية الذكاء الاصطناعي:

“تتحد البيانات في صيغة مشتركة: جزء من العملية هو تحويل كل بيانات إلى صيغة موحدة تناسب الأعمال.”

تذهب منصة Claritype للذكاء الاصطناعي أبعد من مجرد معايير قياسية. يسمح إصلاح المنصة الخاضع للإشراف للشركات بالعبور عبر حدود النظام في سعيها للإجابة على أسئلتها الأكثر إلحاحًا، مما يؤدي إلى كسر الحواجز.

“الأنظمة التي تم فصلها في السابق تحتفظ كل منها بجزء من الإجابة على الأسئلة التي تشمل جميع أجزاء الأعمال،” قال جياردينا لـ Unite AI.

إذا كان مورد رئيسي يتأثر بتأخير في الشحن، على سبيل المثال، فإن الشركة لا يمكنها تحديد العملاء الأوائل الذين يجب إخطارهم بالتأخير إلا من خلال ربط الموردين بالطلبات و سجلات العملاء.

“الهدف النهائي هو تمديد هذا التفكير المتصل لتوحيد كل شاردة من البيانات في المؤسسة حتى نتمكن من جعل كل سؤال سهلًا و فورياً للإجابة،” قال جياردينا.

يمثل هذا النوع من التفكير المتصل التغيير الأوسع في العقلية الذي يحدث في الشركات اليوم، حيث تنتقل من تنظيف البيانات بشكل عشوائي إلى حوكمة البيانات النظامية. بدلاً من معاملة جودة البيانات على أنها حل وحيد، فإن المؤسسات تطور عمليات منظمة لضمان الاتساق و الموثوقية عبر جميع أنظمتها.

تُعتبر حوكمة البيانات الآن عملية أعمال قيمة، لا مجرد مهمة تكنولوجية. من خلال دمج إدارة البيانات في استراتيجياتها العامة، يمكن للشركات اتخاذ قرارات أفضل و الحصول على رؤى أكثر معنى من بياناتها.

كيف يُنظّف الذكاء الاصطناعي البيانات و التحديات التي يواجهها

يمكن أن يكون الاعتماد المفرط على الذكاء الاصطناعي خطيرًا. بالنسبة لجياردينا، “التحويلات التلقائية للبيانات التي تثير القلق هي تلك التي تتجاوز المعايير إلى التخمين”.

على سبيل المثال، يمكن أن يُفسَر الاختصار بسهولة بشكل خاطئ. “International Business Machines, Inc.” أو “I.B.M.”، على سبيل المثال، سيتم تحويله عادة إلى “IBM”، ولكن إذا كان التحويل تلقائيًا و تم تحويل “I.B.” إلى “IBM” بشكل غير صحيح، يمكن أن يسبب مشاكل كبيرة لكلا الشركتين.

تكون البيانات المفقودة و غير الدقيقة من أكثر المشاكل شيوعًا، و يمكن أن يؤدي الاعتماد الكامل على الذكاء الاصطناعي لملء الفجوات وفقًا للسياق بسهولة إلى عواقب سلبية. كما يشير جياردينا، “عندما تكون الآثار مهمة بأي شكل من الأشكال، نحن بحاجة إلى موافقة إنسان على كل تخمين”.

توازن التأتمت مع رؤية الإنسان

تُبرز البيانات المتضمنة عيوبًا عميقة في الطريقة التي تتعامل بها المنظمات مع المعلومات. للتقدم و تحسين اتخاذ القرارات، يجب على الشركات أن تتوقف عن النظر إلى البيانات على أنها مسألة فنية بحتة و تتحرك نحو نماذج الحوكمة التي تجمع بين الخبرة البشرية و الوعي الأخلاقي و الرؤية الاستراتيجية الطويلة الأجل.

تُنشئ البيانات النظيفة ذكاء اصطناعي أكثر فعالية، مما يساعد في تحسين جودة البيانات؛ هذا الدورة المتعززة واعدة، ولكنها تُذكرنا بأن التأتمت وحده لن يحل مشكلتنا المتضمنة. يمكن تحقيق هذا الإمكان فقط من خلال زوج دقة الخوارزمية مع حكم الإنسان و وعي الانحيازات التي يمكن أن يُدخلها، مما يضمن الشفافية و المزيد من الثقة في الأنظمة التي نبنيها.

أليكس سانโดفال، الرئيس التنفيذي لشركة Allie AI لذكاء التصنيع، أشار أيضًا إلى كيفية عمل مرافقي الذكاء الاصطناعي التوليدي لا يعمل على الخوارزميات فقط، بل يعتمد على إمكانية اللغة البشرية في منطق المصنع.

“لا تعتمد النشرات الناجحة اليوم على تغذية النماذج بكميات كبيرة من بيانات مراقبة البرامج و ملاحظات المشغل و بروتوكولات الامتثال فحسب. إنها تعتمد على نوع جديد من العمال في الخط الأمامي: من يمكنه الترجمة بين سلوك الآلة و الحدس الرقمي،” كما أشار.

غابرييل دي جورج هي صحفية وخبيرة اتصالات متعددة اللغات مقرها روما، إيطاليا. وهي حاصلة على ماجستير في الترجمة المتخصصة من جامعة جنيف، وتركز عملها على كيفية عمل الذكاء الاصطناعي مع البشر لتحسين الصناعات والمجتمعات.