رطم بيانات إحصائية الكم "Big Bad NLP Database" - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

الذكاء الاصطناعي

إحصائيات الكم تُصدر "قاعدة بيانات كبيرة سيئة في البرمجة اللغوية العصبية"

تحديث on

أصدرت شركة Quantum Stat "قاعدة بيانات Big Bad NLP"في ما يعد خطوة كبيرة للأمام في معالجة اللغة الطبيعية (NLP). تحتوي قاعدة البيانات على مئات مجموعات البيانات المختلفة التي يمكن لمطوري التعلم الآلي الاستفادة منها. 

وفقًا للشركة ، فإنها توفر حلولًا لمبادرات البرمجة اللغوية العصبية والذكاء الاصطناعي. يفعلون ذلك من خلال خدمات مثل المعالجة المسبقة لتطوير تطبيقات الويب ، وهو نهج متعدد الأوجه يتضمن التعلم الآلي والشبكات العصبية العميقة وإدارة الحوار وروبوتات المحادثة وقاعدة بيانات البرمجة اللغوية العصبية الجديدة الخاصة بهم. 

تجري الشركة أيضًا أبحاثًا أولية وثانوية لمساعدة الأفراد على تحليل التطورات داخل الصناعات. 

المحور المركزي لبيانات البرمجة اللغوية العصبية

جاء قرار إنشاء قاعدة البيانات ، وهي أكبر مكتبة بيانات في العالم في معالجة اللغة الطبيعية ، من الحاجة إلى مركز مركزي للاحتفاظ ببيانات البرمجة اللغوية العصبية. تهدف الشركة إلى تسهيل الوصول إليها والبحث فيها أكثر من البديل ، والذي غالبًا ما يتطلب من الباحثين البحث من خلال عدة مكتبات تابعة لجهات خارجية. 

تعمل الشركة على تطوير قاعدة البيانات لعدد من الأسابيع ؛ لديهم حاليًا حوالي 200 مجموعة بيانات. هناك مجموعة متنوعة من مجموعات البيانات المختلفة ، وليس الكلاسيكيات فقط. ضمت الشركة شركات مثل CommonCrawl و Penn Treebank. 

جنبا إلى جنب مع مجموعة من قواعد البيانات المختلفة تأتي مهام البرمجة اللغوية العصبية المختلفة. هناك تلك التي تركز على التصنيف والإجابة على الأسئلة ، ولكن هناك أيضًا مجموعات بيانات لـ text-to-SQL ، والتعرف على الكلام ، والوسائط المتعددة. 

يريد Quantum Stat أن تكون قاعدة البيانات مدفوعة بالمجتمع بمساهمات من المستخدمين. فتحت الشركة أبوابها لأي شخص لإرسال مجموعة بيانات جديدة أو التوصية بالتغييرات. 

التركيز الآخر هو إضافة مجموعات البيانات التي تنوع اللغة ، والابتعاد عن اللغة الإنجليزية الصارمة. هدفهم هو جعل المكتبة أكثر عالمية ومتاحة للآخرين. 

عند الدخول إلى "Big Bad NLP Database" ، سيواجه المستخدم تخطيطًا نظيفًا ومنظمًا. يتم سرد اسم مجموعة البيانات ، متبوعًا باللغة والوصف التفصيلي. كما يسرد أيضًا المثيلات ، والتنسيق ، والمهمة ، وسنة الإنشاء ، والمنشئ. كل قاعدة بيانات لها ارتباط تنزيل لمتابعة. 

قواعد بيانات مختلفة

سيواجه المرء قواعد بيانات مثل مجموعة البيانات التاريخية للجرائد اليومية العالمية ، والتي تحتوي على المحتويات اليومية للصحف في الولايات المتحدة والمملكة المتحدة من 1836 إلى 1922 ؛ مجموعة بيانات SciQ ، التي تحتوي على 13,679 سؤالاً عن امتحان علوم التعهيد الجماعي في مجالات الفيزياء والبيولوجيا والكيمياء ؛ CommonCrawl ، التي تحتوي على بيانات من 25 مليار صفحة ويب ؛ و MovieLens ، وهي مجموعة بيانات تحتوي على 22,000,000 تصنيف و 580,000 علامة لـ 33,000 فيلم بواسطة 240,000 مستخدم. 

تأتي قاعدة بيانات Quantum Stat المثيرة للإعجاب في وقت يطلب فيه الباحثون مجموعات بيانات أكبر وأكثر تنوعًا بسبب التقدم في التعلم العميق. نظرًا للكم الهائل من البيانات الموجودة في اللغة البشرية ، فإن كل مجموعة بيانات فريدة تجعل معالجتها أسهل قليلاً. يعتمد تقدم البرمجة اللغوية العصبية على قواعد البيانات هذه ، وقد ساهم الإحصاء الكمومي في تسريع هذا التقدم من خلال جمع الكثير من مجموعات البيانات في مكان واحد. 

سيكون البرمجة اللغوية العصبية مهمة في العديد من جوانب المجتمع. يمكن أن يساعد في التنبؤ بالأمراض بناءً على السجلات الصحية الإلكترونية وخطاب المريض ، ومساعدة الشركات في معرفة ما يقوله العملاء عن أحد المنتجات ، وتحديد الأخبار المزيفة في عالم تتفشى فيه. 

تتقدم التكنولوجيا بسرعة كبيرة ، ولن يمر وقت طويل قبل أن تصبح قادرة على معالجة هذه التطبيقات المعقدة. 

 

أليكس ماكفارلاند صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في مجال الذكاء الاصطناعي. لقد تعاون مع العديد من الشركات الناشئة والمنشورات في مجال الذكاء الاصطناعي في جميع أنحاء العالم.