رطم ما هو NLP (معالجة اللغة الطبيعية)؟ - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات

الذكاء الاصطناعي

ما هو NLP (معالجة اللغة الطبيعية)؟

mm
تحديث on

معالجة اللغات الطبيعية (NLP) هي دراسة وتطبيق التقنيات والأدوات التي تمكن أجهزة الكمبيوتر من معالجة وتحليل وتفسير والاستدلال على لغة الإنسان. البرمجة اللغوية العصبية هو مجال متعدد التخصصات ويجمع بين التقنيات التي تم إنشاؤها في مجالات مثل اللغويات وعلوم الكمبيوتر. تُستخدم هذه التقنيات بالتنسيق مع الذكاء الاصطناعي لإنشاء روبوتات محادثة ومساعدين رقميين مثل Google Assistant و Amazon's Alexa.

لنأخذ بعض الوقت لاستكشاف الأساس المنطقي وراء معالجة اللغات الطبيعية، وبعض التقنيات المستخدمة في البرمجة اللغوية العصبية، وبعض حالات الاستخدام الشائعة للبرمجة اللغوية العصبية.

لماذا يهم معالجة اللغة الطبيعية (NLP)

لكي تتمكن أجهزة الكمبيوتر من تفسير لغة الإنسان ، يجب تحويلها إلى صيغة يمكن للكمبيوتر معالجتها. ومع ذلك ، هذا ليس بسيطًا مثل تحويل البيانات النصية إلى أرقام. من أجل اشتقاق المعنى من اللغة البشرية ، يجب استخراج الأنماط من مئات أو آلاف الكلمات التي تشكل مستندًا نصيًا. هذا المتحان ليس سهل. هناك القليل من القواعد الصارمة والسريعة التي يمكن تطبيقها على تفسير لغة الإنسان. على سبيل المثال ، يمكن أن تعني نفس مجموعة الكلمات بالضبط أشياء مختلفة اعتمادًا على السياق. اللغة البشرية هي شيء معقد وغالبًا ما يكون غامضًا ، ويمكن النطق ببيان بصدق أو سخرية.

على الرغم من ذلك، هناك بعض الإرشادات العامة التي يمكن استخدامها عند تفسير الكلمات والأحرف، مثل استخدام الحرف "s" للدلالة على أن العنصر متعدد. يجب استخدام هذه الإرشادات العامة بالتنسيق مع بعضها البعض لاستخراج المعنى من النص، وإنشاء ميزات يمكن لخوارزمية التعلم الآلي تفسيرها.

تتضمن معالجة اللغات الطبيعية تطبيق خوارزميات مختلفة قادرة على أخذ البيانات غير المنظمة وتحويلها إلى بيانات منظمة. إذا تم تطبيق هذه الخوارزميات بطريقة خاطئة، فغالبًا ما يفشل الكمبيوتر في استخلاص المعنى الصحيح من النص. ويمكن ملاحظة ذلك غالبًا في ترجمة النص بين اللغات، حيث غالبًا ما يُفقد المعنى الدقيق للجملة. على الرغم من تحسن الترجمة الآلية بشكل كبير خلال السنوات القليلة الماضية، إلا أن أخطاء الترجمة الآلية لا تزال تحدث بشكل متكرر.

تقنيات معالجة اللغة الطبيعية (NLP)

الصورة: Tamur عبر WikiMedia Commons، Public Domain (https://commons.wikimedia.org/wiki/File:ParseTree.svg)

العديد من تقنيات التي تستخدم في معالجة اللغة الطبيعية يمكن وضعها في واحدة من فئتين: بناء الجملة أو دلالات. تقنيات النحو هي تلك التي تتعامل مع ترتيب الكلمات ، في حين أن التقنيات الدلالية هي التقنيات التي تنطوي على معنى الكلمات.

تقنيات البرمجة اللغوية العصبية

تتضمن أمثلة بناء الجملة ما يلي:

  • اللميتة
  • التقسيم الصرفي
  • وضع علامات على جزء من الكلام
  • توزيع
  • كسر الجملة
  • النابعة
  • تجزئة الكلمات

يشير Lemmatization إلى تقطير التصريفات المختلفة للكلمة وصولاً إلى شكل واحد. يأخذ Lemmatization أشياء مثل الأزمنة والجمع وتبسيطها ، على سبيل المثال ، قد تصبح "القدم" "القدم" و "المشارب" قد تصبح "مخططة". هذا النموذج المبسط للكلمات يجعل من السهل على الخوارزمية تفسير الكلمات الموجودة في المستند.

التجزئة الصرفية هي عملية تقسيم الكلمات إلى صيغ أو وحدات أساسية للكلمة. هذه الوحدات هي أشياء مثل مجانية مورفيم (والتي يمكن أن تكون منفردة ككلمات) والبادئات أو اللواحق.

وضع علامات على جزء من الكلام هي ببساطة عملية تحديد أي جزء من الكلام تكون كل كلمة في مستند الإدخال.

توزيع يشير إلى تحليل جميع الكلمات في جملة وربطها بعلامات القواعد النحوية الرسمية أو إجراء تحليل نحوي لجميع الكلمات.

كسر الجملة ، أو تجزئة حدود الجملة ، يشير إلى تحديد أين تبدأ الجملة وتنتهي.

النابعة هي عملية اختزال الكلمات وصولاً إلى الشكل الجذري للكلمة. على سبيل المثال ، سيتم إنشاء كل من الاتصال والتوصيل والتوصيلات "للاتصال".

تجزئة الكلمات هي عملية تقسيم أجزاء كبيرة من النص إلى وحدات صغيرة ، والتي يمكن أن تكون كلمات أو وحدات مشتقة / متقطعة.

تقنيات البرمجة اللغوية العصبية الدلالية

تتضمن تقنيات البرمجة اللغوية العصبية الدلالية تقنيات مثل:

  • التعرف على الكيانات المسماة
  • اللغة الطبيعية الجيل
  • توضيح معنى الكلمة

التعرف على الكيان المسمى يتضمن وضع علامات على أجزاء نصية معينة يمكن وضعها في واحدة من عدد من المجموعات المختلفة المعدة مسبقًا. تشمل الفئات المحددة مسبقًا أشياء مثل التواريخ والمدن والأماكن والشركات والأفراد.

جيل اللغة الطبيعية هي عملية استخدام قواعد البيانات لتحويل البيانات المهيكلة إلى لغة طبيعية. على سبيل المثال ، يمكن تلخيص الإحصائيات المتعلقة بالطقس ، مثل درجة الحرارة وسرعة الرياح بلغة طبيعية.

إن توضيح معنى الكلمة هو عملية تحديد معنى للكلمات داخل النص بناءً على السياق الذي تظهر فيه الكلمات.

نماذج التعلم العميق للغة البرمجة اللغوية العصبية

لا تستطيع الإدراك المنتظم متعدد الطبقات التعامل مع تفسير البيانات المتسلسلة ، حيث يكون ترتيب المعلومات مهمًا. من أجل التعامل مع أهمية الترتيب في البيانات المتسلسلة ، يتم استخدام نوع من الشبكات العصبية التي تحافظ على المعلومات من الخطوات الزمنية السابقة في التدريب.

الشبكات العصبية المتكررة هي أنواع من الشبكات العصبية التي تكرار البيانات من الخطوات الزمنية السابقةمع أخذها في الاعتبار عند حساب أوزان الخطوة الزمنية الحالية. بشكل أساسي، تحتوي RNN على ثلاث معلمات يتم استخدامها أثناء تمرير التدريب الأمامي: مصفوفة تعتمد على الحالة المخفية السابقة، ومصفوفة تعتمد على الإدخال الحالي، ومصفوفة تقع بين الحالة المخفية والمخرجات. ونظرًا لأن شبكات RNN يمكنها أن تأخذ المعلومات من الخطوات الزمنية السابقة في الاعتبار، فيمكنها استخراج الأنماط ذات الصلة من البيانات النصية عن طريق أخذ الكلمات السابقة في الجملة في الاعتبار عند تفسير معنى الكلمة.

نوع آخر من بنية التعلم العميق المستخدمة لمعالجة البيانات النصية هو شبكة ذاكرة طويلة المدى (LSTM). تشبه شبكات LSTM شبكات RNN في الهيكل ، ولكن نظرًا لبعض الاختلافات في بنيتها ، فإنها تميل إلى الأداء بشكل أفضل من شبكات RNN. إنهم يتجنبون مشكلة معينة تحدث غالبًا عند استخدام RNNs تسمى انفجار مشكلة الانحدار.

يمكن أن تكون هذه الشبكات العصبية العميقة إما أحادية الاتجاه أو ثنائية الاتجاه. الشبكات ثنائية الاتجاه قادرة على ألا تأخذ فقط الكلمات التي تأتي قبل الكلمة الحالية في الاعتبار ، ولكن الكلمات التي تأتي بعدها. في حين أن هذا يؤدي إلى دقة أعلى ، إلا أنه أكثر تكلفة من الناحية الحسابية.

حالات الاستخدام لمعالجة اللغة الطبيعية (NLP)

الصورة: mohammed_hassan عبر Pixabay ، رخصة Pixabay (https://pixabay.com/illustrations/chatbot-chat-application-artustry-3589528/)

نظرًا لأن معالجة اللغة الطبيعية تتضمن تحليل اللغات البشرية ومعالجتها ، فإن لها نطاقًا واسعًا بشكل لا يصدق من التطبيقات. تشمل التطبيقات الممكنة لـ NLP روبوتات المحادثة ، والمساعدين الرقميين ، وتحليل المشاعر ، وتنظيم المستندات ، وتوظيف المواهب ، والرعاية الصحية.

روبوتات الدردشة والمساعدين الرقميين مثل Amazon's Alexa و Google Assistant هي أمثلة لمنصات التعرف على الصوت والتوليف التي تستخدم البرمجة اللغوية العصبية لتفسير الأوامر الصوتية والاستجابة لها. يساعد هؤلاء المساعدون الرقميون الأشخاص في مجموعة متنوعة من المهام ، مما يسمح لهم بتفريغ بعض مهامهم المعرفية إلى جهاز آخر وتحرير بعض قوتهم العقلية لأشياء أخرى أكثر أهمية. بدلاً من البحث عن أفضل طريق إلى البنك في صباح مزدحم ، يمكننا فقط أن نجعل مساعدنا الرقمي يقوم بذلك.

تحليل المشاعر هو استخدام تقنيات البرمجة اللغوية العصبية لدراسة ردود فعل الناس ومشاعرهم تجاه ظاهرة ما ، كما ينقلها استخدامهم للغة. يمكن أن يؤدي التعرف على مشاعر البيان ، مثل تفسير ما إذا كانت مراجعة المنتج جيدة أم سيئة ، إلى تزويد الشركات بمعلومات جوهرية بشأن كيفية تلقي منتجها.

تنظيم المستندات النصية تلقائيًا هو تطبيق آخر من تطبيقات البرمجة اللغوية العصبية. تستخدم شركات مثل Google و Yahoo خوارزميات البرمجة اللغوية العصبية لتصنيف مستندات البريد الإلكتروني ، ووضعها في الصناديق المناسبة مثل "الاجتماعية" أو "العروض الترويجية". هم أيضا يستخدمون هذه التقنيات ل تحديد البريد العشوائي ومنعه من الوصول إلى بريدك الوارد.

طورت المجموعات أيضًا تقنيات البرمجة اللغوية العصبية التي يتم استخدامها لتحديد الوظائف المحتملة ، وإيجادها بناءً على المهارات ذات الصلة. يستخدم مديرو التوظيف أيضًا تقنيات البرمجة اللغوية العصبية لمساعدتهم على فرز قوائم المتقدمين.

تُستخدم تقنيات البرمجة اللغوية العصبية أيضًا لتعزيز الرعاية الصحية. يمكن استخدام البرمجة اللغوية العصبية لتحسين اكتشاف الأمراض. يمكن تحليل السجلات الصحية واستخراج الأعراض بواسطة خوارزميات البرمجة اللغوية العصبية ، والتي يمكن استخدامها بعد ذلك لاقتراح التشخيصات الممكنة. أحد الأمثلة على ذلك هو منصة Comprehend Medical من أمازون ، والتي تحلل السجلات الصحية وتستخلص الأمراض والعلاجات. تمتد تطبيقات الرعاية الصحية في البرمجة اللغوية العصبية أيضًا إلى الصحة العقلية. هناك تطبيقات مثل WoeBot ، الذي يتحدث المستخدمين من خلال مجموعة متنوعة من تقنيات إدارة القلق القائمة على العلاج السلوكي المعرفي.

احدث المقالات