الذكاء الاصطناعي
كيف يمكن أن تحسن رؤية الذكاء الاصطناعي المحيطية التكنولوجيا والسلامة
الرؤية المحيطية، وهي جانب متجاهل في كثير من الأحيان من البصر البشري، تلعب دورًا حاسمًا في كيفية تفاعلنا وفهمنا لمحيطنا. إنها تمكننا من الكشف عن الأشكال والحركات والإشارات المهمة التي لا تقع في خط نظرنا المباشر، وبالتالي توسيع مجال رؤيتنا ما وراء المنطقة المركزية المركزة. هذه القدرة حاسمة للأعمال اليومية، من التنقل في الشوارع المزدحمة إلى الاستجابة للحركات الفجائية في الرياضة.
في معهد ماساتشوستس للتكنولوجيا (MIT)، يعمل الباحثون على مجال الذكاء الاصطناعي بمقاربة مبتكرة، تهدف إلى إعطاء نماذج الذكاء الاصطناعي شكلًا محاكيًا من الرؤية المحيطية. يعمل بحثهم الرائد على سد فجوة كبيرة في قدرات الذكاء الاصطناعي الحالية، والتي، على عكس البشر، تفتقر إلى مهارة الإدراك المحيطي. هذه التحديد في نماذج الذكاء الاصطناعي تقيد إمكاناتها في السيناريوهات التي يكون فيها الكشف المحيطي ضروريًا، مثل أنظمة القيادة الذاتية أو في البيئات الديناميكية المعقدة.
فهم الرؤية المحيطية في الذكاء الاصطناعي
الرؤية المحيطية في البشر يتميز بها قدرتنا على إدراك وتفسير المعلومات في أطراف مجالنا البصري المباشر. بينما تكون هذه الرؤية أقل تفصيلًا من الرؤية المركزية، فهي حساسة للغاية للحركة وتلعب دورًا حاسمًا في تنبيهنا إلى المخاطر والفرص المحتملة في بيئتنا.
على النقيض من ذلك، عانت نماذج الذكاء الاصطناعي تقليديًا من هذا الجانب من الرؤية. أنظمة الرؤية الحاسوبية الحالية مصممة في الغالب لمعالجة وتحليل الصور التي تقع مباشرة في مجال رؤيتها، مشابهة للرؤية المركزية في البشر. هذا يترك نقطة عمياء كبيرة في إدراك الذكاء الاصطناعي، خاصة في الحالات التي تكون فيها المعلومات المحيطية حاسمة لاتخاذ القرارات المطلعة أو الاستجابة للتغييرات غير المتوقعة في البيئة.
البحث الذي أجراه MIT يعالج هذه الفجوة الحاسمة. من خلال دمج شكل من أشكال الرؤية المحيطية في نماذج الذكاء الاصطناعي، يهدف الفريق إلى إنشاء أنظمة لا ترى فقط بل تفسر العالم بطريقة أكثر تشابهًا مع الرؤية البشرية. هذا التطور يحمل إمكانات لتحسين تطبيقات الذكاء الاصطناعي في مجالات مختلفة، من السلامة السياراتية إلى الروبوتات، وربما يساهم أيضًا في فهمنا لمعالجة الرؤية البشرية.
منهج MIT
لتحقيق ذلك، أعادوا تصور كيفية معالجة الصور وإدراكها بواسطة الذكاء الاصطناعي، وجعلها أقرب إلى التجربة البشرية. المركزي في منهجهم هو استخدام نموذج تILING المعدل. الطرق التقليدية غالبًا ما تعتمد على تحويل حواف الصور لتحاكي الرؤية المحيطية. ومع ذلك، أدرك باحثو MIT أن هذه الطريقة تفتقر إلى تمثيل دقيق للفقدان المعقد للمعلومات الذي يحدث في الرؤية المحيطية البشرية.
لمعالجة هذا، لقد رفضوا نموذج تILING للنسيج، وهو تقنية تم تصميمها في الأصل لتحاكي الرؤية المحيطية البشرية. يسمح هذا النموذج المعدل بتحويل أكثر دقة للصور، مما يلتقط تدرج فقدان التفاصيل الذي يحدث عندما يتحرك نظارنا من المركز إلى المحيط.
جزء أساسي من هذا الجهد كان إنشاء مجموعة بيانات شاملة، مصممة خصيصًا لتدريب نماذج التعلم الآلي على التعرف على تفسير المعلومات البصرية المحيطية. تتكون هذه المجموعة من مجموعة واسعة من الصور، كل منها متحول بدقة ليعرض مستويات مختلفة من الإيمان البصري المحيطي. من خلال تدريب نماذج الذكاء الاصطناعي على هذه المجموعة من البيانات، هدف الباحثون إلى غرس رؤية أكثر واقعية للصور المحيطية في النماذج، مشابهة لمعالجة الرؤية البشرية.
النتائج والآثار
عندما تم تدريب نماذج الذكاء الاصطناعي على هذه المجموعة الجديدة من البيانات، انطلق فريق MIT في مقارنة دقيقة لأداء هذه النماذج مقابل القدرات البشرية في مهام الكشف عن الكائنات. كانت النتائج مضيئة. بينما أظهرت نماذج الذكاء الاصطناعي قدرة محسنة على الكشف عن الكائنات وتعرفها في المحيط، فإن أدائها لم يكن بعد على قدم المساواة مع القدرات البشرية.
واحدة من أكثر النتائج إثارة كانت أنماط الأداء المتميزة والتحديدات المتأصلة في الذكاء الاصطناعي في هذا السياق. على عكس البشر، لم يكن حجم الكائنات أو مقدار الفوضى البصرية يؤثر بشكل كبير على أداء نماذج الذكاء الاصطناعي، مما يشير إلى差异 أساسي في كيفية معالجة الذكاء الاصطناعي والبشر للمعلومات البصرية المحيطية.
تملك هذه النتائج آثارًا عميقة في التطبيقات المختلفة. في مجال السلامة السياراتية، يمكن لنظم الذكاء الاصطناعي ذات الرؤية المحيطية المحسنة أن تقلل بشكل كبير من الحوادث عن طريق الكشف عن المخاطر المحتملة التي تقع خارج خط نظر السائقين أو المستشعرات. يمكن لهذه التكنولوجيا أن تلعب دورًا حاسمًا في فهم السلوك البشري، خاصة في كيفية معالجة واستجابة للتحفيزات البصرية في محيطنا.
علاوة على ذلك، يحمل هذا التطور وعدًا بتحسين واجهات المستخدم. من خلال فهم كيفية معالجة الذكاء الاصطناعي للرؤية المحيطية، يمكن لمصممي والمهندسين تطوير واجهات أكثر直觉 واستجابة تتوافق بشكل أفضل مع الرؤية البشرية الطبيعية، وبالتالي إنشاء أنظمة أكثر سهولة وفعاليّة.
في جوهره، يعمل البحث الذي أجراه باحثو MIT ليس فقط على تحقيق خطوة كبيرة في تطور رؤية الذكاء الاصطناعي، بل يفتح أيضًا آفاقًا جديدة لتحسين السلامة، وفهم الإدراك البشري، وتحسين التفاعل مع التكنولوجيا.
من خلال سد الفجوة بين الإدراك البشري والآلي، يفتح هذا البحث مجموعة من الإمكانيات في تقدم التكنولوجيا وتحسين السلامة. تمتد الآثار من هذا الدراسة إلى مجالات عديدة، واعدا بمستقبل حيث يمكن للذكاء الاصطناعي أن يرى ليس فقط مثلنا، بل يفهم أيضًا ويتفاعل مع العالم بطريقة أكثر دقة وتنوعًا.












