الذكاء الاصطناعي
لوحة مفاتيح موبايل خفية مدعومة بالذكاء الاصطناعي تتيح لك الكتابة بسرعة 157%

استخدم باحثون من كوريا الجنوبية تقنيات التعلم الآلي لتطوير لوحة مفاتيح “خفيّة” لأجهزة الموبايل ذات المساحة المحدودة، والتي تمكّن المستخدمين من الكتابة بسرعة 157.5%، حتى بدون ظهور لوحة المفاتيح على الشاشة.
استجابة المستخدمين لطريقة الجديدة – التي تسمى ببساطة Invisible Mobile Keyboard (IMK) – تم الإبلاغ عنها بشكل إيجابي للغاية، حيث أفاد مستخدمو الاختبار بمستويات منخفضة من الطلب البدني والذهني والزمني أثناء استخدام لوحة المفاتيح. فيما يتعلق بالكفاءة، تتفوق IMK بشكل خفيف على أحدث بديل لطريقة الإدخال، مع ارتفاع إلى درجة 51.6 كلمة في الدقيقة.
لوحة المفاتيح الوهمية
لبدء إنشاء الإدخال، يمكن للمستخدمين ببساطة البدء في الكتابة على الشاشة، كما لو كانت لوحة المفاتيح مرئية (على الرغم من عدم ظهورها). لا شيء يظهر لعرقلة عرض المحتوى، وستظهر الكلمات المكتوبة في أي مربع نص قابل للاستقبال حيث يبدأ الكتابة، واختياريًا كتيار رقيق من النص يمكن للمستخدم التحقق من دقته.
تعتمد النظام على 自و-التحليل منذ لحظة تمييز الإدخال. لذلك يمكن للمستخدم أن يكون جهاز الموبايل في وضع أفقي أو رأسي، ويمكنه استخدام المساحة الكلية للشاشة المتاحة لكتابة نصه.
في فيديو مصاحب (انظر نهاية المقالة والصورة مباشرة أدناه) يُظهر مؤلفو الورقة كيفية عمل الإجراء، على الرغم من أنهم يُضيفون أن لا لوحة مفاتيح حقيقية تظهر أثناء الإدخال (إنه موجود فقط لأغراض توضيحية في الفيديو):

هذا مثال على IMK في مرحلة جمع البيانات، على الرغم من أنه يعمل بشكل متطابق في الاستخدام النهائي. لوحة المفاتيح التي تظهر هي فقط لأغراض توضيحية، ولا تظهر للمستخدم إما أثناء عملية جمع البيانات أو في استخدام الواجهة النهائية. مصدر: https://www.youtube.com/watch?v=PuhiVGOfIR0
الكتابة كمنظومة إحداثيات
ينشأ البحث من معهد كوريا المتقدم للعلوم والتكنولوجيا (KAIST)، ويفسح المجال لقدرتنا الطبيعية على “تحديد” مكان المفتاح التالي على لوحة المفاتيح. على الرغم من أنه قد يبدو غير متوافق مع المنطق لإخفاء لوحة المفاتيح وتوقع أن يجد إصبع المستخدم المفتاح التالي، إلا أن حتى كاتبًا عاديًا يتجه بشكل غريزي نحو الحرف الصحيح.
بفعالية، تعامل IMK مع لوحة المفاتيح كمتجه، وقد قام المؤلفون بتحليل قاعدة بيانات شاملة للإدخال المستخدم لتقديم بيانات لمدقق الشخصيات العصبية الذاتي (SA-NCD) للتدريب ضده.
SA-NCD سوف يلاحظ موقع “سقوط المفتاح” وسيحسب احتمال المفتاح الذي كان مطلوبًا. مع بناء الكلمات من خلال ضربات المفاتيح، يمكن لـ SA-NCD تجميع وتفكيك الحروف إلى الكلمات المُقصودة، مع تنظيف الإدخال على أساس حي.

هندسة الشبكة من SA-NCD، حيث Q / K / V تمثل الاستفسار والمفتاح والقيمة من الانتباه الذاتي. مصدر: https://arxiv.org/pdf/2108.09030.pdf
لا ينتظر SA-NCD إكمال جملة محتملة، منذ أن ليس لديه أي فكرة متى ستنتهي إدخال الجملة، وعندما يتم إضافة كلمة أو كلمات إلى الجملة، قد يعيد زيارة وتعديل التفسيرات السابقة للجملة في ضوء الإدخال الأخير.
قاعدة البيانات
为了 تغذية عملية التدريب، جمع الباحثون حوالي مليوني زوج من نقاط اللمس والنص من المستخدمين، الذين كانوا يستخدمون واجهة ويب بسيطة يمكن الوصول إليها من أجهزة الموبايل القابلة للمس.
تحتوي قاعدة البيانات على الحروف الأولى من اسم المستخدم، وحجم الشاشة لجهازهم، وعمرهم، ونوع جهاز الموبايل المستخدم (مثل جهاز لوحي أو هاتف ذكي، إلخ)، وقيم الإحداثيات x و y لكل سقوط مفتاح مسجل.

موقع سقوط المفتاح المتوسط بين المستخدمين، مع نقاط من نفس اللون تشير إلى سقوط المفتاح من نفس المستخدمين. يساعد تحديد بيانات نفس المستخدم في تحسين قاعدة البيانات وتجنب التأثير المفرط من خلال مقارنة مجموعات سقوط المفتاح المتوسطة من المستخدمين الفرديين، بدلاً من تدريب ضربات المفاتيح للمستخدم الواحد ضد بعضها البعض.
كان التدريب يحتاج إلى مراعاة الاختلافات الملحوظة في المسافة المتوسطة بين السكتات بين المستخدمين. بعض المستخدمين، ربما أولئك الذين اعتادوا على لوحات مفاتيح برمجية ضيقة، حافظوا على مسافة متوسطة بين المفاتيح تبلغ 50 بكسل فقط على محور z، في حين حافظ آخرون على متوسط 300 بكسل.
هذه الاختلافات حاسمة، حيث في حالة المحور y، سيؤدي الخطأ إلى وضع سقوط المفتاح في الصف الخطأ، مما يؤدي إلى استبدال “I” أو “M” بالسكتة “K” المقصودة.
الهندسة المعمارية والتدريب
يتكون SA-NCD من两个 وحدة فك الشفرة: فك الشفرة الهندسي، الذي يحسب حيث على لوحة المفاتيح الخفية كان من المفترض أن يسقط المفتاح؛ وفك الشفرة الدلالي، الذي يتعامل مع تفسير النص الإدخالي بشكل حي.
يستخدم فك الشفرة الهندسي GRU ثنائي الاتجاه (BiGRU)، مع GRU المعتمد كشبكة عصبونية متكررة (RNN)، مع تمريرات إلى الأمام والخلف تسهل تفسيرًا متغيرًا بشكل مستمر للجملة.
يستخدم المكون الدلالي هيكل Transformer، الذي يفسر الإدخال بعد مروره عبر عملية “تماسك الثقة” مصممة لمقارنة الاستخدام المتوسط ضد سقوط المفتاح الجديد. تم تدريب فك الشفرة الدلالي كنموذج لغة حرف مخفي ضد معيار مليار كلمة، وهو تعاون في عام 2014 بين جوجل وجامعة كامبريدج وجامعة إدنبرة.

النتائج
في الاختبارات، كان المستخدمون قادرين على الكتابة بسرعة 157.5% باستخدام IMK أكثر من لوحات المفاتيح البرمجية الثالثة على هواتفهم الذكية. علاوة على ذلك، وجد أن IMK تفوقت على نتائج الطرق الجديدة المنافسة، مثل أساليب إدخال النص القائمة على الإشارة واللمس وأساليب إدخال النص بعشر أصابع في السنوات الأخيرة. وتفيد الورقة أن المستخدمين أظهروا رضاً عاليًا عن النظام.
انظر فيديو المؤلفين أدناه لمعرفة المزيد عن IMK.










