قادة الفكر

ما يجب أن يعرفه كل عالم بيانات عن محولات الرسم البياني وأثرها على البيانات المهيكلة

Published August 29, 2025

Updated April 2, 2026

Dr. Jure Leskovec, Chief Scientist and Co-Founder of Kumo

لقد شاركت في إنشاء شبكات الرسوم العصبية أثناء وجودي في ستانفورد. لقد أدركت في وقت مبكر أن هذه التكنولوجيا قوية بشكل لا يصدق. كل نقطة بيانات ، كل ملاحظة ، كل قطعة من المعرفة لا توجد في عزلة ؛ إنها جزء من رسم بياني متصل بقطع أخرى من المعرفة. ومن المهم أن معظم بيانات الأعمال القيمة ، التي يتم تخزينها غالبًا في جداول قواعد البيانات وwarehouses البيانات ، يمكن تمثيلها بشكل طبيعي كـ رسم بياني. الاستفادة من هذه البنية العلاقية هي مفتاح بناء نماذج الذكاء الاصطناعي الدقيقة وغير الخيالية.

أدخلت شبكات الرسوم العصبية (GNNs) معمارية تمرير الرسائل التي يمكن أن تreason على الرسوم البيانية لالتقاط الاتصالات بين قطع المعرفة.  ولكن كما قامت محولات Transformer بتحويل فهم اللغة ، فإن فئة جديدة من النماذج ، محولات الرسم البياني ، تُحقق مكاسب مماثلة للبيانات القائمة على الرسم البياني. هذه النماذج تجمع بين مرونة آليات الانتباه مع أسبقية الرسم البياني الهيكلية لنمذجة العلاقات المعقدة بشكل أكثر فعالية من سابقيها GNN.

لماذا تحتاج الرسوم البيانية إلى أكثر من تمرير الرسائل

تعتمد الشبكات العصبية التقليدية للرسوم البيانية (GNNs) على تمرير الرسائل ، وهو عملية يُحدث فيها كل عقدة حالتها الداخلية عن طريق تجميع المعلومات من جيرانها. فكر في ذلك على أنه كل عقدة تتبادل ملخصات مع العقد المجاورة ، ثم استخدام تلك الملخصات لتحسين فهمها. عبر طبقات متعددة ، هذا يسمح للمعلومات بالانتشار عبر الرسم البياني.

في حين أن تمرير الرسائل قوي لتعلم الأنماط المحلية ، إلا أن لها قيود مهمة:

الضغط الزائد: كما يتم تجميع المعلومات عبر العديد من القفزات ، يمكن أن يصبح مضغوطًا ، مما يؤدي إلى فقدان التفاصيل المهمة. هذا مشكلة خاصة في GNNs العميقة.
سياق محدود: لا يمكن لتمرير الرسائل القياسي التقاط الارتباطات على المدى الطويل بسهولة دون طبقات كثيرة ، مما يزيد من التعقيد والضوضاء.
التعبير: لا يمكن تمييز العديد من هياكل الرسم البياني باستخدام معلومات الجوار المحلية فقط ، مما يحد من أداء النموذج في المهام التي تتطلب تمييزًا هيكليًا دقيقًا.

هنا يتدخل محولات الرسم البياني. من خلال استبدال أو تعزيز تمرير الرسائل بآليات الانتباه ، يسمحون لكل عقدة بالانتباه مباشرة إلى أخرى (حتى البعيدة) بناءً على الأهمية المكتسبة. النتيجة هي تمثيلات أكثر ثراء ، وتوسع أفضل ، والقدرة على التفكير في هياكل معقدة بشكل أكثر مرونة.

من GNNs إلى محولات الرسم البياني

تم تقديم نموذج Transformer الأصلي ، في الورقة الأيقونية ، الانتباه هو كل ما تحتاجه ، لنمذجة العلاقات بين الرموز في تسلسل. يعتمد نجاحه على الانتباه الذاتي ، وهو آلي يسمح لكل إدخال بالنظر إلى كل إدخال آخر ، معзвزًا بالأهمية المكتسبة.

محولات الرسم البياني يعدل هذا النموذج من خلال السماح للعقد بالانتباه ليس فقط إلى جيرانها ولكن إلى أي عقدة في الرسم البياني ، إما من خلال انتباه متصل بالكامل أو نهج هجين يوازن بين الإشارات العالمية والمحلية. التحدي هو إدخال مفهوم الهيكل في نموذج مصمم للتسلسلات غير المهيكلة.

ترميزات موضعية محددة بالرسم البياني

على عكس النص ، لا توجد رسوم بيانية بترتيب固有 ، مما يجعل ترميز الموضع ، وهو تقنيات لتحقيق المعلومات الهيكلية أو الموقع في النموذج ، غير متوافق. تتعامل محولات الرسم البياني مع هذه التحديات بطرق مختلفة:

متجهات لابلاس: مشتقة من مصفوفة لابلاس للرسم البياني ، توفر هذه التضمين الطيفي الذي يلتقط الهيكل العام.
المشي العشوائي: يلتقط احتمال الانتقال من عقدة إلى أخرى عبر العديد من القفزات.
ترميزات هيكلية: تشمل مقاييس المسافة ، ودرجات العقد ، أو أنواع الحواف.

توفير هذه الترميزات الموضعية ، سواء كانت طيفية أو احتمالية أو هيكلية ، لمحولات الرسم البياني طريقة لفهم مكان كل عقدة في الرسم البياني الأوسع. هذا الوعي الهيكلي ضروري لتمكين آليات الانتباه من العمل بشكل معنوي عبر البيانات غير المنتظمة وغير المترتبة ، في النهاية مما يسمح للنموذج بتقاط علاقات ستكون غير مرئية للأسلوب المحلي البسيط.

تنفيذ حقيقي وتطبيقات الحالة

يحتاج جلب محولات الرسم البياني إلى الإنتاج إلى بنية تحتية يمكنها التوسع إلى أحجام البيانات في العالم الحقيقي. المكتبات مثل PyTorch Geometric (PyG) تجعل ذلك ممكنًا. مبني على PyTorch ، يوفر PyG إطارًا قائمًا على الوحدات لتنفيذ GNNs ومحولات الرسم البياني عبر مجموعة من التطبيقات ، من نمذجة الجزيئات إلى أنظمة التوصية. يدعم تدريب الميني باتش على كلا الرسوم البيانية الصغيرة العديدة والرسم البياني الكبير الواحد ، مع دعم متعددي GPU و torch.compile ، مما يجعله مناسبًا للتدفقات البحثية والشركات على حد سواء.

تتم صيانة هذه الأدوات بالفعل بواسطة مجموعة واسعة من التطبيقات في العالم الحقيقي. في اكتشاف الأدوية ، تساعد محولات الرسم البياني على التنبؤ بالخصائص الجزيئية عن طريق نمذجة التفاعلات الذرية كرسوم بيانية. في تحسين اللوجستيات و سلسلة التوريد ، يمكنها تمثيل التفكير في الشبكات الديناميكية للشحنات والمستودعات والطرق. تستخدم الشركات التجارية الإلكترونية لتحسين التوصيات من خلال فهم سلوك الشراء المشترك والتصفح كرسوم بيانية علاقة. وفي الأمن السيبراني ، يتم استخدام نماذج قائمة على الرسم البياني لاكتشاف الشذوذ عن طريق تحليل أنماط الوصول وطوبولوجيا الشبكة وتسلسل الأحداث.

في كل هذه الإعدادات ، يثبت القدرة على التعلم من الهياكل المعقدة والمتواصلة ، دون الاعتماد فقط على الميزات المصممة يدويًا ، أنه ميزة كبيرة.

الاعتبارات الفنية

على الرغم من إمكانياتها ، تأتي محولات الرسم البياني مع تبادلات هندسية حقيقية. يزيد الانتباه الذاتي الكامل بشكل مربع مع عدد العقد ، مما يجعل كفاءة الذاكرة و الحوسبة قلقًا رئيسيًا ، خاصة للرسوم البيانية الكبيرة أو الكثيفة. تحتوي العديد من الرسوم البيانية في العالم الحقيقي أيضًا على حواف اتجاهية ، مما يُضيف تعقيدات لتحديد كيفية ترميز المعلومات الهيكلية. وفي التطبيقات العملية ، فإن المدخلات نادرًا ما تكون موحدة: ي đòi من دمج البيانات المهيكلة بالرسم البياني مع النص أو السلاسل الزمنية أو الصور خيارات معمارية محددة وعمليات تحويل بيانات قوية.

ليست هذه التحديات غير قابلة للتغلب ، ولكنها تتطلب تصميم نظام متعمق ، خاصة عند الانتقال من نماذج البحث إلى نماذج جاهزة للإنتاج.

ماذا بعد: LLMs تلتقي بالرسوم البيانية

اتجاه بحثي رئيسي هو دمج نماذج اللغة الكبيرة (LLMs) مع هياكل الرسم البياني. تستخدم هذه الأنظمة الهجينة LLMs لترميز السياق النصي أو استخراج الكيانات ، ثم تؤسس هذه المعلومات في رسم بياني للتفكير و اتخاذ القرارات.

في الأحياء ، قامت هذه الأدوات بتشغيل أدوات مثل AlphaFold. في الذكاء الاصطناعي للشركات ، يُمكنها تمكين أنظمة الدعم للعملاء التي تجمع بين الوثائق وسلوك الرسوم البيانية. تلعب محولات الرسم البياني دورًا متزايدًا في تمكين وكلاء الذكاء الاصطناعي من اتخاذ قرارات أكثر ذكاءً وفعّالة من خلال السماح لهم بالتفكير في تمثيلات الحالة المهيكلة وتحديد الأولويات للتفاعلات بشكل ديناميكي. يساعد هذا الاندماج وكلاء على فهم العلاقات الهرمية بشكل أفضل ، وتتبع التبعيات بمرور الوقت ، وتعديل سلوكهم في البيئات المعقدة.

المجال لا يزال في مرحلة التطور ، ولكن الإمكانات كبيرة.

الخلاصة

محولات الرسم البياني ليست مجرد تكرار ل GNNs ؛ فهي تمثل تقاربًا للانتباه والهيكل والقدرة على التوسع. سواء كنت تعمل في المالية أو العلوم الحية أو أنظمة التوصية ، الرسالة واضحة: بياناتك تشكل رسمًا بيانيًا ، لذلك يجب أن يكون نموذجك كذلك.

Dr. Jure Leskovec, Chief Scientist and Co-Founder of Kumo

الدكتور جوري ليسكوفيك هو الرئيس العلمي والشريك المؤسس لشركة Kumo، وهي شركة رائدة في مجال الذكاء الاصطناعي التنبؤي. وهو أستاذ علوم الحاسوب في جامعة ستانفورد، حيث يعلم لمدة تزيد عن 15 عامًا. شارك جوري في إنشاء شبكات العصبية الرسومية وتفاني مسيرته المهنية في تطوير كيفية تعلم الذكاء الاصطناعي من المعلومات المترابطة. شغل منصب الرئيس العلمي في شركة Pinterest وأجرى أبحاثًا حائزة على جوائز في شركة Yahoo وشركة Microsoft.