الذكاء الاصطناعي 101
ما هي الانحدار الخطي؟

ما هي الانحدار الخطي؟
الانحدار الخطي هو خوارزمية تستخدم للتنبؤ أو تصور ، علاقة بين ميزتين / متغيرين مختلفين . في مهام الانحدار الخطي ، هناك نوعان من المتغيرات قيد الفحص: المتغير التابع والمتغير المستقل. المتغير المستقل هو المتغير الذي يقف بمفرده ، غير متأثر بالمتغير الآخر. مع تعديل المتغير المستقل ، ستتقلب مستويات المتغير التابع. المتغير التابع هو المتغير الذي يتم دراسته ، وهو ما يحلله modèle الانحدار / يحاول التنبؤ به. في مهام الانحدار الخطي ، يتكون كل ملاحظة / مثيل من قيمة المتغير التابع وقيمة المتغير المستقل.
كان ذلك شرحًا سريعًا للانحدار الخطي ، ولكن دعونا نتأكد من أننا نصل إلى فهم أفضل للانحدار الخطي من خلال النظر في مثال عليه ودراسة الصيغة التي يستخدمها.
فهم الانحدار الخطي
افترض أن لدينا مجموعة بيانات تغطي أحجام الأقراص الصلبة وتكلفة تلك الأقراص الصلبة.
دعونا نفترض أن مجموعة البيانات التي لدينا تتكون من ميزتين مختلفتين: كمية الذاكرة وتكلفة. كلما اشترينا ذاكرة أكثر للحاسوب ، زادت تكلفة الشراء. إذا قمنا بتركيب نقاط البيانات الفردية على مخطط مبثر ، قد نحصل على مخطط يبدو مثل هذا:

قد تختلف نسبة الذاكرة إلى التكلفة بدقة بين المصنعين وأصناف الأقراص الصلبة ، ولكن بشكل عام ، اتجاه البيانات هو اتجاه يبدأ في الزاوية اليسرى السفلى (حيث تكون الأقراص الصلبة أرخص وأقل سعة) ويتحرك إلى الزاوية العلوية اليمنى (حيث تكون الأقراص أكثر تكلفة وأعلى سعة).
إذا كان لدينا كمية الذاكرة على المحور السيني وتكلفة على المحور الصادي ، فإن خطًا يلتقط العلاقة بين متغيرات X و Y سوف يبدأ في الزاوية السفلى اليسرى ويتحرك إلى الزاوية العلوية اليمنى.

وظيفة modèle الانحدار هي تحديد وظيفة خطية بين متغيرات X و Y التي تصف بشكل أفضل العلاقة بين المتغيرين. في الانحدار الخطي ، يفترض أن Y يمكن حسابه من بعض组合ات المتغيرات الإدخال. يمكن تمثيل العلاقة بين المتغيرات الإدخال (X) والمتغيرات الهدف (Y) برسم خط عبر النقاط في الرسم البياني. ي代表 الخط الوظيفة التي تصف بشكل أفضل العلاقة بين X و Y (على سبيل المثال ، لكل مرة تزيد X بمقدار 3 ، تزيد Y بمقدار 2). الهدف هو العثور على خط انحدار مثالي ، أو الخط / الوظيفة التي تتناسب بشكل أفضل مع البيانات.
الخطوط تمثل عادةً بالمعادلة: Y = m * X + b. تشير X إلى المتغير التابع بينما Y هو المتغير المستقل. في حين أن m هو منحدر الخط ، كما هو محدد بواسطة “الارتفاع” على “الجري”. يمثل ممارسو التعلم الآلي معادلة منحدر الخط الشهيرة بطريقة مختلفة قليلاً ، باستخدام هذه المعادلة بدلاً من ذلك:
y(x) = w0 + w1 * x
في المعادلة السابقة ، y هو المتغير الهدف بينما “w” هي معلمات modèle والمدخل هو “x”. لذلك ، تقرأ المعادلة على أنها: “الوظيفة التي تمنح Y ، اعتمادًا على X ، تساوي معلمات modèle مضروبة في الميزات”. يتم تعديل معلمات modèle خلال التدريب للحصول على خط انحدار أفضل.
الانحدار الخطي المتعدد

صورة: Cbaf عبر ويكيميديا كومنز ، النطاق العام (https://commons.wikimedia.org/wiki/File:2d_multiple_linear_regression.gif)
العمليات الموصوفة أعلاه تنطبق على الانحدار الخطي البسيط ، أو الانحدار على مجموعات بيانات حيث هناك متغير مستقل واحد فقط. ومع ذلك ، يمكن أيضًا إجراء انحدار مع متغيرات متعددة. في حالة “الانحدار الخطي المتعدد” ، يتم تمديد المعادلة بواسطة عدد المتغيرات الموجودة في مجموعة البيانات. بعبارة أخرى ، بينما تكون معادلة الانحدار الخطي العادي y(x) = w0 + w1 * x ، تكون معادلة الانحدار الخطي المتعدد y(x) = w0 + w1x1 плюس الأوزان والإدخالات للميزات المختلفة. إذا قمنا بتمثيل العدد الإجمالي للأوزان والميزات على أنه w(n)x(n) ، يمكننا تمثيل الصيغة على النحو التالي:
y(x) = w0 + w1x1 + w2x2 + … + w(n)x(n)
بعد تحديد معادلة الانحدار الخطي ، يستخدم modèle التعلم الآلي قيمًا مختلفة للأوزان ، مما يؤدي إلى رسم خطوط تتناسب بشكل مختلف. تذكر أن الهدف هو العثور على الخط الذي يتناسب بشكل أفضل مع البيانات من أجل تحديد أي من مجموعات الأوزان الممكنة (والخط الممكن) يتناسب بشكل أفضل مع البيانات ويفسر العلاقة بين المتغيرات.
يتم استخدام دالة التكلفة لقياس مدى قرب قيم Y المفترضة من قيم Y الفعلية عند استخدام قيمة وزن معينة. دالة التكلفة للانحدار الخطي هي متوسط مربع الخطأ ، الذي يأخذ متوسط مربع الخطأ بين القيمة المتوقعة والقيمة الحقيقية لجميع نقاط البيانات في مجموعة البيانات. يتم استخدام دالة التكلفة لحساب التكلفة ، والتي تلتقط الفرق بين قيمة الهدف المتوقعة والقيمة الحقيقية للهدف. إذا كان خط التطابق بعيدًا عن نقاط البيانات ، تكون التكلفة أعلى ، بينما تصبح التكلفة أصغر كلما اقترب الخط من التقاط العلاقات الحقيقية بين المتغيرات. ثم يتم تعديل أوزان modèle حتى يتم العثور على تكوين الوزن الذي ينتج عن أصغر قدر من الخطأ.












