saplama Lineer Regresyon Nedir? - Unite.AI
Bizimle iletişime geçin

AI 101

Doğrusal Regresyon nedir?

mm
Güncellenmiş on

Doğrusal Regresyon nedir?

Doğrusal regresyon, bir durumu tahmin etmek veya görselleştirmek için kullanılan bir algoritmadır. iki farklı özellik/değişken arasındaki ilişki. Doğrusal regresyon görevlerinde, incelenen iki tür değişken vardır: bağımlı değişken ve bağımsız değişken. Bağımsız değişken, diğer değişkenden etkilenmeyen, kendi başına duran değişkendir. Bağımsız değişken ayarlandığında, bağımlı değişkenin seviyeleri dalgalanacaktır. Bağımlı değişken, üzerinde çalışılan değişkendir ve regresyon modelinin tahmin etmek için çözdüğü/tahmin etmeye çalıştığı şeydir. Doğrusal regresyon görevlerinde, her gözlem/örnek hem bağımlı değişken değerinden hem de bağımsız değişken değerinden oluşur.

Bu, lineer regresyonun hızlı bir açıklamasıydı, ancak bir örneğe bakarak ve kullandığı formülü inceleyerek lineer regresyonu daha iyi anladığımızdan emin olalım.

Doğrusal Regresyonu Anlamak

Sabit sürücü boyutlarını ve bu sabit sürücülerin maliyetini kapsayan bir veri setimiz olduğunu varsayalım.

Elimizdeki veri setinin bellek miktarı ve maliyet olmak üzere iki farklı özellikten oluştuğunu varsayalım. Bir bilgisayar için ne kadar çok bellek satın alırsak, satın alma maliyeti o kadar artar. Bireysel veri noktalarını bir dağılım grafiğinde çizersek, şuna benzer bir grafik elde edebiliriz:

Tam bellek-maliyet oranı, üreticilere ve sabit sürücü modellerine göre değişebilir, ancak genel olarak, verilerin eğilimi sol alttan başlar (sabit sürücülerin hem daha ucuz hem de daha küçük kapasiteye sahip olduğu yer) ve sağ üst (sürücülerin daha pahalı olduğu ve daha yüksek kapasiteye sahip olduğu yer).

X ekseninde bellek miktarına ve Y ekseninde maliyete sahip olsaydık, X ve Y değişkenleri arasındaki ilişkiyi yakalayan bir çizgi sol alt köşeden başlar ve sağ üst köşeye doğru devam ederdi.

Bir regresyon modelinin işlevi, iki değişken arasındaki ilişkiyi en iyi tanımlayan X ve Y değişkenleri arasındaki doğrusal bir işlevi belirlemektir. Doğrusal regresyonda, Y'nin girdi değişkenlerinin bazı kombinasyonlarından hesaplanabileceği varsayılır. Girdi değişkenleri (X) ile hedef değişkenler (Y) arasındaki ilişki, grafikteki noktalardan bir çizgi çekilerek gösterilebilir. Çizgi, X ve Y arasındaki ilişkiyi en iyi tanımlayan işlevi temsil eder (örneğin, X her 3 arttığında, Y her 2 arttığında). Amaç, optimal bir "gerileme çizgisi" veya verilere en iyi uyan çizgi/fonksiyonu bulmaktır.

Çizgiler tipik olarak şu denklemle temsil edilir: Y = m*X + b. X bağımlı değişkeni, Y ise bağımsız değişkeni ifade eder. Bu arada m, "koşu" üzerindeki "yükseliş" ile tanımlanan çizginin eğimidir. Makine öğrenimi uygulayıcıları ünlü eğim çizgisi denklemini biraz farklı bir şekilde temsil ediyor ve bunun yerine şu denklemi kullanıyor:

y(x) = w0 + w1 * x

Yukarıdaki denklemde y hedef değişken, “w” modelin parametreleri ve girdi “x”. Denklem şu şekilde okunur: “X'e bağlı olarak Y'yi veren fonksiyon, modelin parametrelerinin özelliklerle çarpımına eşittir”. Modelin parametreleri, en uygun regresyon çizgisini elde etmek için eğitim sırasında ayarlanır.

Çoklu doğrusal regresyon

Fotoğraf: Wikimedia Commons aracılığıyla Cbaf, Public Domain (https://commons.wikimedia.org/wiki/File:2d_multiple_linear_regression.gif)

Yukarıda açıklanan süreç, basit doğrusal regresyon veya yalnızca tek bir özelliğin/bağımsız değişkenin olduğu veri kümelerinde regresyon için geçerlidir. Bununla birlikte, birden fazla öznitelik ile de bir regresyon yapılabilir. Bu durumuda "Çoklu doğrusal regresyonDenklem, veri kümesinde bulunan değişken sayısı kadar genişletilir. Başka bir deyişle, düzenli doğrusal regresyon denklemi y(x) = w0 + w1 * x iken, çoklu doğrusal regresyon denklemi y(x) = w0 + w1x1 artı çeşitli özellikler için ağırlıklar ve girdiler olacaktır. Toplam ağırlık ve özellik sayısını w(n)x(n) olarak gösterirsek, formülü şu şekilde gösterebiliriz:

y(x) = w0 + w1x1 + w2x2 + … + w(n)x(n)

Doğrusal regresyon formülünü oluşturduktan sonra makine öğrenimi modeli, farklı uyum çizgileri çizerek ağırlıklar için farklı değerler kullanacaktır. Hedefin, olası ağırlık kombinasyonlarından hangisinin (ve dolayısıyla hangi olası doğrunun) verilere en iyi uyduğunu belirlemek ve değişkenler arasındaki ilişkiyi açıklamak için verilere en uygun doğruyu bulmak olduğunu unutmayın.

Belirli bir ağırlık değeri verildiğinde varsayılan Y değerlerinin gerçek Y değerlerine ne kadar yakın olduğunu ölçmek için bir maliyet işlevi kullanılır. maliyet fonksiyonu doğrusal regresyon için, veri kümesindeki çeşitli veri noktalarının tümü için tahmin edilen değer ile gerçek değer arasındaki ortalama (karelenmiş) hatayı alan ortalama karesel hatadır. Maliyet işlevi, tahmin edilen hedef değer ile gerçek hedef değer arasındaki farkı yakalayan bir maliyeti hesaplamak için kullanılır. Sığdırma çizgisi veri noktalarından uzaktaysa, maliyet daha yüksek olurken, çizgi değişkenler arasındaki gerçek ilişkileri yakalamaya yaklaştıkça maliyet azalır. Modelin ağırlıkları daha sonra en küçük hata miktarını üreten ağırlık konfigürasyonu bulunana kadar ayarlanır.

Uzmanlık alanlarına sahip blogcu ve programcı Makine öğrenme ve Derin Öğrenme konular. Daniel, başkalarının yapay zekanın gücünü toplumsal fayda için kullanmasına yardım etmeyi umuyor.