- Terminoloji (A'dan D'ye)
- Yapay Zeka Yetenek Kontrolü
- Yapay Zeka Operasyonları
- Albümmentasyonlar
- Varlık Performansı
- Otomatik kodlayıcı
- Geri yayılım
- Bayes teoremi
- büyük Veri
- Chatbot: Başlangıç Kılavuzu
- Bilişimsel Düşünme
- Bilgisayar görüşü
- Karışıklık Matrisi
- Dönüşümlü Sinir Ağları
- Siber güvenlik
- Veri Dokusu
- Veri Hikayesi Anlatımı
- Veri Bilim
- Veri depolama
- Karar ağacı
- Deepfakes
- Derin Öğrenme
- Derin Takviye Öğrenme
- DevOps
- DevSecOps
- Difüzyon Modelleri
- Dijital İkiz
- Boyutsal küçülme
- Terminoloji (E'den K'ye)
- Kenar AI
- AI duygu
- Topluluk Öğrenimi
- Etik hackleme
- ETL
- Açıklanabilir AI
- Federe Öğrenme
- FinOps
- üretken yapay zeka
- Jeneratör Düşman Ağı
- Üretken ve Ayrımcı
- Gradyan Arttırma
- Dereceli alçalma
- Birkaç Adımda Öğrenme
- Görüntü Sınıflandırması
- BT İşlemleri (ITOps)
- Olay Otomasyonu
- Etki Mühendisliği
- K-Kümeleme Demektir
- K-En Yakın Komşular
- Terminoloji (L'den Q'ya)
- Terminoloji (R'den Z'ye)
AI 101
Doğrusal Regresyon nedir?
Içindekiler
Doğrusal Regresyon nedir?
Doğrusal regresyon, bir durumu tahmin etmek veya görselleştirmek için kullanılan bir algoritmadır. iki farklı özellik/değişken arasındaki ilişki. Doğrusal regresyon görevlerinde, incelenen iki tür değişken vardır: bağımlı değişken ve bağımsız değişken. Bağımsız değişken, diğer değişkenden etkilenmeyen, kendi başına duran değişkendir. Bağımsız değişken ayarlandığında, bağımlı değişkenin seviyeleri dalgalanacaktır. Bağımlı değişken, üzerinde çalışılan değişkendir ve regresyon modelinin tahmin etmek için çözdüğü/tahmin etmeye çalıştığı şeydir. Doğrusal regresyon görevlerinde, her gözlem/örnek hem bağımlı değişken değerinden hem de bağımsız değişken değerinden oluşur.
Bu, lineer regresyonun hızlı bir açıklamasıydı, ancak bir örneğe bakarak ve kullandığı formülü inceleyerek lineer regresyonu daha iyi anladığımızdan emin olalım.
Doğrusal Regresyonu Anlamak
Sabit sürücü boyutlarını ve bu sabit sürücülerin maliyetini kapsayan bir veri setimiz olduğunu varsayalım.
Elimizdeki veri setinin bellek miktarı ve maliyet olmak üzere iki farklı özellikten oluştuğunu varsayalım. Bir bilgisayar için ne kadar çok bellek satın alırsak, satın alma maliyeti o kadar artar. Bireysel veri noktalarını bir dağılım grafiğinde çizersek, şuna benzer bir grafik elde edebiliriz:
Tam bellek-maliyet oranı, üreticilere ve sabit sürücü modellerine göre değişebilir, ancak genel olarak, verilerin eğilimi sol alttan başlar (sabit sürücülerin hem daha ucuz hem de daha küçük kapasiteye sahip olduğu yer) ve sağ üst (sürücülerin daha pahalı olduğu ve daha yüksek kapasiteye sahip olduğu yer).
X ekseninde bellek miktarına ve Y ekseninde maliyete sahip olsaydık, X ve Y değişkenleri arasındaki ilişkiyi yakalayan bir çizgi sol alt köşeden başlar ve sağ üst köşeye doğru devam ederdi.
Bir regresyon modelinin işlevi, iki değişken arasındaki ilişkiyi en iyi tanımlayan X ve Y değişkenleri arasındaki doğrusal bir işlevi belirlemektir. Doğrusal regresyonda, Y'nin girdi değişkenlerinin bazı kombinasyonlarından hesaplanabileceği varsayılır. Girdi değişkenleri (X) ile hedef değişkenler (Y) arasındaki ilişki, grafikteki noktalardan bir çizgi çekilerek gösterilebilir. Çizgi, X ve Y arasındaki ilişkiyi en iyi tanımlayan işlevi temsil eder (örneğin, X her 3 arttığında, Y her 2 arttığında). Amaç, optimal bir "gerileme çizgisi" veya verilere en iyi uyan çizgi/fonksiyonu bulmaktır.
Çizgiler tipik olarak şu denklemle temsil edilir: Y = m*X + b. X bağımlı değişkeni, Y ise bağımsız değişkeni ifade eder. Bu arada m, "koşu" üzerindeki "yükseliş" ile tanımlanan çizginin eğimidir. Makine öğrenimi uygulayıcıları ünlü eğim çizgisi denklemini biraz farklı bir şekilde temsil ediyor ve bunun yerine şu denklemi kullanıyor:
y(x) = w0 + w1 * x
Yukarıdaki denklemde y hedef değişken, “w” modelin parametreleri ve girdi “x”. Denklem şu şekilde okunur: “X'e bağlı olarak Y'yi veren fonksiyon, modelin parametrelerinin özelliklerle çarpımına eşittir”. Modelin parametreleri, en uygun regresyon çizgisini elde etmek için eğitim sırasında ayarlanır.
Çoklu doğrusal regresyon
Yukarıda açıklanan süreç, basit doğrusal regresyon veya yalnızca tek bir özelliğin/bağımsız değişkenin olduğu veri kümelerinde regresyon için geçerlidir. Bununla birlikte, birden fazla öznitelik ile de bir regresyon yapılabilir. Bu durumuda "Çoklu doğrusal regresyonDenklem, veri kümesinde bulunan değişken sayısı kadar genişletilir. Başka bir deyişle, düzenli doğrusal regresyon denklemi y(x) = w0 + w1 * x iken, çoklu doğrusal regresyon denklemi y(x) = w0 + w1x1 artı çeşitli özellikler için ağırlıklar ve girdiler olacaktır. Toplam ağırlık ve özellik sayısını w(n)x(n) olarak gösterirsek, formülü şu şekilde gösterebiliriz:
y(x) = w0 + w1x1 + w2x2 + … + w(n)x(n)
Doğrusal regresyon formülünü oluşturduktan sonra makine öğrenimi modeli, farklı uyum çizgileri çizerek ağırlıklar için farklı değerler kullanacaktır. Hedefin, olası ağırlık kombinasyonlarından hangisinin (ve dolayısıyla hangi olası doğrunun) verilere en iyi uyduğunu belirlemek ve değişkenler arasındaki ilişkiyi açıklamak için verilere en uygun doğruyu bulmak olduğunu unutmayın.
Belirli bir ağırlık değeri verildiğinde varsayılan Y değerlerinin gerçek Y değerlerine ne kadar yakın olduğunu ölçmek için bir maliyet işlevi kullanılır. maliyet fonksiyonu doğrusal regresyon için, veri kümesindeki çeşitli veri noktalarının tümü için tahmin edilen değer ile gerçek değer arasındaki ortalama (karelenmiş) hatayı alan ortalama karesel hatadır. Maliyet işlevi, tahmin edilen hedef değer ile gerçek hedef değer arasındaki farkı yakalayan bir maliyeti hesaplamak için kullanılır. Sığdırma çizgisi veri noktalarından uzaktaysa, maliyet daha yüksek olurken, çizgi değişkenler arasındaki gerçek ilişkileri yakalamaya yaklaştıkça maliyet azalır. Modelin ağırlıkları daha sonra en küçük hata miktarını üreten ağırlık konfigürasyonu bulunana kadar ayarlanır.
Uzmanlık alanlarına sahip blogcu ve programcı Makine öğrenme ve Derin Öğrenme konular. Daniel, başkalarının yapay zekanın gücünü toplumsal fayda için kullanmasına yardım etmeyi umuyor.