AI 101

Üretken ve Ayrımcı Makine Öğrenimi Modelleri

Güncellenmiş on Ocak 2, 2021

Bazı makine öğrenimi modelleri "üretken" veya "ayrımcı" model kategorilerine aittir. Yine de ne arasındaki fark bu iki model kategorisi? Bir modelin ayrımcı veya üretken olması ne anlama gelir?

Kısa cevap, üretken modellerin veri setinin dağılımını içeren ve belirli bir örnek için bir olasılık döndüren modeller olduğudur. Üretken modeller genellikle bir dizide daha sonra ne olacağını tahmin etmek için kullanılır. Bu arada, ayrımcı modeller, sınıflandırma veya regresyon için kullanılır ve bir tahmin döndürürler. şartlı dayalı olasılık. Üretken ve ayırt edici modeller arasındaki farkları daha ayrıntılı inceleyelim, böylece iki model türünü ayıranın ne olduğunu ve her türün ne zaman kullanılması gerektiğini gerçekten anlayabiliriz.

Üretken ve Ayrımcı Modeller

Bir makine öğrenimi modelini kategorize etmenin çeşitli yolları vardır. Bir model, üretken modeller, ayırt edici modeller, parametrik modeller, parametrik olmayan modeller, ağaç tabanlı modeller, ağaç tabanlı olmayan modeller gibi farklı kategorilere ait olarak sınıflandırılabilir.

Bu makale, üretici modeller ile ayrımcı modeller arasındaki farklara odaklanacaktır. Hem üretken hem de ayrımcı modelleri tanımlayarak başlayacağız ve ardından her bir model tipinin bazı örneklerini inceleyeceğiz.

Üretken Modeller

üretici modeller veri kümesi içindeki sınıfların dağılımına odaklananlardır. Makine öğrenimi algoritmaları tipik olarak veri noktalarının dağılımını modeller. Üretken modeller ortak olasılık bulmaya dayanır. Belirli bir giriş özelliğinin ve istenen bir çıktının/etiketin aynı anda var olduğu noktalar oluşturma.

Üretken modeller tipik olarak olasılıkları ve olasılığı tahmin etmek, veri noktalarını modellemek ve bu olasılıklara dayalı olarak sınıflar arasında ayrım yapmak için kullanılır. Model, veri kümesi için bir olasılık dağılımı öğrendiğinden, yeni veri örnekleri oluşturmak için bu olasılık dağılımına başvurabilir. Üretken modeller genellikle Bayes teoremi ortak olasılığı bulmak için, p(x,y) bulma. Esasen, üretken modeller, verilerin nasıl üretildiğini modeller, aşağıdaki soruyu yanıtlayın:

"Bu sınıfın veya başka bir sınıfın bu veri noktasını/örneği oluşturma olasılığı nedir?"

Üretken makine öğrenimi modellerinin örnekleri arasında Doğrusal Ayrım Analizi (LDA), Gizli Markov modelleri ve Naive Bayes gibi Bayes ağları yer alır.

Ayrımcı Modeller

Üretken modeller veri kümesinin dağılımını öğrenirken, ayrımcı modeller bir veri kümesindeki sınıflar arasındaki sınırı öğrenin. Ayrımcı modellerde amaç, karar sınırı veri örneklerine güvenilir sınıf etiketleri uygulamak için sınıflar arasında. Ayrımcı modeller, bireysel veri noktaları hakkında herhangi bir varsayımda bulunmadan koşullu olasılık kullanarak veri kümesindeki sınıfları ayırır.

Ayrımcı modeller aşağıdaki soruyu cevaplamak için yola çıktı:

"Bu örnek karar sınırının hangi tarafında bulunuyor?"

Makine öğrenimindeki ayırt edici modellerin örnekleri arasında destek vektör makineleri, lojistik regresyon, karar ağaçları ve rastgele ormanlar yer alır.

Üretken ve Ayrımcı Arasındaki Farklar

İşte üretken ve ayrımcı modeller arasındaki temel farkların hızlı bir özeti.

Üretken modeller:

Üretken modeller, veri kümesindeki sınıfların gerçek dağılımını yakalamayı amaçlar.
Üretken modeller, Bayes Teoremini kullanarak ortak olasılık dağılımını (p(x,y)) tahmin eder.
Üretken modeller, ayrımcı modellere kıyasla hesaplama açısından pahalıdır.
Üretken modeller, denetimsiz makine öğrenimi görevleri için kullanışlıdır.
Üretken modeller, ayırt edici modellere göre aykırı değerlerin varlığından daha fazla etkilenir.

Ayrımcı modeller:

Ayrımcı modeller, veri kümesi sınıfları için karar sınırını modeller.
Ayrımcı modeller koşullu olasılığı öğrenir – p(y|x).
Ayrımcı modeller, üretken modellere kıyasla hesaplama açısından ucuzdur.
Ayrımcı modeller, denetimli makine öğrenimi görevleri için kullanışlıdır.
Ayrımcı modeller, üretken modellerin aksine, aykırı değerlere karşı daha sağlam olma avantajına sahiptir.
Ayrımcı modeller, üretken modellere kıyasla aykırı değerlere karşı daha dayanıklıdır.

Şimdi üretken ve ayrımcı makine öğrenimi modellerinin bazı farklı örneklerini kısaca inceleyeceğiz.

Üretken Modellere Örnekler

Doğrusal Ayırım Analizi (LDA)

LDA modelleri veri kümesindeki her sınıf için verilerin varyansını ve ortalamasını tahmin ederek işlev. Her sınıf için ortalama ve varyanslar hesaplandıktan sonra, belirli bir girdi kümesinin belirli bir sınıfa ait olma olasılığı tahmin edilerek tahminler yapılabilir.

Gizli Markov Modelleri

Markov Zincirleri zincirdeki bir noktadan, bir “durumdan” başka bir duruma geçmemizin ne kadar olası olduğunu gösteren olasılıklara sahip grafikler olarak düşünülebilir. Markov zincirleri, p(i,j) olarak gösterilebilen j durumundan i durumuna geçme olasılığını belirlemek için kullanılır. Bu sadece yukarıda belirtilen ortak olasılıktır. Gizli Markov Modeli, görünmez, gözlemlenemez bir Markov zincirinin kullanıldığı yerdir. Veri girişleri modele verilir ve mevcut durum ile ondan hemen önceki durum için olasılıklar en olası sonucu hesaplamak için kullanılır.

Bayes Ağları

Bayes ağları bir tür olasılıksal grafik modeldir. Yönlendirilmiş Asiklik Grafik ile temsil edildiği gibi, değişkenler arasındaki koşullu bağımlılıkları temsil ederler. Bir Bayes ağında, grafiğin her bir kenarı koşullu bir bağımlılığı temsil eder ve her düğüm benzersiz bir değişkene karşılık gelir. Grafikteki benzersiz ilişkiler için koşullu bağımsızlık, değişkenlerin ortak dağılımını belirlemek ve ortak olasılığı hesaplamak için kullanılabilir. Başka bir deyişle, bir Bayes ağı, belirli bir ortak olasılık dağılımındaki bağımsız ilişkilerin bir alt kümesini yakalar.

Rastgele Değişkenler, Koşullu İlişkiler ve Olasılık Dağılımları bilinen bir Bayes ağı oluşturulduğunda ve uygun şekilde tanımlandığında, olayların veya sonuçların olasılığını tahmin etmek için kullanılabilir.

Bayes Ağlarının en sık kullanılan türlerinden biri Naive Bayes modelidir. Bir Naive Bayes modeli, tüm özellikleri birbirinden bağımsız olarak ele alarak birçok parametreye/değişkene sahip veri kümeleri için olasılık hesaplama zorluğunu ele alır.

Ayrımcı Modellere Örnekler

Vektör makineleri desteklemek

Vektör makineleri desteklemek veri kümesindeki farklı sınıfları en iyi ayıran karar sınırını bularak veri noktaları arasında bir karar sınırı çizerek çalışır. SVM algoritması, sırasıyla 2 boyutlu uzaylar ve 3 boyutlu uzaylar için noktaları ayıran çizgiler veya hiperdüzlemler çizer. DVM, marjı veya çizgi/hiperdüzlem arasındaki en yakın noktalara olan mesafeyi maksimize etmeye çalışarak sınıfları en iyi ayıran çizgiyi/hiperdüzlemi bulmaya çalışır. SVM modelleri, doğrusal olmayan karar sınırlarını belirlemek için "çekirdek hilesi" kullanılarak doğrusal olarak ayrılamayan veri kümelerinde de kullanılabilir.

Lojistik regresyon

Lojistik regresyon bir girdinin iki durumdan birinde olma olasılığını belirlemek için bir logit (log-odds) işlevi kullanan bir algoritmadır. Olasılığı 0 veya 1'e, doğru veya yanlışa doğru "ezmek" için bir sigmoid işlevi kullanılır. 0.50'den büyük olasılıklar sınıf 1 olarak kabul edilirken, 0.49 veya daha düşük olasılıklar 0 olarak kabul edilir. Bu nedenle, ikili sınıflandırma problemlerinde genellikle lojistik regresyon kullanılır. Bununla birlikte, bire karşı hepsi yaklaşımı kullanılarak, her sınıf için bir ikili sınıflandırma modeli oluşturarak ve bir örneğin hedef sınıf veya veri kümesindeki başka bir sınıf olma olasılığını belirleyerek çok sınıflı problemlere lojistik regresyon uygulanabilir.

Karar ağacı

A karar ağacı model, bir veri kümesini giderek daha küçük parçalara bölerek çalışır ve alt kümeler daha fazla bölünemez hale geldiğinde sonuç, düğümleri ve yaprakları olan bir ağaçtır. Bir karar ağacındaki düğümler, veri noktalarıyla ilgili kararların farklı filtreleme kriterleri kullanılarak verildiği yerdir. Bir karar ağacındaki yapraklar, sınıflandırılmış veri noktalarıdır. Karar ağacı algoritmaları hem sayısal hem de kategorik verileri işleyebilir ve ağaçtaki bölmeler belirli değişkenlere/özelliklere dayalıdır.

Rasgele Ormanlar

A rastgele orman modeli temelde, nihai bir karara varmak için tek tek ağaçların tahminlerinin ortalamasının alındığı bir karar ağaçları koleksiyonudur. Rastgele orman algoritması, gözlemleri ve özellikleri rastgele seçer ve bu seçimlere dayalı olarak tek tek ağaçları oluşturur.

Bu öğretici makale, Matplotlib'de bir Kutu Grafiğinin nasıl oluşturulacağını keşfedecektir. Kutu grafikleri, bir veri kümesinin özet istatistiklerini görselleştirmek için kullanılır ve verilerin aralığı ve dağılımı gibi dağılımın özniteliklerini görüntüler.

İlgili konular:ayrımcı modeller üretken modeller

Bir sonraki

Gradyan Yükseltme nedir?

Kaçırmayın

Siber Güvenlik Nedir?

daniel nelson

Uzmanlık alanlarına sahip blogcu ve programcı Makine öğrenme ve Derin Öğrenme konular. Daniel, başkalarının yapay zekanın gücünü toplumsal fayda için kullanmasına yardım etmeyi umuyor.