Connect with us

Yapay Zekâ 101

Üretken vs. Ayrımcı Makine Öğrenimi Modelleri

mm

Bazı makine öğrenimi modelleri ya “üretken” ya da “ayrımcı” model kategorilerine aittir. Ancak bu iki model kategorisi arasındaki fark nedir? Bir modelün ayrımcı veya üretken olması ne anlama gelir?

Kısa cevap, üretken modellerin veri kümesinin dağılımını içerdiği, bir örnek için bir olasılık döndürdüğüdür. Üretken modeller genellikle bir dizide neler olacağına dair tahminlerde bulunmak için kullanılır. Öte yandan, ayrımcı modeller sınıflandırma veya regresyon için kullanılır ve koşullu olasılığa dayalı bir tahmin döndürür. Üretken ve ayrımcı modeller arasındaki farkları daha detaylı olarak inceleyelim, böylece iki tür modeli ayıran şeyi gerçekten anlayabilelim.

Üretken vs. Ayrımcı Modeller

Makine öğrenimi modelini kategorize etmek için çeşitli yollar vardır. Bir model, üretken modeller, ayrımcı modeller, parametreli modeller, parametresiz modeller, ağaç tabanlı modeller, ağaç tabanlı olmayan modeller gibi farklı kategorilere ait olabilir.

Bu makale, üretken modeller ve ayrımcı modeller arasındaki farklara odaklanacak. Her iki tür modeli de tanımlayarak başlayacağız, ardından her tür modelin bazı örneklerini keşfedeceğiz.

Üretken Modeller

Üretken modeller veri kümesindeki sınıfların dağılımına odaklanan modellerdir. Makine öğrenimi algoritmaları genellikle veri noktalarının dağılımını modellemeye çalışır. Üretken modeller, ortak olasılığın bulunmasına dayanır. Bir girişin belirli bir özelliği ve istenen bir çıktı/etiketi aynı anda var olan noktalarda oluşturulur.

Üretken modeller genellikle olasılıkları tahmin etmek ve olasılıklara dayalı olarak sınıfları ayırmak için kullanılır. Model, veri kümesinin olasılık dağılımını öğrenir, bu nedenle bu olasılık dağılımına başvurarak yeni veri örnekleri oluşturabilir. Üretken modeller genellikle Bayes teoremi kullanarak ortak olasılığın bulunmasına dayanır, p(x,y) bulunur. Aslında, üretken modeller verilerin nasıl üretildiği hakkında bilgi verir ve aşağıdaki soruyu cevaplar:

“Bu sınıfın veya başka bir sınıfın bu veri noktasını/örneğini üretme olasılığı nedir?”

Üretken makine öğrenimi modellerinin örnekleri arasında Doğrusal Ayrımcı Analiz (LDA), Gizli Markov modelleri ve Naive Bayes gibi Bayes ağları bulunur.

Ayrımcı Modeller

Üretken modeller veri kümesinin dağılımını öğrenirken, ayrımcı modeller veri kümesindeki sınıflar arasındaki sınırı öğrenir. Ayrımcı modellerin amacı, güvenilir sınıf etiketlerini veri örneklerine uygulamak için sınıflar arasındaki karar sınırını belirlemektir. Ayrımcı modeller, bireysel veri noktaları hakkında herhangi bir varsayım yapmadan, koşullu olasılıkla sınıfları ayırır.

Ayrımcı modeller aşağıdaki soruyu cevaplamaya çalışır:

“Bu örnek karar sınırının hangi tarafında bulunur?”

Makine öğreniminde ayrımcı modellerin örnekleri arasında destek vektör makineleri, lojistik regresyon, karar ağaçları ve rastgele ormanlar bulunur.

Üretken ve Ayrımcı Modeller Arasındaki Farklar

Üretken ve ayrımcı modeller arasındaki temel farkları hızlı bir şekilde gözden geçirelim.

Üretken Modeller:

  • Üretken modeller, veri kümesindeki sınıfların gerçek dağılımını yakalamaya çalışır.
  • Üretken modeller, ortak olasılık dağılımını – p(x,y) – Bayes Teoremi kullanarak öngörür.
  • Üretken modeller, ayrımcı modellere kıyasla hesaplama açısından daha pahalıdır.
  • Üretken modeller, gözetimsiz makine öğrenimi görevleri için faydalıdır.
  • Üretken modeller, ayrımcı modellere kıyasla aykırı değerlerin varlığından daha fazla etkilenir.

Ayrımcı Modeller:

  • Ayrımcı modeller, veri kümesi sınıflarının karar sınırını modellemeye çalışır.
  • Ayrımcı modeller, koşullu olasılık – p(y|x) – öğrenir.
  • Ayrımcı modeller, üretken modellere kıyasla hesaplama açısından daha ucuzdur.
  • Ayrımcı modeller, gözetimli makine öğrenimi görevleri için faydalıdır.
  • Ayrımcı modeller, üretken modellere kıyasla aykırı değerlere karşı daha dayanıklıdır.
  • Ayrımcı modeller, üretken modellere kıyasla aykırı değerlere karşı daha dayanıklıdır.

Şimdi üretken ve ayrımcı makine öğrenimi modellerinin bazı farklı örneklerini kısaca keşfedeceğiz.

Üretken Modeller Örnekleri

Doğrusal Ayrımcı Analiz (LDA)

LDA modelleri her sınıf için veri kümesinin varyansını ve ortalamasını tahmin ederek çalışır. Her sınıfın varyansı ve ortalamaları hesaplandıktan sonra, belirli bir girişin belirli bir sınıfa ait olma olasılığı tahmin edilerek tahminler yapılabilir.

Gizli Markov Modelleri

Markov Zincirleri, bir noktadan diğerine geçme olasılığını gösteren grafiklerle düşünülebilir. Markov Zincirleri, bir durumdan diğerine geçme olasılığını belirlemek için kullanılır, bu da p(i,j) olarak gösterilir. Bu, yukarıda bahsedilen ortak olasılıktır. Gizli Markov Modeli, görünmeyen, gözlemlenemeyen bir Markov Zincirinin kullanıldığı bir modeldir. Veri girişleri modele verilir ve geçerli durumun ve önceki durumun olasılıkları en olası sonucu hesaplamak için kullanılır.

Bayes Ağları

Bayes ağları olasılıksal grafik modellerin bir türüdür. Koşullu bağımlılıkları temsil eder, bunlar Yönlendirilmiş Döngüsüz Graf ile temsil edilir. Bir Bayes ağında, grafın her kenarı koşullu bir bağımlılığı temsil eder ve her düğüm benzersiz bir değişkeni temsil eder. Grafın özel ilişkileri arasındaki koşullu bağımsızlık, değişkenlerin ortak dağılımını belirlemek ve ortak olasılığı hesaplamak için kullanılabilir. Diğer bir deyişle, bir Bayes ağı belirli bir ortak olasılık dağılımının bir alt kümesini yakalar.

Bir Bayes ağı oluşturulup doğru bir şekilde tanımladıktan sonra, Rastgele Değişkenler, Koşullu İlişkiler ve Olasılık Dağılımları bilinirse, olayların veya sonuçların olasılığını tahmin etmek için kullanılabilir.

En yaygın kullanılan Bayes Ağları türlerinden biri Naive Bayes modelidir. Naive Bayes modeli, birçok parametreye/değişkene sahip veri kümeleri için olasılığı hesaplamakta karşılaşılan zorluğu, tüm özellikleri birbirinden bağımsız olarak ele alarak çözer.

Ayrımcı Modeller Örnekleri

Destek Vektör Makineleri

Destek vektör makineleri veri noktaları arasında bir karar sınırı çizerek çalışır, veri kümesindeki farklı sınıfları en iyi şekilde ayıran karar sınırını bulmaya çalışır. SVM algoritması 2 boyutlu uzaylar için çizgiler veya 3 boyutlu uzaylar için hiperdüzlemler çizer. SVM, sınıfları ayırmak için en iyi kararı veren çizgi/hiperdüzlemin bulunmasına çalışır, bunu melakukan için marjı veya çizgi/hiperdüzlemin en yakın noktalarına olan mesafeyi en üst düzeye çıkarmaya çalışır. SVM modelleri ayrıca “kernel hile” kullanılarak lineer olarak ayrılmayan veri kümeleri için de kullanılabilir.

Lojistik Regresyon

Lojistik regresyon bir logit (log-odds) fonksiyonu kullanarak bir girişin bir durumun içinde olma olasılığını belirleyen bir algoritmadır. Bir sigmoid fonksiyonu, olasılığı 0 veya 1’e, yani doğru veya yanlış’a yaklaştırmak için kullanılır. 0.50’den büyük olasılıklar sınıf 1 olarak varsayılır, 0.49 veya daha düşük olasılıklar ise 0 olarak varsayılır. Bu nedenle, lojistik regresyon genellikle ikili sınıflandırma problemlerinde kullanılır. Ancak, lojistik regresyon bir karşıt tüm approach kullanarak çoklu sınıf problemlerinde de uygulanabilir, her sınıf için bir ikili sınıflandırma modeli oluşturur ve bir örneğin hedef sınıf veya veri kümesindeki başka bir sınıf olma olasılığını belirler.

Karar Ağacı

Bir karar ağacı modeli, veri kümesini daha küçük ve daha küçük parçalara ayırarak çalışır, ve bir kez alt kümeler daha fazla bölünemezse, bir ağaç ve yapraklardan oluşan bir sonuç ortaya çıkar. Karar ağacındaki düğümler, veri noktaları hakkında kararlar verildiği yerlerdir, burada farklı filtreleme kriterleri kullanılır. Karar ağacındaki yapraklar, sınıflandırılmış veri noktalarıdır. Karar ağacı algoritmaları hem sayısal hem de kategorik veri ile çalışabilir, ve ağacındaki bölünmeler belirli değişkenlere/özelliklere dayanır.

Rastgele Ormanlar

Bir rastgele orman modeli temel olarak bireysel ağaçların tahminlerinin ortalamasına dayanan bir dizi karar ağacından oluşur. Rastgele orman algoritması, bireysel ağaçları oluşturmak için gözlemleri ve özellikleri rastgele seçer.

Bu öğretici makale, Matplotlib’de bir Kutu Grafiği oluşturmayı öğrenecektir. Kutu grafikleri, bir veri kümesinin özet istatistiklerini görselleştirmek, veri dağılımının özelliklerini gibi aralığını ve dağılımını gösteren grafiklerdir.

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.