Yapay Zekâ 101
Makine Öğrenimi Nedir?

Makine öğrenimi, en hızlı büyüyen teknolojik alanlardan biridir, ancak “makine öğrenimi” kelimelerinin ne kadar sık kullanıldığına rağmen, makine öğreniminin tam olarak ne olduğu anlaşılması zor olabilir.
Makine öğrenimi, yalnızca bir şey değil, birçok farklı kavram ve tekniğe uygulanabilen bir şemsiye terimdir. Makine öğrenimini anlamak, farklı türde model analizi, değişkenler ve algoritmalarla熟 olmak anlamına gelir. Makine öğrenimine daha yakından bakalım ve neler içerdiğini daha iyi anlayalım.
Makine Öğrenimi Nedir?
Makine öğrenimi terimi birçok farklı şeye uygulanabilir, ancak genel olarak, bir bilgisayara, açıkça satır satır talimatlar verilmeden görevleri gerçekleştirmesini sağlamak anlamına gelir. Bir makine öğrenimi uzmanı, problemi çözmek için gerekli tüm adımları yazmak zorunda değildir, çünkü bilgisayar, veri içindeki desenleri analiz ederek ve bu desenleri yeni verilere genelleştirerek “öğrenebilir”.
Makine öğrenimi sistemleri üç temel parçadan oluşur:
- Girdiler
- Algoritmalar
- Çıktılar
Girdiler, makine öğrenimi sistemine verilen verilerdir ve girdi verileri etiketler ve özellikler olarak bölünebilir. Özellikler, desenleri öğrenmek ve sonuçlar çıkarmak için analiz edilen ilgili değişkenlerdir. Etiketler ise, verilerin bireysel örneklerine verilen sınıflar/açıklamalardır.
Özellikler ve etiketler, denetimli öğrenme ve denetimsiz öğrenme gibi iki farklı tür makine öğrenimi problemi için kullanılabilir.
Denetimsiz ve Denetimli Öğrenme
Denetimli öğrenmede, girdi verisi, bir temel gerçeklik ile birlikte gelir. Denetimli öğrenme problemlerinde, doğru çıktı değerleri veri setinin bir parçasıdır, bu nedenle beklendiği gibi sınıflar önceden bilinir. Bu, veri bilimcisinin, test veri setinde veri test ederek ve doğru şekilde sınıflandırılan öğelerin yüzdesini görerek algoritmanın performansını kontrol etmesini sağlar.
Öte yandan, denetimsiz öğrenme problemlerinde, etiketler verilere bağlı değildir. Denetimsiz öğrenme görevlerini gerçekleştirmek için eğitilen bir makine öğrenimi algoritmasının, verideki ilgili desenleri kendisi bulabilmesi gerekir.
Denetimli öğrenme algoritmaları genellikle, büyük bir veri seti ile birlikte birçok örneği bir dizi farklı sınıfa ayırmak gereken sınıflandırma problemleri için kullanılır. Denetimli öğrenmenin bir başka türü, algoritmanın çıktısı sürekli rather než kategorik olan regresyon görevleridir.
Öte yandan, denetimsiz öğrenme algoritmaları, yoğunluk tahmini, kümeleme ve temsil öğrenme gibi görevler için kullanılır. Bu üç görev, modele, önceden tanımlanmış sınıflar verilmeden verinin yapısını çıkarmasını gerektirir.
Şimdi, hem denetimsiz öğrenme hem de denetimli öğrenmede kullanılan bazı ortak algoritmaları kısaca inceleyelim.
Denetimli Öğrenme Türleri
Ortak denetimli öğrenme algoritmaları arasında şunlar bulunur:
- Basit Bayes
- Destek Vektör Makineleri
- Lojistik Regresyon
- Rasgele Ormanlar
- Yapay Sinir Ağları
Destek Vektör Makineleri, bir veri setini farklı sınıflara ayıran algoritmalarlardır. Veri noktaları, sınıfları birbirinden ayıran çizgiler çizilerek kümelere ayrılır. Bir çizginin bir tarafındaki noktalar bir sınıfa, diğer tarafındaki noktalar başka bir sınıfa ait olur. Destek Vektör Makineleri, çizgi ile her iki tarafındaki noktalar arasındaki mesafeyi en üst düzeye çıkarmayı hedefler ve bu mesafe ne kadar büyükse, sınıflandırıcı bir noktaya belirli bir sınıfa ait olduğuna o kadar emin olur.
Lojistik Regresyon, veri noktalarını iki sınıftan birine ait olarak sınıflandırmak için kullanılan bir algoritmadır. Lojistik Regresyon, bir veri noktasını 0 veya 1 olarak etiketler. Veri noktasının algılanan değeri 0.49 veya daha düşükse 0 olarak sınıflandırılır, 0.5 veya daha yüksekse 1 olarak sınıflandırılır.
Karar Ağacı algoritmaları, veri setini giderek daha küçük parçalara ayırarak çalışır. Verileri ayırmak için kullanılan kriter, makine öğrenimi mühendisi tarafından belirlenir, ancak nihai hedef, verileri tekil veri noktalarına ayırmak ve sonra bir anahtar kullanarak sınıflandırmaktır.
Rasgele Orman algoritması, aslında birçok tek Decision Tree sınıflandırıcının daha güçlü bir sınıflandırıcı olarak birleştirilmesidir.
Basit Bayes Sınıflandırıcı, bir olayın önceden meydana gelme olasılığına dayanarak bir veri noktasının meydana gelme olasılığını hesaplar. Bayes Teoremine dayanır ve veri noktalarını hesaplanan olasılığa göre sınıflandırır. Basit Bayes sınıflandırıcı uygularken, tüm öngörücülerin sınıf sonucuna aynı etkiyi sahip olduğu varsayılır.
Yapay Sinir Ağları veya çok katmanlı perceptron, insan beyninin yapısı ve işlevinden esinlenen makine öğrenimi algoritmalarıdır. Yapay sinir ağları, birçok nöronun birleşmesinden oluşur. Her nöron, verileri bir matematiksel fonksiyonla manipüle eder. Yapay sinir ağlarında, girdi katmanları, gizli katmanlar ve çıktı katmanları bulunur.
Gizli katman, verilerin gerçekten yorumlandığı ve analiz edildiği yerdir, yani algoritmanın öğrenildiği yer. Daha fazla nöronun birleşmesiyle daha karmaşık ağlar oluşturulur ve bu ağlar daha karmaşık desenleri öğrenebilir.
Denetimsiz Öğrenme Türleri
Denetimsiz Öğrenme algoritmaları arasında şunlar bulunur:
- K-Ortalama Kümeleme
- Oto-Kodlayıcılar
- İlk Bileşen Analizi
K-Ortalama Kümeleme, bir kümeleme tekniğidir ve veri noktalarını özelliklerine göre kümelere veya gruplara ayırır. K-Ortalama Kümeleme, veri noktalarında bulunan özellikleri analiz eder ve bir kümedeki veri noktalarının diğer kümedeki veri noktalarına göre daha benzer olmasını sağlar. Bu, bir grafikteki veri noktalarına mümkün olan küme merkezlerini yerleştirerek ve bu merkezlerin konumunu, merkezin sınıfına ait veri noktalarına olan mesafeyi en aza indirene kadar değiştirerek gerçekleştirilir. Araştırmacı, istenen küme sayısını belirleyebilir.
İlk Bileşen Analizi, büyük miktarda özellik/değişkeni daha küçük bir özellik alanına veya daha az sayıda özelliklere indirgeyen bir tekniktir. Veri noktalarının “ilk bileşenleri” seçilir ve diğer özellikleri daha küçük bir temsil içine sıkıştırılır. Orijinal veri parçaları arasındaki ilişki korunur, ancak veri noktalarının karmaşıklığı daha basit olduğu için, veri daha kolay ölçülür ve tanımlanabilir.
Oto-Kodlayıcılar, denetimsiz öğrenme görevleri için uygulanabilen sinir ağı türleridir. Oto-Kodlayıcılar, etiketsiz, serbest biçimli verileri alabilir ve bir sinir ağının kullanabileceği verilere dönüştürebilir, temelde kendi etiketli eğitim verilerini oluşturur. Bir oto-kodlayıcının amacı, girdi verisini mümkün olduğunca doğru bir şekilde dönüştürmek ve yeniden oluşturmak, böylece ağın hangi özelliklerin en önemli olduğunu belirlemesini ve bunları çıkarmasını sağlamaktır.












