saplama Denetimli ve Denetimsiz Öğrenme - Unite.AI
Bizimle iletişime geçin

AI 101

Denetimli ve Denetimsiz Öğrenme

mm
Güncellenmiş on

Makine öğreniminde çoğu görev kolaylıkla iki farklı sınıftan birine kategorize edilebilir: denetimli öğrenme sorunları veya denetimsiz öğrenme sorunları. Denetimli öğrenmede verilere etiketler veya sınıflar eklenirken, denetimsiz öğrenme durumunda veriler etiketlenmez. Bu ayrımın neden önemli olduğuna yakından bakalım ve her öğrenme türüyle ilişkili bazı algoritmalara bakalım.

Denetimli ve Denetimsiz Öğrenme

Çoğu makine öğrenimi görevi, denetimli öğrenme. Denetimli öğrenme algoritmalarında, veri kümesindeki bireysel örnekler/veri noktaları, kendilerine atanmış bir sınıfa veya etikete sahiptir. Bu, makine öğrenimi modelinin hangi özelliklerin belirli bir sınıfla ilişkili olduğunu ayırt etmeyi öğrenebileceği ve makine öğrenimi mühendisinin kaç örneğin uygun şekilde sınıflandırıldığını görerek modelin performansını kontrol edebileceği anlamına gelir. Veriler uygun sınıflarla etiketlendiği sürece, birçok karmaşık modeli ayırt etmek için sınıflandırma algoritmaları kullanılabilir. Örneğin, bir makine öğrenimi algoritması, farklı hayvanları "bıyık", "kuyruk", "pençe" vb. özelliklere dayalı olarak birbirinden ayırmayı öğrenebilir.

Denetimli öğrenmenin aksine, denetimsiz öğrenme, etiketlenmemiş verilerden kalıpları çıkarabilen bir model oluşturmayı içerir. Başka bir deyişle, bilgisayar girdi özelliklerini analiz eder ve kendisi için en önemli özelliklerin ve kalıpların ne olduğunu belirler. Denetimsiz öğrenme, farklı örnekler arasındaki içsel benzerlikleri bulmaya çalışır. Denetimli bir öğrenme algoritması, veri noktalarını bilinen sınıflara yerleştirmeyi hedefliyorsa, denetimsiz öğrenme algoritmaları, nesne örneklerinde ortak olan özellikleri inceleyecek ve bunları, esasen kendi sınıflarını oluşturarak, bu özelliklere dayalı olarak gruplara yerleştirecektir.

Denetimli öğrenme algoritmalarına örnek olarak Doğrusal Regresyon, Lojistik Regresyon, K-En Yakın Komşular, Karar Ağaçları ve Destek Vektör Makineleri verilebilir.

Bu arada, denetimsiz öğrenme algoritmalarının bazı örnekleri Temel Bileşen Analizi ve K-Means Kümelemedir.

Denetimli Öğrenme Algoritması

Doğrusal regresyon iki özelliği alan ve aralarındaki ilişkiyi çizen bir algoritmadır. Doğrusal Regresyon, sayısal değerleri diğer sayısal değişkenlerle ilişkili olarak tahmin etmek için kullanılır. Doğrusal Regresyon, Y = a +bX denklemine sahiptir; burada b, çizginin eğimidir ve a, y'nin X eksenini kestiği yerdir.

Lojistik regresyon bir ikili sınıflandırma algoritmasıdır. Algoritma, sayısal özellikler arasındaki ilişkiyi inceler ve örneğin iki farklı sınıftan birine sınıflandırılma olasılığını bulur. Olasılık değerleri 0 veya 1'e "sıkıştırılır". Diğer bir deyişle, güçlü olasılıklar 0.99'a, zayıf olasılıklar ise 0'a yaklaşır.

K-En Yakın Komşular eğitim setinde seçilen bazı sayıda komşunun atanan sınıflarına dayalı olarak yeni veri noktalarına bir sınıf atar. Algoritma tarafından dikkate alınan komşuların sayısı önemlidir ve çok az veya çok fazla komşu noktaları yanlış sınıflandırabilir.

Karar ağaçları bir tür sınıflandırma ve regresyon algoritmasıdır. Bir karar ağacı, bir veri kümesini, alt kümeler daha fazla bölünemeyecek duruma gelinceye kadar giderek daha küçük parçalara bölerek çalışır ve sonuçta düğümleri ve yaprakları olan bir ağaç elde edilir. Düğümler, farklı filtreleme kriterleri kullanılarak veri noktalarıyla ilgili kararların alındığı yerdir; yapraklar ise bazı etiketlerin (sınıflandırılmış bir veri noktası) atandığı örneklerdir. Karar ağacı algoritmaları hem sayısal hem de kategorik verileri işleyebilir. Ağaçta belirli değişkenler/özellikler üzerinde bölünmeler yapılır.

Vektör makineleri desteklemek veri noktaları arasında hiperdüzlemler veya ayırma çizgileri çizerek çalışan bir sınıflandırma algoritmasıdır. Veri noktaları, hiper düzlemin hangi tarafında olduklarına bağlı olarak sınıflara ayrılır. Bir düzlem boyunca birden çok hiper düzlem çizilebilir ve bir veri kümesi birden çok sınıfa bölünebilir. Sınıflandırıcı, dalış hiperdüzlemi ile düzlemin her iki tarafındaki noktalar arasındaki mesafeyi en üst düzeye çıkarmaya çalışacak ve çizgi ile noktalar arasındaki mesafe ne kadar büyükse, sınıflandırıcı o kadar emin olacaktır.

Denetimsiz Öğrenme Algoritmaları

Temel bileşenler Analizi boyutluluğun azaltılması için kullanılan bir tekniktir, yani verilerin boyutluluğu veya karmaşıklığı daha basit bir şekilde temsil edilir. Temel Bileşen Analizi algoritması, ortogonal olan veriler için yeni boyutlar bulur. Verilerin boyutsallığı azaltılırken, veriler arasındaki varyans mümkün olduğunca korunmalıdır. Bunun pratik açıdan anlamı, veri kümesindeki özellikleri alması ve bunları verilerin çoğunu temsil eden daha az özelliğe damıtmasıdır.

K-Kümeleme Demektir benzer özelliklere göre veri noktalarını otomatik olarak kümeler halinde gruplandıran bir algoritmadır. Veri kümesindeki kalıplar analiz edilir ve veri noktaları bu kalıplara göre gruplara ayrılır. Temelde K-means, etiketlenmemiş verilerden kendi sınıflarını oluşturur. K-Means algoritması, kümelere veya merkezlere merkezler atayarak ve merkezler için en uygun konum bulunana kadar merkezleri hareket ettirerek çalışır. Optimum konum, merkezler ile sınıf içindeki çevreleyen veri noktaları arasındaki mesafenin en aza indirildiği konum olacaktır. K-means kümelemesindeki "K", kaç tane merkezin seçildiğini ifade eder.

Özet

Kapatmak için, arasındaki temel farkları hızlıca gözden geçirelim. denetimli ve denetimsiz öğrenme.

Daha önce tartıştığımız gibi, denetimli öğrenme görevlerinde girdi verileri etiketlenir ve sınıf sayısı bilinir. Bu arada, denetimsiz öğrenme durumlarında girdi verileri etiketlenmemiştir ve sınıfların sayısı bilinmemektedir. Denetimsiz öğrenme, hesaplama açısından daha az karmaşık olma eğilimindeyken, denetimli öğrenme, hesaplama açısından daha karmaşık olma eğilimindedir. Denetimli öğrenme sonuçları oldukça doğru olma eğilimindeyken, denetimsiz öğrenme sonuçları daha az doğru/orta derecede doğru olma eğilimindedir.

Uzmanlık alanlarına sahip blogcu ve programcı Makine öğrenme ve Derin Öğrenme konular. Daniel, başkalarının yapay zekanın gücünü toplumsal fayda için kullanmasına yardım etmeyi umuyor.