Bizimle iletişime geçin

AI 101

Makine Öğrenmesi Nedir?

mm

Makine öğrenimi en hızlı büyüyen teknolojik alanlardan biridir, ancak "makine öğrenimi" kelimeleri ne kadar sıklıkla ortalıkta dolaşsa da makine öğreniminin tam olarak ne olduğunu anlamak zor olabilir.

Makine öğrenme "Tek bir şeyi ifade etmez, birçok farklı kavram ve tekniğe uygulanabilen genel bir terimdir. Makine öğrenimini anlamak, farklı model analizi, değişken ve algoritma biçimlerine aşina olmak anlamına gelir. Makine öğreniminin neleri kapsadığını daha iyi anlamak için makine öğrenimine yakından bakalım.

Makine Öğrenimi Nedir?

Makine öğrenimi terimi birçok farklı şeye uygulanabilse de, genel olarak terim, bir bilgisayarın görevleri, bunu yapmak için açık satır satır talimatlar almadan gerçekleştirmesini sağlamayı ifade eder. Bilgisayar, verilerdeki kalıpları analiz ederek ve bu kalıpları yeni verilere genelleyerek "öğrenme" yeteneğine sahip olduğundan, bir makine öğrenimi uzmanının sorunu çözmek için gerekli tüm adımları yazması gerekmez.

Makine öğrenimi sistemlerinin üç temel bölümü vardır:

  • Girdiler
  • Algoritmalar
  • Çıkışlar

Girdiler, makine öğrenimi sistemine beslenen verilerdir ve girdi verileri etiketlere ve özelliklere bölünebilir. Özellikler ilgili değişkenlerdir, kalıpları öğrenmek ve sonuçlar çıkarmak için analiz edilecek değişkenlerdir. Bu arada etiketler, verilerin bireysel örneklerine verilen sınıflar/açıklamalardır.

Özellikler ve etiketler iki farklı makine öğrenimi probleminde kullanılabilir: denetimli öğrenme ve denetimsiz öğrenme.

Denetimsiz ve Denetimli Öğrenme

In denetimli öğrenme, giriş verilerine bir temel gerçek eşlik eder. Denetimli öğrenme problemleri, veri kümesinin bir parçası olarak doğru çıktı değerlerine sahiptir, dolayısıyla beklenen sınıflar önceden bilinir. Bu, veri bilimcinin, verileri bir test veri kümesinde test ederek ve öğelerin yüzde kaçının doğru şekilde sınıflandırıldığını görerek algoritmanın performansını kontrol etmesini mümkün kılar.

Tersine, denetimsiz öğrenme problemlerin üzerine iliştirilmiş temel gerçeklik etiketleri yoktur. Denetimsiz öğrenme görevlerini yürütmek için eğitilmiş bir makine öğrenimi algoritması, verilerdeki ilgili kalıpları kendisi için çıkarabilmelidir.

Denetimli öğrenme algoritmaları tipik olarak, birçok farklı sınıftan birine sıralanması gereken örneklerle dolu büyük bir veri kümesine sahip olan sınıflandırma problemlerinde kullanılır. Denetimli öğrenmenin başka bir türü, algoritma tarafından verilen değerin kategorik yerine doğası gereği sürekli olduğu bir regresyon görevidir.

Bu arada, denetimsiz öğrenme algoritmaları, yoğunluk tahmini, kümeleme ve temsili öğrenme gibi görevler için kullanılır. Bu üç görev, verilerin yapısını anlamak için makine öğrenimi modeline ihtiyaç duyar, modele verilen önceden tanımlanmış sınıflar yoktur.

Hem denetimsiz öğrenme hem de denetimli öğrenmede kullanılan en yaygın algoritmalardan bazılarına kısaca göz atalım.

Denetimli Öğrenme Türleri

Yaygın denetimli öğrenme algoritmaları şunları içerir:

  • Naif bayanlar
  • Vektör makineleri desteklemek
  • Lojistik regresyon
  • Rasgele Ormanlar
  • Yapay Sinir Ağları

Vektör makineleri desteklemek bir veri setini farklı sınıflara bölen algoritmalardır. Veri noktaları, sınıfları birbirinden ayıran çizgiler çizilerek kümeler halinde gruplandırılır. Çizginin bir tarafında bulunan noktalar bir sınıfa ait olurken, diğer tarafında bulunan noktalar farklı bir sınıfa ait olacaktır. Destek Vektör Makineleri, çizgi ile çizginin her iki tarafında bulunan noktalar arasındaki mesafeyi maksimize etmeyi amaçlar ve mesafe ne kadar büyük olursa, sınıflandırıcı noktanın başka bir sınıfa değil bir sınıfa ait olduğundan o kadar emin olur.

Lojistik regresyon veri noktalarının iki sınıftan birine ait olarak sınıflandırılması gerektiğinde ikili sınıflandırma görevlerinde kullanılan bir algoritmadır. Lojistik Regresyon, veri noktasını 1 veya 0 olarak etiketleyerek çalışır. Veri noktasının algılanan değeri 0.49 veya altındaysa 0, 0.5 veya üzerindeyse 1 olarak sınıflandırılır.

Karar Ağacı algoritmaları veri kümelerini daha küçük ve daha küçük parçalara bölerek çalışır. Verileri bölmek için kullanılan kesin ölçütler, makine öğrenimi mühendisine bağlıdır, ancak amaç, nihai olarak verileri, daha sonra bir anahtar kullanılarak sınıflandırılacak olan tek veri noktalarına bölmek.

Rastgele Orman algoritması, esas olarak, daha güçlü bir sınıflandırıcıya bağlanan birçok tek Karar Ağacı sınıflandırıcısından oluşur.

Naive Bayes Sınıflandırıcısı, belirli bir veri noktasının meydana gelme olasılığını, önceki bir olayın meydana gelme olasılığına göre hesaplar. Bayes Teoremi'ne dayanır ve veri noktalarını hesaplanan olasılıklarına göre sınıflara yerleştirir. Naive Bayes sınıflandırıcısı uygulanırken, tüm öngörücülerin sınıf sonucu üzerinde aynı etkiye sahip olduğu varsayılır.

An Yapay Sinir Ağıveya çok katmanlı algılayıcı, insan beyninin yapısından ve işlevinden ilham alan makine öğrenimi algoritmalarıdır. Yapay sinir ağları, isimlerini birbirine bağlı birçok düğümden/nörondan yapılmalarından alır. Her nöron, verileri matematiksel bir işlevle manipüle eder. Yapay sinir ağlarında girdi katmanları, gizli katmanlar ve çıktı katmanları bulunmaktadır.

Sinir ağının gizli katmanı, verilerin gerçekten yorumlandığı ve kalıplar için analiz edildiği yerdir. Başka bir deyişle, algoritmanın öğrendiği yerdir. Bir araya getirilen daha fazla nöron, daha karmaşık kalıpları öğrenebilen daha karmaşık ağlar oluşturur.

Denetimsiz Öğrenme Türleri

Denetimsiz Öğrenme algoritmaları şunları içerir:

  • K-kümeleme anlamına gelir
  • Otomatik kodlayıcılar
  • Temel bileşenler Analizi

K-ortalamalar kümelemesi, gözetimsiz bir sınıflandırma tekniğidir ve veri noktalarını özelliklerine göre kümelere veya gruplara ayırarak çalışır. K-ortalamalar kümelemesi, veri noktalarında bulunan özellikleri analiz eder ve bunlarda, belirli bir sınıf kümesinde bulunan veri noktalarını diğer veri noktalarını içeren kümelere göre birbirlerine daha benzer hale getiren örüntüleri ayırt eder. Bu, küme için olası merkezleri veya ağırlık merkezlerini bir veri grafiğine yerleştirerek ve ağırlık merkezi ile o ağırlık merkezinin sınıfına ait noktalar arasındaki mesafeyi en aza indiren bir konum bulunana kadar ağırlık merkezinin konumunu yeniden atayarak gerçekleştirilir. Araştırmacı, istenen küme sayısını belirleyebilir.

Temel bileşenler Analizi çok sayıda özelliği/değişkeni daha küçük bir özellik alanına/daha az özelliğe indirgeyen bir tekniktir. Veri noktalarının "temel bileşenleri" koruma için seçilirken, diğer özellikler daha küçük bir temsile sıkıştırılır. Orijinal veri iksirleri arasındaki ilişki korunur, ancak veri noktalarının karmaşıklığı daha basit olduğundan, verilerin ölçülmesi ve açıklanması daha kolaydır.

Otokodlayıcılar, gözetimsiz öğrenme görevlerine uygulanabilen sinir ağlarının versiyonlarıdır. Otokodlayıcılar, etiketlenmemiş, serbest biçimli verileri alıp bir sinir ağının kullanabileceği verilere dönüştürebilir, yani temelde kendi etiketli eğitim verilerini oluşturabilirler. Bir otokodlayıcının amacı, giriş verilerini dönüştürüp mümkün olduğunca doğru bir şekilde yeniden oluşturmaktır, bu nedenle ağın en önemli özellikleri belirleyip bunları çıkarması önemlidir.

Uzmanlık alanlarına sahip blogcu ve programcı Makine öğrenmesi ve Derin Öğrenme konular. Daniel, başkalarının yapay zekanın gücünü toplumsal fayda için kullanmasına yardım etmeyi umuyor.