saplama Makine Öğrenimi Nedir? - Unite.AI
Bizimle iletişime geçin

AI 101

Makine Öğrenmesi Nedir?

mm
Güncellenmiş on

Makine öğrenimi en hızlı büyüyen teknolojik alanlardan biridir, ancak "makine öğrenimi" kelimeleri ne kadar sıklıkla ortalıkta dolaşsa da makine öğreniminin tam olarak ne olduğunu anlamak zor olabilir.

Makine öğrenme tek bir şeye atıfta bulunmaz, birçok farklı kavram ve tekniğe uygulanabilen şemsiye bir terimdir. Makine öğrenimini anlamak, farklı model analizi biçimlerine, değişkenlere ve algoritmalara aşina olmak anlamına gelir. Neleri kapsadığını daha iyi anlamak için makine öğrenimine yakından bakalım.

Makine Öğrenimi Nedir?

Makine öğrenimi terimi birçok farklı şeye uygulanabilse de, genel olarak terim, bir bilgisayarın görevleri, bunu yapmak için açık satır satır talimatlar almadan gerçekleştirmesini sağlamayı ifade eder. Bilgisayar, verilerdeki kalıpları analiz ederek ve bu kalıpları yeni verilere genelleyerek "öğrenme" yeteneğine sahip olduğundan, bir makine öğrenimi uzmanının sorunu çözmek için gerekli tüm adımları yazması gerekmez.

Makine öğrenimi sistemlerinin üç temel bölümü vardır:

  • Girdiler
  • Algoritmalar
  • Çıkışlar

Girdiler, makine öğrenimi sistemine beslenen verilerdir ve girdi verileri etiketlere ve özelliklere bölünebilir. Özellikler ilgili değişkenlerdir, kalıpları öğrenmek ve sonuçlar çıkarmak için analiz edilecek değişkenlerdir. Bu arada etiketler, verilerin bireysel örneklerine verilen sınıflar/açıklamalardır.

Özellikler ve etiketler iki farklı makine öğrenimi probleminde kullanılabilir: denetimli öğrenme ve denetimsiz öğrenme.

Denetimsiz ve Denetimli Öğrenme

In denetimli öğrenme, giriş verilerine bir temel gerçek eşlik eder. Denetimli öğrenme problemleri, veri kümesinin bir parçası olarak doğru çıktı değerlerine sahiptir, dolayısıyla beklenen sınıflar önceden bilinir. Bu, veri bilimcinin, verileri bir test veri kümesinde test ederek ve öğelerin yüzde kaçının doğru şekilde sınıflandırıldığını görerek algoritmanın performansını kontrol etmesini mümkün kılar.

Tersine, denetimsiz öğrenme problemlerin üzerine iliştirilmiş temel gerçeklik etiketleri yoktur. Denetimsiz öğrenme görevlerini yürütmek için eğitilmiş bir makine öğrenimi algoritması, verilerdeki ilgili kalıpları kendisi için çıkarabilmelidir.

Denetimli öğrenme algoritmaları tipik olarak, birçok farklı sınıftan birine sıralanması gereken örneklerle dolu büyük bir veri kümesine sahip olan sınıflandırma problemlerinde kullanılır. Denetimli öğrenmenin başka bir türü, algoritma tarafından verilen değerin kategorik yerine doğası gereği sürekli olduğu bir regresyon görevidir.

Bu arada, denetimsiz öğrenme algoritmaları, yoğunluk tahmini, kümeleme ve temsili öğrenme gibi görevler için kullanılır. Bu üç görev, verilerin yapısını anlamak için makine öğrenimi modeline ihtiyaç duyar, modele verilen önceden tanımlanmış sınıflar yoktur.

Hem denetimsiz öğrenme hem de denetimli öğrenmede kullanılan en yaygın algoritmalardan bazılarına kısaca göz atalım.

Denetimli Öğrenme Türleri

Yaygın denetimli öğrenme algoritmaları şunları içerir:

  • Naif bayanlar
  • Vektör makineleri desteklemek
  • Lojistik regresyon
  • Rasgele Ormanlar
  • Yapay Sinir Ağları

Vektör makineleri desteklemek bir veri setini farklı sınıflara bölen algoritmalardır. Veri noktaları, sınıfları birbirinden ayıran çizgiler çizilerek kümeler halinde gruplandırılır. Çizginin bir tarafında bulunan noktalar bir sınıfa ait olurken, diğer tarafında bulunan noktalar farklı bir sınıfa ait olacaktır. Destek Vektör Makineleri, çizgi ile çizginin her iki tarafında bulunan noktalar arasındaki mesafeyi maksimize etmeyi amaçlar ve mesafe ne kadar büyük olursa, sınıflandırıcı noktanın başka bir sınıfa değil bir sınıfa ait olduğundan o kadar emin olur.

Lojistik regresyon veri noktalarının iki sınıftan birine ait olarak sınıflandırılması gerektiğinde ikili sınıflandırma görevlerinde kullanılan bir algoritmadır. Lojistik Regresyon, veri noktasını 1 veya 0 olarak etiketleyerek çalışır. Veri noktasının algılanan değeri 0.49 veya altındaysa 0, 0.5 veya üzerindeyse 1 olarak sınıflandırılır.

Karar Ağacı algoritmaları veri kümelerini daha küçük ve daha küçük parçalara bölerek çalışır. Verileri bölmek için kullanılan kesin ölçütler, makine öğrenimi mühendisine bağlıdır, ancak amaç, nihai olarak verileri, daha sonra bir anahtar kullanılarak sınıflandırılacak olan tek veri noktalarına bölmek.

Rastgele Orman algoritması, esas olarak, daha güçlü bir sınıflandırıcıya bağlanan birçok tek Karar Ağacı sınıflandırıcısından oluşur.

The Naive Bayes Sınıflandırıcı Önceki bir olayın meydana gelme olasılığına dayalı olarak belirli bir veri noktasının meydana gelme olasılığını hesaplar. Bayes Teoremine dayanır ve veri noktalarını hesaplanan olasılıklarına göre sınıflara yerleştirir. Naive Bayes sınıflandırıcısını uygularken, tüm yordayıcıların sınıf sonucu üzerinde aynı etkiye sahip olduğu varsayılır.

An Yapay Sinir Ağıveya çok katmanlı algılayıcı, insan beyninin yapısından ve işlevinden ilham alan makine öğrenimi algoritmalarıdır. Yapay sinir ağları, isimlerini birbirine bağlı birçok düğümden/nörondan yapılmalarından alır. Her nöron, verileri matematiksel bir işlevle manipüle eder. Yapay sinir ağlarında girdi katmanları, gizli katmanlar ve çıktı katmanları bulunmaktadır.

Sinir ağının gizli katmanı, verilerin gerçekten yorumlandığı ve kalıplar için analiz edildiği yerdir. Başka bir deyişle, algoritmanın öğrendiği yerdir. Bir araya getirilen daha fazla nöron, daha karmaşık kalıpları öğrenebilen daha karmaşık ağlar oluşturur.

Denetimsiz Öğrenme Türleri

Denetimsiz Öğrenme algoritmaları şunları içerir:

  • K-kümeleme anlamına gelir
  • Otomatik kodlayıcılar
  • Temel bileşenler Analizi

K-kümeleme anlamına gelir denetimsiz bir sınıflandırma tekniğidir ve veri noktalarını özelliklerine göre kümelere veya gruplara ayırarak çalışır. K-means kümeleme, veri noktalarında bulunan özellikleri analiz eder ve belirli bir sınıf kümesinde bulunan veri noktalarını, diğer veri noktalarını içeren kümelere olduğundan daha fazla birbirine benzer hale getiren kalıpları ayırt eder. Bu, küme için olası merkezlerin veya merkez noktaların bir veri grafiğine yerleştirilmesi ve merkez ile o merkezin sınıfına ait noktalar arasındaki mesafeyi en aza indiren bir konum bulunana kadar ağırlık merkezinin konumunun yeniden atanmasıyla gerçekleştirilir. Araştırmacı istenilen küme sayısını belirleyebilir.

Temel bileşenler Analizi çok sayıda özelliği/değişkeni daha küçük bir özellik alanına/daha az özelliğe indirgeyen bir tekniktir. Veri noktalarının "temel bileşenleri" koruma için seçilirken, diğer özellikler daha küçük bir temsile sıkıştırılır. Orijinal veri iksirleri arasındaki ilişki korunur, ancak veri noktalarının karmaşıklığı daha basit olduğundan, verilerin ölçülmesi ve açıklanması daha kolaydır.

Otomatik kodlayıcılar denetimsiz öğrenme görevlerine uygulanabilen sinir ağlarının sürümleridir. Otomatik kodlayıcılar, etiketlenmemiş, serbest biçimli verileri alma ve bunları bir sinir ağının kullanabileceği verilere dönüştürme, temel olarak kendi etiketli eğitim verilerini oluşturma yeteneğine sahiptir. Bir otomatik kodlayıcının amacı, giriş verilerini dönüştürmek ve mümkün olduğunca doğru bir şekilde yeniden oluşturmaktır, bu nedenle, hangi özelliklerin en önemli olduğunu belirlemek ve bunları ayıklamak ağın teşvikindedir.

Uzmanlık alanlarına sahip blogcu ve programcı Makine öğrenme ve Derin Öğrenme konular. Daniel, başkalarının yapay zekanın gücünü toplumsal fayda için kullanmasına yardım etmeyi umuyor.