Yapay Zekâ 101
Bayes Teoremi Nedir?

Veri bilimi veya makine öğrenimi hakkında bilgi ediniyorsanız, muhtemelen daha önce “Bayes Teoremi” veya “Bayes sınıflandırıcı” terimlerini duymuşsunuzdur. Bu kavramlar, geleneksel, frequentist istatistik perspektifinden olasılık düşünmek alışkanlığınız yoksa biraz karmaşık olabilir. Bu makale, Bayes Teoremi’nin arkasındaki ilkeleri ve makine öğreniminde nasıl kullanıldığını açıklamaya çalışacaktır.
Bayes Teoremi Nedir?
Bayes Teoremi, koşullu olasılık hesaplamak için bir yöntemdir. Koşullu olasılığın (bir olayın başka bir olayın meydana gelmesi durumunda meydana gelme olasılığı) geleneksel hesaplanma yöntemi, koşullu olasılık formülünü kullanmak ve olay bir ve olay iki aynı anda meydana gelme olasılığını hesaplamak, ardından olay iki meydana gelme olasılığına bölmektir. Ancak, koşullu olasılık Bayes Teoremi kullanılarak biraz farklı bir şekilde de hesaplanabilir.
Koşullu olasılık Bayes teoremi ile hesaplanırken, aşağıdaki adımları kullanabilirsiniz:
- Koşul B’nin doğru olduğu varsayıldığında, koşul A’nin doğru olma olasılığını belirleyin.
- Olay A’nin doğru olma olasılığını belirleyin.
- İki olasılığı birbiriyle çarpın.
- Olay B’nin meydana gelme olasılığına bölün.
Bu, Bayes Teoremi formülünün aşağıdaki gibi ifade edilebileceği anlamına gelir:
P(A|B) = P(B|A)*P(A) / P(B)
Koşullu olasılığı böyle hesaplamak, özellikle ters koşullu olasılığın kolayca hesaplanabildiği veya ortak olasılığın hesaplanması çok zor olduğunda yararlıdır.
Bayes Teoremi Örneği
Bu, Bayes mantığı ve Bayes Teoremi’nin nasıl uygulanacağını gösteren bir örnek üzerinde biraz zaman harcayarak yorumlamak daha kolay olabilir. Diyelim ki, birden fazla katılımcının size bir hikaye anlattığı ve sizin bu katılımcıların hangisinin yalan söylediğini belirlemeniz gereken bir oyun oynuyorsunuz. Bu hipotetik senaryodaki değişkenlerle Bayes Teoremi eşitliğini dolduruyoruz.
Her bir bireyin yalan söyleyip söylemediğini veya gerçeği söyleyip söylemediğini tahmin etmeye çalışıyoruz, bu nedenle sizin dışınızda üç oyuncu varsa, kategorik değişkenler A1, A2 ve A3 olarak ifade edilebilir. Their yalan söyleyip söylemediklerine dair kanıtlar, onların davranışlarıdır. Poker oynarken bir kişinin yalan söylediğini gösteren belirli “ipuçları” arardınız ve bunları tahmininizi bilgilendirmek için bilgi parçaları olarak kullanırdınız. Ya da onlara soru sormaya izin verilseydi, bu, onların hikayesinin tutarsız olduğu herhangi bir kanıttı. Bir kişinin yalan söylediğine dair kanıtları B olarak temsil edebiliriz.
Açık olmak gerekirse, bir kişinin davranışına bağlı olarak yalan söyleyip söylemediğinin olasılığını tahmin etmeye çalışıyoruz. Bir kişinin yalan söyleyip söylemediğine dair davranışın meydana gelme olasılığını belirlemek istiyoruz. Gördüğünüz davranışın en çok hangi koşullarda anlam ifade edeceğini belirlemeye çalışıyorsunuz. Üç davranışınız varsa, her bir davranış için hesaplamayı yapardınız. Örneğin, P(B1, B2, B3 * A). Oyun dışında kendiniz hariç her bir kişi için bunu yapardınız. Bu, yukarıdaki eşitliğin bu kısmıdır:
P(B1, B2, B3,|A) * P|A
Son olarak, sadece bunu B olasılığına bölün.
Bu eşitlikteki gerçek olasılıklar hakkında herhangi bir kanıt alırsak, gözlemlenen olayların meydana gelme öncül olasılıkları hakkında varsayımlarımızı güncelleyerek olasılık modelimizi yeniden yaratarız. Bu, öncül olasılıklarınızı güncellemek olarak adlandırılır, çünkü gözlemlenen olayların meydana gelme öncül olasılıkları hakkında varsayımlarınızı güncellersiniz.
Bayes Teoremi için Makine Öğrenimi Uygulamaları
Bayes teoreminin makine öğreniminde en yaygın kullanımı, Naive Bayes algoritmasıdır.
Naive Bayes, ikili ve çok sınıflı veri setlerinin sınıflandırılması için kullanılır, Naive Bayes, tanıkların kanıtlarına/özniteliklerine – P(B1, B2, B3 * A)’deki B’ler – birbirlerinden bağımsız oldukları varsayılır. Bu özniteliklerin birbirlerini etkilemediği varsayılır, böylece model basitleştirilir ve hesaplamalar mümkün hale gelir, bunun yerine her bir özniteliğin ilişkilerini hesaplamak için karmaşık bir görevden kaçınılır. Basitleştirilmiş bu modele rağmen, Naive Bayes genellikle bir sınıflandırma algoritması olarak oldukça iyi performans gösterir, bu varsayım muhtemelen doğru değildir (çoğu zaman).
Naive Bayes sınıflandırıcının Multinomial Naive Bayes, Bernoulli Naive Bayes ve Gaussian Naive Bayes gibi yaygın olarak kullanılan varyantları da vardır.
Multinomial Naive Bayes algoritmaları, bir belgedeki kelimelerin sıklığını yorumlama konusunda etkili olduğu için genellikle belgelerin sınıflandırılması için kullanılır.
Bernoulli Naive Bayes, Multinomial Naive Bayes’e benzer şekilde çalışır, ancak algoritma tarafından verilen tahminler booleandır. Bu, bir sınıfı tahmin ederken değerlerin ikili olacağı anlamına gelir. Metin sınıflandırma alanında, Bernoulli Naive Bayes algoritması, bir kelimenin metin belgesinde bulunup bulunmadığına bağlı olarak parametreleri evet veya hayır olarak atayacaktır.
Önleyici/öznitelik değerleri ayrık değilse ve sürekli ise, Gaussian Naive Bayes kullanılabilir. Sürekli özniteliklerin değerlerinin bir Gaussian dağılımından örneklendiği varsayılır.






