AI 101

Wat is Bayes Stelling?

Opgedateer on Augustus 23, 2020

As jy van datawetenskap of masjienleer geleer het, is daar 'n goeie kans dat jy dit gehoor het term "Bayes Stelling" voor, of 'n "Bayes-klassifiseerder". Hierdie konsepte kan ietwat verwarrend wees, veral as jy nie gewoond is om te dink aan waarskynlikheid vanuit 'n tradisionele, gereelde statistiekperspektief nie. Hierdie artikel sal probeer om die beginsels agter Bayes Stelling te verduidelik en hoe dit in masjienleer gebruik word.

Wat is Bayes Stelling?

Bayes Stelling is 'n metode van die berekening van voorwaardelike waarskynlikheid. Die tradisionele metode om voorwaardelike waarskynlikheid te bereken (die waarskynlikheid dat een gebeurtenis plaasvind gegewe die voorkoms van 'n ander gebeurtenis) is om die voorwaardelike waarskynlikheidsformule te gebruik, die gesamentlike waarskynlikheid van gebeurtenis een en gebeurtenis twee wat op dieselfde tyd plaasvind te bereken, en dan te deel deur die waarskynlikheid dat gebeurtenis twee sal plaasvind. Voorwaardelike waarskynlikheid kan egter ook op 'n effens ander manier bereken word deur die Bayes-stelling te gebruik.

Wanneer voorwaardelike waarskynlikheid met Bayes-stelling bereken word, gebruik jy die volgende stappe:

Bepaal die waarskynlikheid dat voorwaarde B waar is, met die veronderstelling dat voorwaarde A waar is.
Bepaal die waarskynlikheid dat gebeurtenis A waar is.
Vermenigvuldig die twee waarskynlikhede saam.
Deel deur die waarskynlikheid dat gebeurtenis B sal plaasvind.

Dit beteken dat die formule vir Bayes Stelling soos volg uitgedruk kan word:

P(A|B) = P(B|A)*P(A) / P(B)

Die berekening van die voorwaardelike waarskynlikheid soos hierdie is veral nuttig wanneer die omgekeerde voorwaardelike waarskynlikheid maklik bereken kan word, of wanneer die berekening van die gesamentlike waarskynlikheid te uitdagend sou wees.

Voorbeeld van Bayes-stelling

Dit kan makliker wees om te interpreteer as ons tyd spandeer om na 'n byvoorbeeld van hoe jy Bayesiese redenasie en Bayes-stelling sal toepas. Kom ons neem aan dat jy 'n eenvoudige speletjie gespeel het waar verskeie deelnemers vir jou 'n storie vertel en jy moet bepaal watter een van die deelnemers vir jou lieg. Kom ons vul die vergelyking vir Bayes Stelling in met die veranderlikes in hierdie hipotetiese scenario.

Ons probeer voorspel of elke individu in die speletjie lieg of die waarheid praat, so as daar drie spelers buiten jou is, kan die kategoriese veranderlikes uitgedruk word as A1, A2 en A3. Die bewyse vir hul leuens/waarheid is hul gedrag. Soos wanneer jy poker speel, sal jy sekere "vertel" soek dat 'n persoon lieg en dit as stukkies inligting gebruik om jou raaiskoot in te lig. Of as jy toegelaat word om hulle te ondervra, sal dit enige bewys wees dat hul storie nie klop nie. Ons kan die bewyse verteenwoordig dat 'n persoon lieg as B.

Om duidelik te wees, beoog ons om Waarskynlikheid te voorspel (A lieg/vertel die waarheid|gegewe die bewyse van hul gedrag). Om dit te doen, wil ons die waarskynlikheid van B gegewe A uitvind, of die waarskynlikheid dat hul gedrag sal plaasvind as die persoon opreg lieg of die waarheid praat. Jy probeer vasstel onder watter omstandighede die gedrag wat jy sien die meeste sin sou maak. As daar drie gedrag is wat jy aanskou, sal jy die berekening vir elke gedrag doen. Byvoorbeeld, P(B1, B2, B3 * A). Jy sal dit dan doen vir elke voorkoms van A/vir elke persoon in die speletjie afgesien van jouself. Dit is hierdie deel van die vergelyking hierbo:

P(B1, B2, B3,|A) * P|A

Ten slotte deel ons dit net deur die waarskynlikheid van B.

As ons enige bewyse oor die werklike waarskynlikhede in hierdie vergelyking ontvang het, sal ons ons waarskynlikheidsmodel herskep, met inagneming van die nuwe bewyse. Dit word die opdatering van jou priors genoem, aangesien jy jou aannames opdateer oor die vorige waarskynlikheid dat die waargenome gebeurtenisse sal plaasvind.

Masjienleertoepassings vir Bayes-stelling

Die mees algemene gebruik van Bayes-stelling wanneer dit by masjienleer kom, is in die vorm van die Naïewe Bayes-algoritme.

Naive Bayes word gebruik vir die klassifikasie van beide binêre en multi-klas datastelle, Naive Bayes kry sy naam omdat die waardes wat aan die getuies se bewyse/kenmerke toegeken word – Bs in P(B1, B2, B3 * A) – aanvaar word om onafhanklik te wees van mekaar. Daar word aanvaar dat hierdie eienskappe nie mekaar beïnvloed nie om die model te vereenvoudig en berekeninge moontlik te maak, in plaas daarvan om die komplekse taak te probeer om die verwantskappe tussen elk van die eienskappe te bereken. Ten spyte van hierdie vereenvoudigde model, is Naive Bayes geneig om redelik goed te presteer as 'n klassifikasie-algoritme, selfs wanneer hierdie aanname waarskynlik nie waar is nie (wat die meeste van die tyd is).

Daar is ook algemeen gebruikte variante van die Naive Bayes-klassifiseerder soos Multinomial Naive Bayes, Bernoulli Naive Bayes en Gaussian Naive Bayes.

Multinomiale Naïewe Bayes Algoritmes word dikwels gebruik om dokumente te klassifiseer, aangesien dit effektief is om die frekwensie van woorde binne 'n dokument te interpreteer.

Bernoulli Naïef Bayes werk soortgelyk aan Multinomial Naive Bayes, maar die voorspellings wat deur die algoritme gelewer word, is booleans. Dit beteken dat wanneer 'n klas voorspel word, die waardes binêr, nee of ja sal wees. In die domein van teksklassifikasie sal 'n Bernoulli Naive Bayes-algoritme die parameters 'n ja of nee toeken, gebaseer op of 'n woord in die teksdokument gevind word of nie.

As die waarde van die voorspellers/kenmerke nie diskreet is nie, maar eerder kontinu is, Gaussiese Naïef Bayes gebruik kan word. Daar word aanvaar dat die waardes van die kontinue kenmerke uit 'n gaussiese verspreiding gemonster is.

Verwante onderwerpe:Algoritmes Bayes-stelling masjienleer naïewe baaie

Wat is Deep Reinforcement Learning?

Moenie mis nie

Wat is RNN's en LSTM's in Deep Learning?

Daniel Nelson

Blogger en programmeerder met spesialiteite in masjienleer en Diep leer onderwerpe. Daniel hoop om ander te help om die krag van KI vir sosiale voordeel te gebruik.