stubbur Hvað er Bayes setningin? - Unite.AI
Tengja við okkur

AI 101

Hvað er Bayes setningin?

mm
Uppfært on

Ef þú hefur verið að læra um gagnafræði eða vélanám, þá eru góðar líkur á að þú hafir heyrt það hugtak „Bayes setning“ áður, eða „Bayes flokkari“. Þessi hugtök geta verið nokkuð ruglingsleg, sérstaklega ef þú ert ekki vanur að hugsa um líkur frá hefðbundnu sjónarhorni tölfræði. Þessi grein mun reyna að útskýra meginreglurnar á bakvið Bayes setninguna og hvernig það er notað í vélanámi.

Hvað er Bayes setningin?

Bayes setningin er aðferð við að reikna út skilyrtar líkur. Hin hefðbundna aðferð til að reikna út skilyrtar líkur (líkur á því að einn atburður gerist ef annar atburður gerist) er að nota skilyrtu líkindaformúluna, reikna út sameiginlegar líkur á því að atburður eitt og atburður tvö gerist á sama tíma og deila síðan í hann. með líkum á því að atburður tvö eigi sér stað. Hins vegar er einnig hægt að reikna skilyrtar líkur á aðeins öðruvísi hátt með því að nota Bayes setninguna.

Þegar skilyrtar líkur eru reiknaðar með Bayes setningunni notarðu eftirfarandi skref:

  • Ákvarðaðu líkurnar á því að skilyrði B sé satt, að því gefnu að skilyrði A sé satt.
  • Ákvarða líkurnar á að atburður A sé sannur.
  • Margfaldaðu þessar tvær líkur saman.
  • Deilið með líkunum á að atburður B eigi sér stað.

Þetta þýðir að formúlan fyrir Bayes setningu gæti verið tjáð svona:

P(A|B) = P(B|A)*P(A) / P(B)

Útreikningur á skilyrtu líkunum eins og þetta er sérstaklega gagnlegt þegar auðvelt er að reikna öfugri skilyrtu líkindin út, eða þegar útreikningur á sameiginlegum líkum væri of krefjandi.

Dæmi um Bayes setningu

Þetta gæti verið auðveldara að túlka ef við eyðum tíma í að skoða dæmi hvernig þú myndir beita Bayesískri röksemdafærslu og Bayes setningu. Gerum ráð fyrir að þú hafir verið að spila einfaldan leik þar sem margir þátttakendur segja þér sögu og þú verður að ákveða hver þátttakendanna er að ljúga að þér. Fyllum út jöfnuna fyrir Bayes setninguna með breytunum í þessari tilgátu atburðarás.

Við erum að reyna að spá fyrir um hvort hver einstaklingur í leiknum sé að ljúga eða segja satt, þannig að ef það eru þrír leikmenn fyrir utan þig, þá er hægt að gefa upp flokkabreyturnar sem A1, A2 og A3. Sönnunin fyrir lygum/sannleika þeirra er hegðun þeirra. Eins og þegar þú spilar póker, myndir þú leita að ákveðnum „segir“ að einstaklingur sé að ljúga og nota þær sem upplýsingar til að upplýsa ágiskun þína. Eða ef þér væri leyft að spyrja þá væri það einhver sönnun þess að saga þeirra stenst ekki. Við getum táknað sönnunargögnin um að einstaklingur sé að ljúga sem B.

Til að hafa það á hreinu erum við að stefna að því að spá fyrir um líkindi (A er að ljúga/segja sannleikann|miðað við sönnunargögn um hegðun þeirra). Til að gera þetta viljum við reikna út líkurnar á því að B sé gefið A, eða líkurnar á að hegðun þeirra myndi eiga sér stað miðað við að einstaklingurinn lýgur í alvöru eða segi satt. Þú ert að reyna að ákvarða við hvaða aðstæður hegðunin sem þú sérð væri skynsamlegast. Ef það eru þrjár hegðun sem þú ert vitni að, myndir þú reikna út fyrir hverja hegðun. Til dæmis, P(B1, B2, B3 * A). Þú myndir þá gera þetta fyrir hvert tilvik A/fyrir hvern einstakling í leiknum fyrir utan sjálfan þig. Það er þessi hluti af jöfnunni hér að ofan:

P(B1, B2, B3,|A) * P|A

Að lokum deilum við því bara með líkunum á B.

Ef við fengum einhverjar vísbendingar um raunverulegar líkur í þessari jöfnu myndum við endurskapa líkindalíkanið okkar með hliðsjón af nýju sönnunargögnunum. Þetta kallast að uppfæra fyrri forsendu þína, þar sem þú uppfærir forsendur þínar um fyrri líkur á því að atburðir sem sjást eiga sér stað.

Vélnámsforrit fyrir Bayes setningu

Algengasta notkun Bayes setningarinnar þegar kemur að vélanámi er í formi Naive Bayes reikniritsins.

Naive Bayes er notað til að flokka bæði tvöfalda og fjölflokka gagnasöfn, Naive Bayes fær nafn sitt vegna þess að gildin sem vitnunum er úthlutað sönnunargögnum/eiginleikum – Bs í P(B1, B2, B3 * A) – er gert ráð fyrir að séu óháð hver af öðrum. Gert er ráð fyrir að þessir eiginleikar hafi ekki áhrif hver á annan til að einfalda líkanið og gera útreikninga mögulega, í stað þess að reyna hið flókna verkefni að reikna út tengslin á milli hvers eiginleika. Þrátt fyrir þetta einfaldaða líkan hefur Naive Bayes tilhneigingu til að standa sig nokkuð vel sem flokkunaralgrím, jafnvel þegar þessi forsenda er líklega ekki sönn (sem er oftast).

Það eru einnig algengt afbrigði af Naive Bayes flokkaranum eins og Multinomial Naive Bayes, Bernoulli Naive Bayes og Gaussian Naive Bayes.

Margnafna barnalegur Bayes Reiknirit eru oft notuð til að flokka skjöl, þar sem það er áhrifaríkt við að túlka tíðni orða innan skjals.

Bernoulli Naive Bayes virkar á svipaðan hátt og Multinomial Naive Bayes, en spárnar sem reikniritið gefur upp eru booleans. Þetta þýðir að þegar spáð er fyrir flokk verða gildin tvöfaldur, nei eða já. Á sviði textaflokkunar myndi Bernoulli Naive Bayes reiknirit úthluta breytunum já eða nei eftir því hvort orð finnst í textaskjalinu eða ekki.

Ef verðmæti forspáranna/eiginleikanna er ekki stakt heldur samfellt, Gaussískur barnalegur Bayes getur verið notað. Gert er ráð fyrir að gildin sem samfelldu einkennin hafi verið tekin úr gaussdreifingu.

Bloggari og forritari með sérsvið í vél Learning og Deep Learning efni. Daniel vonast til að hjálpa öðrum að nota kraft gervigreindar í félagslegum tilgangi.