ໄອ 101

Bayes Theorem ແມ່ນຫຍັງ?

ການປັບປຸງ on ສິງຫາ 23, 2020

ຖ້າທ່ານໄດ້ຮຽນຮູ້ກ່ຽວກັບວິທະຍາສາດຂໍ້ມູນຫຼືການຮຽນຮູ້ເຄື່ອງຈັກ, ມີໂອກາດທີ່ດີທີ່ທ່ານໄດ້ຍິນ ຄໍາວ່າ "ທິດສະດີ Bayes" ກ່ອນ, ຫຼື "ຕົວຈັດປະເພດ Bayes". ແນວຄວາມຄິດເຫຼົ່ານີ້ອາດຈະສັບສົນເລັກນ້ອຍ, ໂດຍສະເພາະຖ້າທ່ານບໍ່ຄຸ້ນເຄີຍກັບການຄິດເຖິງຄວາມເປັນໄປໄດ້ຈາກທັດສະນະສະຖິຕິແບບດັ້ງເດີມ, ເລື້ອຍໆ. ບົດຄວາມນີ້ຈະພະຍາຍາມອະທິບາຍຫຼັກການທີ່ຢູ່ເບື້ອງຫຼັງ Bayes Theorem ແລະວິທີທີ່ມັນຖືກນໍາໃຊ້ໃນການຮຽນຮູ້ເຄື່ອງຈັກ.

Bayes Theorem ແມ່ນຫຍັງ?

Bayes Theorem ແມ່ນວິທີການຂອງ ການຄິດໄລ່ຄວາມເປັນໄປໄດ້ຕາມເງື່ອນໄຂ. ວິທີການແບບດັ້ງເດີມຂອງການຄິດໄລ່ຄວາມເປັນໄປໄດ້ຕາມເງື່ອນໄຂ (ຄວາມເປັນໄປໄດ້ທີ່ເຫດການຫນຶ່ງເກີດຂື້ນໂດຍການເກີດຂອງເຫດການທີ່ແຕກຕ່າງກັນ) ແມ່ນການໃຊ້ສູດຄວາມເປັນໄປໄດ້ຕາມເງື່ອນໄຂ, ການຄິດໄລ່ຄວາມເປັນໄປໄດ້ຮ່ວມກັນຂອງເຫດການຫນຶ່ງແລະເຫດການສອງທີ່ເກີດຂຶ້ນໃນເວລາດຽວກັນ, ແລະຫຼັງຈາກນັ້ນແບ່ງອອກ. ໂດຍຄວາມເປັນໄປໄດ້ຂອງເຫດການສອງເກີດຂຶ້ນ. ຢ່າງໃດກໍ່ຕາມ, ຄວາມເປັນໄປໄດ້ຕາມເງື່ອນໄຂຍັງສາມາດຖືກຄິດໄລ່ໃນຮູບແບບທີ່ແຕກຕ່າງກັນເລັກນ້ອຍໂດຍໃຊ້ Bayes Theorem.

ເມື່ອຄິດໄລ່ຄວາມເປັນໄປໄດ້ຕາມເງື່ອນໄຂກັບທິດສະດີ Bayes, ທ່ານໃຊ້ຂັ້ນຕອນຕໍ່ໄປນີ້:

ກໍານົດຄວາມເປັນໄປໄດ້ຂອງເງື່ອນໄຂ B ເປັນຄວາມຈິງ, ສົມມຸດວ່າເງື່ອນໄຂ A ເປັນຄວາມຈິງ.
ກໍານົດຄວາມເປັນໄປໄດ້ຂອງເຫດການ A ເປັນຄວາມຈິງ.
ຄູນສອງຄວາມເປັນໄປໄດ້ຮ່ວມກັນ.
ແບ່ງຕາມຄວາມເປັນໄປໄດ້ຂອງເຫດການ B ທີ່ເກີດຂື້ນ.

ນີ້ຫມາຍຄວາມວ່າສູດສໍາລັບ Bayes Theorem ສາມາດສະແດງອອກເຊັ່ນນີ້:

P(A|B) = P(B|A)*P(A) / P(B)

ການຄິດໄລ່ຄວາມເປັນໄປໄດ້ຕາມເງື່ອນໄຂເຊັ່ນນີ້ແມ່ນເປັນປະໂຫຍດໂດຍສະເພາະເມື່ອຄວາມເປັນໄປໄດ້ຂອງເງື່ອນໄຂທີ່ກົງກັນຂ້າມສາມາດຖືກຄິດໄລ່ໄດ້ງ່າຍ, ຫຼືໃນເວລາທີ່ການຄິດໄລ່ຄວາມເປັນໄປໄດ້ຮ່ວມກັນຈະທ້າທາຍເກີນໄປ.

ຕົວຢ່າງຂອງ Bayes Theorem

ອັນນີ້ອາດຈະງ່າຍຂຶ້ນໃນການຕີຄວາມໝາຍຖ້າພວກເຮົາໃຊ້ເວລາເບິ່ງຢູ່ ຍົກຕົວຢ່າງ ວິທີທີ່ທ່ານຈະນໍາໃຊ້ເຫດຜົນ Bayesian ແລະ Bayes Theorem. ໃຫ້ສົມມຸດວ່າທ່ານກໍາລັງຫຼິ້ນເກມທີ່ງ່າຍດາຍທີ່ຜູ້ເຂົ້າຮ່ວມຫຼາຍຄົນບອກທ່ານເລື່ອງຫນຶ່ງແລະທ່ານຕ້ອງກໍານົດວ່າຫນຶ່ງໃນຜູ້ເຂົ້າຮ່ວມໄດ້ຕົວະທ່ານ. ໃຫ້ພວກເຮົາຕື່ມຂໍ້ມູນໃສ່ໃນສົມຜົນຂອງ Bayes Theorem ດ້ວຍຕົວແປໃນສະຖານະການສົມມຸດຕິຖານນີ້.

ພວກເຮົາພະຍາຍາມຄາດຄະເນວ່າແຕ່ລະຄົນໃນເກມຈະຕົວະຫຼືເວົ້າຄວາມຈິງ, ດັ່ງນັ້ນຖ້າມີຜູ້ຫຼິ້ນສາມຄົນນອກຈາກເຈົ້າ, ຕົວແປປະເພດສາມາດສະແດງອອກເປັນ A1, A2, ແລະ A3. ຫຼັກຖານສໍາລັບການຕົວະ / ຄວາມຈິງຂອງພວກເຂົາແມ່ນພຶດຕິກໍາຂອງພວກເຂົາ. ເຊັ່ນດຽວກັນກັບເວລາຫຼີ້ນໂປ໊ກເກີ, ເຈົ້າຈະຊອກຫາ "ບອກ" ບາງຢ່າງວ່າຄົນຂີ້ຕົວະແລະໃຊ້ຂໍ້ມູນເຫຼົ່ານັ້ນເພື່ອບອກການຄາດເດົາຂອງເຈົ້າ. ຫຼືຖ້າທ່ານໄດ້ຮັບອະນຸຍາດໃຫ້ຖາມພວກເຂົາ, ມັນຈະເປັນຫຼັກຖານໃດໆທີ່ເລື່ອງຂອງເຂົາເຈົ້າບໍ່ໄດ້ເພີ່ມ. ພວກເຮົາສາມາດເປັນຕົວແທນຂອງຫຼັກຖານທີ່ວ່າບຸກຄົນໃດຫນຶ່ງໄດ້ນອນເປັນ B.

ເພື່ອໃຫ້ຈະແຈ້ງ, ພວກເຮົາກໍາລັງມຸ່ງຫວັງທີ່ຈະຄາດຄະເນຄວາມເປັນໄປໄດ້ (A ແມ່ນການຕົວະ / ບອກຄວາມຈິງ| ໃຫ້ຫຼັກຖານຂອງພຶດຕິກໍາຂອງພວກເຂົາ). ເພື່ອເຮັດສິ່ງນີ້, ພວກເຮົາຕ້ອງການຄິດໄລ່ຄວາມເປັນໄປໄດ້ຂອງ B ທີ່ໃຫ້ A, ຫຼືຄວາມເປັນໄປໄດ້ທີ່ພຶດຕິກໍາຂອງພວກເຂົາຈະເກີດຂື້ນກັບຄົນທີ່ເວົ້າຕົວະຫຼືເວົ້າຄວາມຈິງ. ທ່ານກໍາລັງພະຍາຍາມກໍານົດພາຍໃຕ້ເງື່ອນໄຂທີ່ພຶດຕິກໍາທີ່ທ່ານກໍາລັງເຫັນຈະມີຄວາມຫມາຍຫຼາຍທີ່ສຸດ. ຖ້າມີສາມພຶດຕິກໍາທີ່ເຈົ້າເປັນພະຍານ, ເຈົ້າຈະຄິດໄລ່ສໍາລັບແຕ່ລະພຶດຕິກໍາ. ຕົວຢ່າງ, P(B1, B2, B3 * A). ຫຼັງຈາກນັ້ນທ່ານຈະເຮັດສິ່ງນີ້ສໍາລັບການປະກົດຕົວຂອງ A / ສໍາລັບທຸກໆຄົນໃນເກມນອກຈາກຕົວທ່ານເອງ. ນັ້ນແມ່ນສ່ວນຂອງສົມຜົນຂ້າງເທິງນີ້:

P(B1, B2, B3,|A) * P|A

ສຸດທ້າຍ, ພວກເຮົາພຽງແຕ່ແບ່ງມັນໂດຍຄວາມເປັນໄປໄດ້ຂອງ B.

ຖ້າພວກເຮົາໄດ້ຮັບຫຼັກຖານໃດໆກ່ຽວກັບຄວາມເປັນໄປໄດ້ທີ່ແທ້ຈິງໃນສົມຜົນນີ້, ພວກເຮົາຈະສ້າງແບບຈໍາລອງຄວາມເປັນໄປໄດ້ຂອງພວກເຮົາໃຫມ່, ພິຈາລະນາຫຼັກຖານໃຫມ່. ອັນນີ້ເອີ້ນວ່າການປັບປຸງກ່ອນໜ້າຂອງເຈົ້າ, ເມື່ອທ່ານອັບເດດສົມມຸດຕິຖານຂອງເຈົ້າກ່ຽວກັບຄວາມເປັນໄປໄດ້ກ່ອນໜ້າຂອງເຫດການທີ່ສັງເກດໄດ້ເກີດຂຶ້ນ.

ຄໍາຮ້ອງສະຫມັກການຮຽນຮູ້ເຄື່ອງຈັກສໍາລັບທິດສະດີ Bayes

ການນໍາໃຊ້ທົ່ວໄປທີ່ສຸດຂອງທິດສະດີ Bayes ໃນເວລາທີ່ມັນມາກັບການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຢູ່ໃນຮູບແບບຂອງ Naive Bayes algorithm.

Naive Bayes ຖືກໃຊ້ສໍາລັບການຈັດປະເພດຊຸດຂໍ້ມູນສອງຊັ້ນແລະຫຼາຍຊັ້ນ, Naive Bayes ໄດ້ຮັບຊື່ຂອງມັນເພາະວ່າຄ່າທີ່ຖືກມອບໃຫ້ຫຼັກຖານ / ຄຸນລັກສະນະຂອງພະຍານ - Bs ໃນ P (B1, B2, B3 * A) - ຖືວ່າເປັນເອກະລາດ. ຂອງກັນແລະກັນ. ມັນສົມມຸດວ່າຄຸນລັກສະນະເຫຼົ່ານີ້ບໍ່ມີຜົນກະທົບເຊິ່ງກັນແລະກັນເພື່ອເຮັດໃຫ້ຕົວແບບງ່າຍດາຍແລະເຮັດໃຫ້ການຄິດໄລ່ເປັນໄປໄດ້, ແທນທີ່ຈະພະຍາຍາມວຽກງານທີ່ສັບສົນຂອງການຄິດໄລ່ຄວາມສໍາພັນລະຫວ່າງແຕ່ລະຄຸນລັກສະນະ. ເຖິງວ່າຈະມີຮູບແບບທີ່ງ່າຍດາຍນີ້, Naive Bayes ມັກຈະປະຕິບັດໄດ້ດີເປັນວິທີການຈັດປະເພດ, ເຖິງແມ່ນວ່າສົມມຸດຕິຖານນີ້ອາດຈະບໍ່ເປັນຄວາມຈິງ (ເຊິ່ງສ່ວນຫຼາຍແມ່ນ).

ນອກນັ້ນຍັງມີ ຕົວແປທີ່ໃຊ້ທົ່ວໄປ ຂອງປະເພດ Naive Bayes ເຊັ່ນ Multinomial Naive Bayes, Bernoulli Naive Bayes, ແລະ Gaussian Naive Bayes.

Multinomial Naive Bayes algorithms ມັກຖືກນໍາໃຊ້ເພື່ອຈັດປະເພດເອກະສານ, ຍ້ອນວ່າມັນມີປະສິດທິພາບໃນການຕີຄວາມຖີ່ຂອງຄໍາສັບຕ່າງໆພາຍໃນເອກະສານ.

Bernoulli Naive Bayes ດໍາເນີນການຄ້າຍຄືກັນກັບ Multinomial Naive Bayes, ແຕ່ການຄາດຄະເນທີ່ສະແດງໂດຍສູດການຄິດໄລ່ແມ່ນ booleans. ນີ້ ໝາຍ ຄວາມວ່າເມື່ອຄາດຄະເນຊັ້ນຮຽນ, ຄ່າຈະເປັນຖານສອງ, ບໍ່ແມ່ນຫຼືແມ່ນ. ໃນໂດເມນຂອງການຈັດປະເພດຂໍ້ຄວາມ, algorithm Bernoulli Naive Bayes ຈະກໍານົດພາລາມິເຕີແມ່ນແມ່ນຫຼືບໍ່ແມ່ນໂດຍອີງໃສ່ວ່າຄໍາໃດຖືກພົບເຫັນຢູ່ໃນເອກະສານຂໍ້ຄວາມ.

ຖ້າມູນຄ່າຂອງຕົວຄາດເດົາ / ຄຸນສົມບັດບໍ່ແຍກກັນແຕ່ແທນທີ່ຈະຕໍ່ເນື່ອງ, Gaussian Naive Bayes ສາມາດນໍາໃຊ້ໄດ້. ມັນສົມມຸດວ່າຄ່າຂອງລັກສະນະຢ່າງຕໍ່ເນື່ອງໄດ້ຖືກຕົວຢ່າງຈາກການແຈກຢາຍ gaussian.

ຫົວຂໍ້ທີ່ກ່ຽວຂ້ອງ:ລະບົບວິເຄາະ ທິດສະດີບົດ bayes ການຮຽນຮູ້ເຄື່ອງ naive bayes

ຂຶ້ນຕໍ່ໄປ

ການຮຽນຮູ້ການເສີມສ້າງຢ່າງເລິກເຊິ່ງແມ່ນຫຍັງ?

ຢ່າພາດ

RNNs ແລະ LSTMs ແມ່ນຫຍັງໃນການຮຽນຮູ້ເລິກເຊິ່ງ?

Daniel Nelson

Blogger ແລະ programmer ທີ່ມີຄວາມຊ່ຽວຊານໃນ ການຮຽນຮູ້ເຄື່ອງ ແລະ Deep Learning ຫົວຂໍ້. Daniel ຫວັງວ່າຈະຊ່ວຍໃຫ້ຄົນອື່ນນໍາໃຊ້ພະລັງງານຂອງ AI ເພື່ອຄວາມດີຂອງສັງຄົມ.