ໄອ 101

Machine Learning ແມ່ນຫຍັງ?

ການປັບປຸງ on ສິງຫາ 23, 2020

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນ ໜຶ່ງ ໃນສາຂາເຕັກໂນໂລຢີທີ່ເຕີບໃຫຍ່ໄວທີ່ສຸດ, ແຕ່ເຖິງວ່າຈະມີ ຄຳ ວ່າ "ການຮຽນຮູ້ເຄື່ອງຈັກ" ເລື້ອຍໆເທົ່າໃດ, ມັນສາມາດຍາກທີ່ຈະເຂົ້າໃຈວ່າການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ, ແນ່ນອນ.

ການຮຽນຮູ້ເຄື່ອງຈັກ ບໍ່ໄດ້ອ້າງເຖິງພຽງແຕ່ສິ່ງດຽວ, ມັນເປັນຄໍາສັບ umbrella ທີ່ສາມາດນໍາໃຊ້ກັບແນວຄວາມຄິດແລະເຕັກນິກທີ່ແຕກຕ່າງກັນຫຼາຍ. ຄວາມເຂົ້າໃຈການຮຽນຮູ້ເຄື່ອງຈັກຫມາຍເຖິງການຄຸ້ນເຄີຍກັບຮູບແບບທີ່ແຕກຕ່າງກັນຂອງການວິເຄາະຕົວແບບ, ຕົວແປ, ແລະສູດການຄິດໄລ່. ລອງພິຈາລະນາເບິ່ງ machine learning ໃກ້ໆເພື່ອເຂົ້າໃຈດີກວ່າວ່າມັນກວມເອົາຫຍັງ.

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ?

ໃນຂະນະທີ່ ຄຳ ວ່າການຮຽນຮູ້ເຄື່ອງຈັກສາມາດຖືກ ນຳ ໃຊ້ກັບຫຼາຍສິ່ງທີ່ແຕກຕ່າງກັນ, ໂດຍທົ່ວໄປແລ້ວ, ຄຳ ສັບນີ້ ໝາຍ ເຖິງການເຮັດໃຫ້ຄອມພິວເຕີສາມາດປະຕິບັດວຽກງານຕ່າງໆໄດ້ໂດຍບໍ່ໄດ້ຮັບຄໍາແນະນໍາຢ່າງຈະແຈ້ງເພື່ອເຮັດແນວນັ້ນ. ຜູ້ຊ່ຽວຊານດ້ານການຮຽນຮູ້ເຄື່ອງຈັກບໍ່ຈໍາເປັນຕ້ອງຂຽນທຸກຂັ້ນຕອນທີ່ຈໍາເປັນເພື່ອແກ້ໄຂບັນຫາເພາະວ່າຄອມພິວເຕີມີຄວາມສາມາດ "ຮຽນຮູ້" ໂດຍການວິເຄາະຮູບແບບພາຍໃນຂໍ້ມູນແລະໂດຍທົ່ວໄປຮູບແບບເຫຼົ່ານີ້ໄປຫາຂໍ້ມູນໃຫມ່.

ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກມີສາມສ່ວນພື້ນຖານ:

ປັດໄຈນໍາເຂົ້າ
ລະບົບວິເຄາະ
Outputs

ວັດສະດຸປ້ອນແມ່ນຂໍ້ມູນທີ່ປ້ອນເຂົ້າໃນລະບົບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ, ແລະຂໍ້ມູນປ້ອນເຂົ້າສາມາດແບ່ງອອກເປັນປ້າຍກຳກັບ ແລະລັກສະນະຕ່າງໆ. ຄຸນນະສົມບັດແມ່ນຕົວແປທີ່ກ່ຽວຂ້ອງ, ຕົວແປທີ່ຈະຖືກວິເຄາະເພື່ອຮຽນຮູ້ຮູບແບບແລະສະຫຼຸບ. ໃນຂະນະດຽວກັນ, ປ້າຍກຳກັບແມ່ນໝວດໝູ່/ຄຳອະທິບາຍທີ່ມອບໃຫ້ແຕ່ລະຕົວຢ່າງຂອງຂໍ້ມູນ.

ຄຸນສົມບັດ ແລະປ້າຍກຳກັບສາມາດນຳໃຊ້ໄດ້ໃນສອງປະເພດຂອງບັນຫາການຮຽນຮູ້ເຄື່ອງຈັກ: ການຮຽນຮູ້ແບບຄວບຄຸມ ແລະການຮຽນຮູ້ແບບບໍ່ມີການຄວບຄຸມ.

Unsupervised vs. ການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

In ການຮຽນ, ຂໍ້ມູນການປ້ອນຂໍ້ມູນແມ່ນປະກອບດ້ວຍຄວາມຈິງພື້ນຖານ. ບັນຫາການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງມີມູນຄ່າຜົນໄດ້ຮັບທີ່ຖືກຕ້ອງເປັນສ່ວນຫນຶ່ງຂອງຊຸດຂໍ້ມູນ, ດັ່ງນັ້ນຫ້ອງຮຽນທີ່ຄາດໄວ້ແມ່ນຮູ້ຈັກລ່ວງຫນ້າ. ນີ້ເຮັດໃຫ້ມັນເປັນໄປໄດ້ສໍາລັບນັກວິທະຍາສາດຂໍ້ມູນທີ່ຈະກວດສອບການປະຕິບັດຂອງ algorithm ໂດຍການທົດສອບຂໍ້ມູນໃນຊຸດຂໍ້ມູນການທົດສອບແລະເບິ່ງວ່າອັດຕາສ່ວນຂອງລາຍການໄດ້ຖືກຈັດປະເພດຢ່າງຖືກຕ້ອງ.

ໃນທາງກົງກັນຂ້າມ, ການຮຽນຮູ້ທີ່ບໍ່ມີການຄວບຄຸມ ບັນຫາບໍ່ມີປ້າຍຄວາມຈິງທີ່ຕິດຢູ່ກັບພວກມັນ. ສູດການຄິດໄລ່ການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ໄດ້ຮັບການຝຶກອົບຮົມເພື່ອປະຕິບັດວຽກງານການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງຈະຕ້ອງສາມາດຄາດຄະເນຮູບແບບທີ່ກ່ຽວຂ້ອງໃນຂໍ້ມູນສໍາລັບຕົວມັນເອງ.

ສູດການຄິດໄລ່ການຮຽນຮູ້ທີ່ຄວບຄຸມໂດຍປົກກະຕິແລ້ວແມ່ນໃຊ້ສໍາລັບບັນຫາການຈັດປະເພດ, ບ່ອນທີ່ຫນຶ່ງມີຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ເຕັມໄປດ້ວຍຕົວຢ່າງທີ່ຕ້ອງໄດ້ຮັບການຈັດຮຽງເປັນຫນຶ່ງໃນຫຼາຍຊັ້ນຮຽນ. ປະເພດຂອງການຮຽນຮູ້ການຊີ້ນໍາອີກປະການຫນຶ່ງແມ່ນວຽກງານ regression, ບ່ອນທີ່ຜົນຜະລິດມູນຄ່າໂດຍ algorithm ແມ່ນຢ່າງຕໍ່ເນື່ອງໃນລັກສະນະແທນທີ່ຈະເປັນປະເພດ.

ໃນຂະນະດຽວກັນ, ສູດການຄິດໄລ່ການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງແມ່ນໃຊ້ສຳລັບວຽກຕ່າງໆເຊັ່ນ: ການປະເມີນຄວາມໜາແໜ້ນ, ການຈັດກຸ່ມ ແລະ ການຮຽນຮູ້ການເປັນຕົວແທນ. ວຽກງານສາມຢ່າງນີ້ຕ້ອງການຕົວແບບການຮຽນຮູ້ເຄື່ອງຈັກເພື່ອສະຫຼຸບໂຄງສ້າງຂອງຂໍ້ມູນ, ບໍ່ມີຊັ້ນຮຽນທີ່ກໍານົດໄວ້ລ່ວງຫນ້າໃຫ້ກັບຕົວແບບ.

ຂໍໃຫ້ພິຈາລະນາສັ້ນໆກ່ຽວກັບບາງສູດການຄິດໄລ່ທົ່ວໄປທີ່ສຸດທີ່ໃຊ້ໃນການຮຽນຮູ້ແບບບໍ່ມີການຄວບຄຸມ ແລະການຮຽນຮູ້ແບບຄວບຄຸມ.

ປະເພດຂອງການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

ສູດການຄິດໄລ່ການຮຽນຮູ້ແບບມີການຄວບຄຸມດູແລທົ່ວໄປລວມມີ:

Bayes Naive
ຮອງຮັບເຄື່ອງຈັກ Vector
Logistic Regression
ປ່າ Random
ເຄືອຂ່າຍ Neural ທຽມ

ຮອງຮັບເຄື່ອງຈັກ Vector ແມ່ນ algorithms ທີ່ແບ່ງຊຸດຂໍ້ມູນອອກເປັນປະເພດຕ່າງໆ. ຈຸດຂໍ້ມູນຖືກຈັດເປັນກຸ່ມໂດຍການແຕ້ມເສັ້ນທີ່ແຍກຫ້ອງຮຽນຈາກກັນແລະກັນ. ຈຸດທີ່ພົບຢູ່ຂ້າງໜຶ່ງຂອງເສັ້ນນັ້ນຈະເປັນຂອງຊັ້ນໜຶ່ງ, ໃນຂະນະທີ່ຈຸດທີ່ຢູ່ອີກດ້ານໜຶ່ງຂອງເສັ້ນນັ້ນເປັນຊັ້ນຮຽນທີ່ແຕກຕ່າງກັນ. ສະຫນັບສະຫນູນ Vector Machines ມີຈຸດປະສົງເພື່ອຂະຫຍາຍໄລຍະຫ່າງລະຫວ່າງເສັ້ນແລະຈຸດທີ່ພົບເຫັນຢູ່ໃນສອງຂ້າງຂອງເສັ້ນ, ແລະໄລຍະຫ່າງຫຼາຍ, ການຈັດປະເພດຄວາມຫມັ້ນໃຈຫຼາຍແມ່ນວ່າຈຸດເປັນຂອງຊັ້ນຫນຶ່ງແລະບໍ່ແມ່ນຊັ້ນອື່ນ.

Logistic Regression ເປັນສູດການຄິດໄລ່ທີ່ໃຊ້ໃນວຽກງານການຈັດປະເພດຄູ່ ເມື່ອຈຸດຂໍ້ມູນຕ້ອງຖືກຈັດປະເພດເປັນໜຶ່ງໃນສອງຊັ້ນຮຽນ. Logistic Regression ເຮັດວຽກໂດຍການຕິດສະຫຼາກຈຸດຂໍ້ມູນບໍ່ວ່າຈະເປັນ 1 ຫຼື a 0. ຖ້າຄ່າຮັບຮູ້ຂອງຈຸດຂໍ້ມູນແມ່ນ 0.49 ຫຼືຕໍ່າກວ່າ, ມັນຈະຖືກຈັດເປັນ 0, ໃນຂະນະທີ່ຖ້າມັນເປັນ 0.5 ຫຼືສູງກວ່ານັ້ນຈະຖືກຈັດເປັນ 1.

ສູດການຄິດໄລ່ຕົ້ນໄມ້ການຕັດສິນໃຈ ດໍາເນີນການໂດຍການແບ່ງຊຸດຂໍ້ມູນເປັນຊິ້ນສ່ວນນ້ອຍກວ່າແລະນ້ອຍກວ່າ. ເງື່ອນໄຂທີ່ແນ່ນອນທີ່ໃຊ້ໃນການແບ່ງຂໍ້ມູນແມ່ນຂຶ້ນກັບວິສະວະກອນການຮຽນຮູ້ເຄື່ອງຈັກ, ແຕ່ໃນທີ່ສຸດເປົ້າຫມາຍແມ່ນເພື່ອແບ່ງຂໍ້ມູນອອກເປັນຈຸດຂໍ້ມູນດຽວ, ເຊິ່ງຫຼັງຈາກນັ້ນຈະຖືກຈັດປະເພດໂດຍໃຊ້ລະຫັດ.

ສູດການຄິດໄລ່ປ່າໄມ້ແບບສຸ່ມແມ່ນເປັນຕົວຈັດປະເພດ Decision Tree ອັນສຳຄັນຫຼາຍອັນທີ່ເຊື່ອມໂຍງເຂົ້າກັນເປັນຕົວຈັດປະເພດທີ່ມີພະລັງກວ່າ.

ໄດ້ Naive Bayes ຕົວຈັດປະເພດ ຄິດໄລ່ຄວາມເປັນໄປໄດ້ທີ່ຈຸດຂໍ້ມູນທີ່ໄດ້ເກີດຂຶ້ນໂດຍອີງໃສ່ຄວາມເປັນໄປໄດ້ຂອງເຫດການກ່ອນໜ້າທີ່ເກີດຂຶ້ນ. ມັນແມ່ນອີງໃສ່ທິດສະດີ Bayes ແລະມັນວາງຈຸດຂໍ້ມູນເຂົ້າໄປໃນຫ້ອງຮຽນໂດຍອີງໃສ່ຄວາມເປັນໄປໄດ້ທີ່ຄິດໄລ່ຂອງພວກເຂົາ. ເມື່ອປະຕິບັດຕົວຈັດປະເພດ Naive Bayes, ມັນສົມມຸດວ່າຜູ້ຄາດຄະເນທັງຫມົດມີອິດທິພົນດຽວກັນກັບຜົນໄດ້ຮັບຂອງຊັ້ນຮຽນ.

An ເຄືອຂ່າຍປະສາດທຽມ, ຫຼື perceptron ຫຼາຍຊັ້ນ, ແມ່ນລະບົບການຮຽນຮູ້ເຄື່ອງຈັກທີ່ໄດ້ຮັບການດົນໃຈໂດຍໂຄງສ້າງແລະຫນ້າທີ່ຂອງສະຫມອງຂອງມະນຸດ. ເຄືອຂ່າຍປະສາດທຽມໄດ້ຮັບຊື່ຂອງເຂົາເຈົ້າຈາກຄວາມຈິງທີ່ວ່າພວກເຂົາເຈົ້າໄດ້ຖືກສ້າງຂຶ້ນຈາກຫຼາຍ nodes / neurons ທີ່ເຊື່ອມຕໍ່ກັນ. ທຸກໆ neuron ຈັດການຂໍ້ມູນດ້ວຍຫນ້າທີ່ທາງຄະນິດສາດ. ໃນເຄືອຂ່າຍ neural ທຽມ, ມີຊັ້ນປ້ອນຂໍ້ມູນ, ຊັ້ນເຊື່ອງໄວ້, ແລະຊັ້ນຜົນຜະລິດ.

ຊັ້ນທີ່ເຊື່ອງໄວ້ຂອງເຄືອຂ່າຍ neural ແມ່ນບ່ອນທີ່ຂໍ້ມູນຖືກຕີຄວາມຫມາຍແລະວິເຄາະຮູບແບບ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ມັນແມ່ນບ່ອນທີ່ algorithm ຮຽນຮູ້. neurons ເພີ່ມເຕີມຮ່ວມກັນເຮັດໃຫ້ເຄືອຂ່າຍສະລັບສັບຊ້ອນຫຼາຍສາມາດຮຽນຮູ້ຮູບແບບທີ່ສັບສົນຫຼາຍ.

ປະເພດຂອງການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງ

ຂັ້ນຕອນການຮຽນຮູ້ທີ່ບໍ່ໄດ້ຮັບການເບິ່ງແຍງປະກອບມີ:

K- meansາຍເຖິງການຈັດກຸ່ມ
ເຄື່ອງເຂົ້າລະຫັດອັດຕະໂນມັດ
ການວິເຄາະອົງປະກອບຫຼັກ

K- meansາຍເຖິງການຈັດກຸ່ມ ແມ່ນເຕັກນິກການຈັດປະເພດທີ່ບໍ່ມີການເບິ່ງແຍງ, ແລະມັນເຮັດວຽກໂດຍການແຍກຈຸດຂອງຂໍ້ມູນອອກເປັນກຸ່ມຫຼືກຸ່ມໂດຍອີງໃສ່ລັກສະນະຂອງເຂົາເຈົ້າ. K-means clustering ວິເຄາະລັກສະນະທີ່ພົບເຫັນຢູ່ໃນຈຸດຂໍ້ມູນ ແລະຈໍາແນກຮູບແບບໃນພວກມັນ ທີ່ເຮັດໃຫ້ຈຸດຂໍ້ມູນທີ່ພົບເຫັນຢູ່ໃນກຸ່ມກຸ່ມທີ່ໃຫ້ມາມີຄວາມຄ້າຍຄືກັນຫຼາຍກວ່າທີ່ເຂົາເຈົ້າມີຕໍ່ກັບກຸ່ມທີ່ມີຈຸດຂໍ້ມູນອື່ນໆ. ນີ້ແມ່ນເຮັດໄດ້ໂດຍການວາງສູນກາງທີ່ເປັນໄປໄດ້ສໍາລັບ cluster, ຫຼື centroids, ໃນເສັ້ນສະແດງຂໍ້ມູນແລະກໍາຫນົດຕໍາແຫນ່ງຂອງ centroid ອີກເທື່ອຫນຶ່ງຈົນກ່ວາການພົບເຫັນຕໍາແຫນ່ງທີ່ຫຼຸດຜ່ອນໄລຍະຫ່າງລະຫວ່າງ centroid ແລະຈຸດທີ່ເປັນຂອງຫ້ອງຮຽນ centroid ນັ້ນ. ນັກຄົ້ນຄວ້າສາມາດລະບຸຈໍານວນກຸ່ມທີ່ຕ້ອງການ.

ການວິເຄາະອົງປະກອບຫຼັກ ແມ່ນເຕັກນິກທີ່ຫຼຸດລັກສະນະ/ຕົວແປຈຳນວນຫຼາຍລົງໃສ່ພື້ນທີ່ຄຸນສົມບັດໜ້ອຍລົງ/ຄຸນສົມບັດໜ້ອຍລົງ. "ອົງປະກອບຫຼັກ" ຂອງຈຸດຂໍ້ມູນຖືກເລືອກໄວ້ສໍາລັບການເກັບຮັກສາ, ໃນຂະນະທີ່ລັກສະນະອື່ນໆແມ່ນຖືກບີບລົງເປັນການສະແດງຂະຫນາດນ້ອຍກວ່າ. ຄວາມສໍາພັນລະຫວ່າງ potions ຂໍ້ມູນຕົ້ນສະບັບຖືກຮັກສາໄວ້, ແຕ່ເນື່ອງຈາກຄວາມສັບສົນຂອງຈຸດຂໍ້ມູນແມ່ນງ່າຍດາຍ, ຂໍ້ມູນແມ່ນງ່າຍຕໍ່ການຄິດໄລ່ແລະອະທິບາຍ.

ເຄື່ອງເຂົ້າລະຫັດອັດຕະໂນມັດ ແມ່ນລຸ້ນຂອງເຄືອຂ່າຍ neural ທີ່ສາມາດໃຊ້ກັບວຽກງານການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງ. Autoencoders ມີຄວາມສາມາດທີ່ຈະເອົາຂໍ້ມູນທີ່ບໍ່ມີປ້າຍຊື່, ຮູບແບບຟຣີແລະປ່ຽນໃຫ້ເຂົາເຈົ້າເຂົ້າໄປໃນຂໍ້ມູນທີ່ເຄືອຂ່າຍ neural ສາມາດນໍາໃຊ້ໄດ້, ໂດຍພື້ນຖານແລ້ວແມ່ນການສ້າງຂໍ້ມູນການຝຶກອົບຮົມທີ່ມີປ້າຍຊື່ຂອງຕົນເອງ. ເປົ້າຫມາຍຂອງ autoencoder ແມ່ນເພື່ອປ່ຽນຂໍ້ມູນການປ້ອນຂໍ້ມູນແລະສ້າງມັນຄືນໃຫມ່ໄດ້ຢ່າງຖືກຕ້ອງເທົ່າທີ່ເປັນໄປໄດ້, ດັ່ງນັ້ນມັນຢູ່ໃນແຮງຈູງໃຈຂອງເຄືອຂ່າຍເພື່ອກໍານົດວ່າລັກສະນະໃດທີ່ສໍາຄັນທີ່ສຸດແລະສະກັດພວກມັນ.

ຫົວຂໍ້ທີ່ກ່ຽວຂ້ອງ:101

ຂຶ້ນຕໍ່ໄປ

ການຮຽນຮູ້ເລິກເຊິ່ງແມ່ນຫຍັງ?

Daniel Nelson

Blogger ແລະ programmer ທີ່ມີຄວາມຊ່ຽວຊານໃນ ການຮຽນຮູ້ເຄື່ອງ ແລະ Deep Learning ຫົວຂໍ້. Daniel ຫວັງວ່າຈະຊ່ວຍໃຫ້ຄົນອື່ນນໍາໃຊ້ພະລັງງານຂອງ AI ເພື່ອຄວາມດີຂອງສັງຄົມ.

Unite.AI

Machine Learning ແມ່ນຫຍັງ?

ໄອ 101

Machine Learning ແມ່ນຫຍັງ?

ສາລະບານ

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ?

Unsupervised vs. ການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

ປະເພດຂອງການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

ປະເພດຂອງການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງ

Unite.AI

Machine Learning ແມ່ນຫຍັງ?

ສາ​ລະ​ບານ

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ?

Unsupervised vs. ການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

ປະເພດຂອງການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

ປະເພດຂອງການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງ

ທ່ານອາດຈະມັກ

ສາລະບານ