ກ້ານໃບ ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ? - Unite.AI
ເຊື່ອມຕໍ່ກັບພວກເຮົາ
AI Masterclass:

ໄອ 101

Machine Learning ແມ່ນຫຍັງ?

mm
ການປັບປຸງ on

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນ ໜຶ່ງ ໃນສາຂາເຕັກໂນໂລຢີທີ່ເຕີບໃຫຍ່ໄວທີ່ສຸດ, ແຕ່ເຖິງວ່າຈະມີ ຄຳ ວ່າ "ການຮຽນຮູ້ເຄື່ອງຈັກ" ເລື້ອຍໆເທົ່າໃດ, ມັນສາມາດຍາກທີ່ຈະເຂົ້າໃຈວ່າການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ, ແນ່ນອນ.

ການຮຽນຮູ້ເຄື່ອງຈັກ ບໍ່ໄດ້ອ້າງເຖິງພຽງແຕ່ສິ່ງດຽວ, ມັນເປັນຄໍາສັບ umbrella ທີ່ສາມາດນໍາໃຊ້ກັບແນວຄວາມຄິດແລະເຕັກນິກທີ່ແຕກຕ່າງກັນຫຼາຍ. ຄວາມເຂົ້າໃຈການຮຽນຮູ້ເຄື່ອງຈັກຫມາຍເຖິງການຄຸ້ນເຄີຍກັບຮູບແບບທີ່ແຕກຕ່າງກັນຂອງການວິເຄາະຕົວແບບ, ຕົວແປ, ແລະສູດການຄິດໄລ່. ລອງພິຈາລະນາເບິ່ງ machine learning ໃກ້ໆເພື່ອເຂົ້າໃຈດີກວ່າວ່າມັນກວມເອົາຫຍັງ.

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຫຍັງ?

ໃນຂະນະທີ່ ຄຳ ວ່າການຮຽນຮູ້ເຄື່ອງຈັກສາມາດຖືກ ນຳ ໃຊ້ກັບຫຼາຍສິ່ງທີ່ແຕກຕ່າງກັນ, ໂດຍທົ່ວໄປແລ້ວ, ຄຳ ສັບນີ້ ໝາຍ ເຖິງການເຮັດໃຫ້ຄອມພິວເຕີສາມາດປະຕິບັດວຽກງານຕ່າງໆໄດ້ໂດຍບໍ່ໄດ້ຮັບຄໍາແນະນໍາຢ່າງຈະແຈ້ງເພື່ອເຮັດແນວນັ້ນ. ຜູ້ຊ່ຽວຊານດ້ານການຮຽນຮູ້ເຄື່ອງຈັກບໍ່ຈໍາເປັນຕ້ອງຂຽນທຸກຂັ້ນຕອນທີ່ຈໍາເປັນເພື່ອແກ້ໄຂບັນຫາເພາະວ່າຄອມພິວເຕີມີຄວາມສາມາດ "ຮຽນຮູ້" ໂດຍການວິເຄາະຮູບແບບພາຍໃນຂໍ້ມູນແລະໂດຍທົ່ວໄປຮູບແບບເຫຼົ່ານີ້ໄປຫາຂໍ້ມູນໃຫມ່.

ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກມີສາມສ່ວນພື້ນຖານ:

  • ປັດໄຈນໍາເຂົ້າ
  • ລະບົບວິເຄາະ
  • Outputs

ວັດສະດຸປ້ອນແມ່ນຂໍ້ມູນທີ່ປ້ອນເຂົ້າໃນລະບົບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ, ແລະຂໍ້ມູນປ້ອນເຂົ້າສາມາດແບ່ງອອກເປັນປ້າຍກຳກັບ ແລະລັກສະນະຕ່າງໆ. ຄຸນນະສົມບັດແມ່ນຕົວແປທີ່ກ່ຽວຂ້ອງ, ຕົວແປທີ່ຈະຖືກວິເຄາະເພື່ອຮຽນຮູ້ຮູບແບບແລະສະຫຼຸບ. ໃນຂະນະດຽວກັນ, ປ້າຍກຳກັບແມ່ນໝວດໝູ່/ຄຳອະທິບາຍທີ່ມອບໃຫ້ແຕ່ລະຕົວຢ່າງຂອງຂໍ້ມູນ.

ຄຸນສົມບັດ ແລະປ້າຍກຳກັບສາມາດນຳໃຊ້ໄດ້ໃນສອງປະເພດຂອງບັນຫາການຮຽນຮູ້ເຄື່ອງຈັກ: ການຮຽນຮູ້ແບບຄວບຄຸມ ແລະການຮຽນຮູ້ແບບບໍ່ມີການຄວບຄຸມ.

Unsupervised vs. ການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

In ການຮຽນ, ຂໍ້ມູນການປ້ອນຂໍ້ມູນແມ່ນປະກອບດ້ວຍຄວາມຈິງພື້ນຖານ. ບັນຫາການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງມີມູນຄ່າຜົນໄດ້ຮັບທີ່ຖືກຕ້ອງເປັນສ່ວນຫນຶ່ງຂອງຊຸດຂໍ້ມູນ, ດັ່ງນັ້ນຫ້ອງຮຽນທີ່ຄາດໄວ້ແມ່ນຮູ້ຈັກລ່ວງຫນ້າ. ນີ້ເຮັດໃຫ້ມັນເປັນໄປໄດ້ສໍາລັບນັກວິທະຍາສາດຂໍ້ມູນທີ່ຈະກວດສອບການປະຕິບັດຂອງ algorithm ໂດຍການທົດສອບຂໍ້ມູນໃນຊຸດຂໍ້ມູນການທົດສອບແລະເບິ່ງວ່າອັດຕາສ່ວນຂອງລາຍການໄດ້ຖືກຈັດປະເພດຢ່າງຖືກຕ້ອງ.

ໃນ​ທາງ​ກົງ​ກັນ​ຂ້າມ, ການຮຽນຮູ້ທີ່ບໍ່ມີການຄວບຄຸມ ບັນຫາບໍ່ມີປ້າຍຄວາມຈິງທີ່ຕິດຢູ່ກັບພວກມັນ. ສູດການຄິດໄລ່ການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ໄດ້ຮັບການຝຶກອົບຮົມເພື່ອປະຕິບັດວຽກງານການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງຈະຕ້ອງສາມາດຄາດຄະເນຮູບແບບທີ່ກ່ຽວຂ້ອງໃນຂໍ້ມູນສໍາລັບຕົວມັນເອງ.

ສູດການຄິດໄລ່ການຮຽນຮູ້ທີ່ຄວບຄຸມໂດຍປົກກະຕິແລ້ວແມ່ນໃຊ້ສໍາລັບບັນຫາການຈັດປະເພດ, ບ່ອນທີ່ຫນຶ່ງມີຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ເຕັມໄປດ້ວຍຕົວຢ່າງທີ່ຕ້ອງໄດ້ຮັບການຈັດຮຽງເປັນຫນຶ່ງໃນຫຼາຍຊັ້ນຮຽນ. ປະເພດຂອງການຮຽນຮູ້ການຊີ້ນໍາອີກປະການຫນຶ່ງແມ່ນວຽກງານ regression, ບ່ອນທີ່ຜົນຜະລິດມູນຄ່າໂດຍ algorithm ແມ່ນຢ່າງຕໍ່ເນື່ອງໃນລັກສະນະແທນທີ່ຈະເປັນປະເພດ.

ໃນຂະນະດຽວກັນ, ສູດການຄິດໄລ່ການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງແມ່ນໃຊ້ສຳລັບວຽກຕ່າງໆເຊັ່ນ: ການປະເມີນຄວາມໜາແໜ້ນ, ການຈັດກຸ່ມ ແລະ ການຮຽນຮູ້ການເປັນຕົວແທນ. ວຽກງານສາມຢ່າງນີ້ຕ້ອງການຕົວແບບການຮຽນຮູ້ເຄື່ອງຈັກເພື່ອສະຫຼຸບໂຄງສ້າງຂອງຂໍ້ມູນ, ບໍ່ມີຊັ້ນຮຽນທີ່ກໍານົດໄວ້ລ່ວງຫນ້າໃຫ້ກັບຕົວແບບ.

ຂໍໃຫ້ພິຈາລະນາສັ້ນໆກ່ຽວກັບບາງສູດການຄິດໄລ່ທົ່ວໄປທີ່ສຸດທີ່ໃຊ້ໃນການຮຽນຮູ້ແບບບໍ່ມີການຄວບຄຸມ ແລະການຮຽນຮູ້ແບບຄວບຄຸມ.

ປະເພດຂອງການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງ

ສູດການຄິດໄລ່ການຮຽນຮູ້ແບບມີການຄວບຄຸມດູແລທົ່ວໄປລວມມີ:

  • Bayes Naive
  • ຮອງຮັບເຄື່ອງຈັກ Vector
  • Logistic Regression
  • ປ່າ Random
  • ເຄືອຂ່າຍ Neural ທຽມ

ຮອງຮັບເຄື່ອງຈັກ Vector ແມ່ນ algorithms ທີ່ແບ່ງຊຸດຂໍ້ມູນອອກເປັນປະເພດຕ່າງໆ. ຈຸດຂໍ້ມູນຖືກຈັດເປັນກຸ່ມໂດຍການແຕ້ມເສັ້ນທີ່ແຍກຫ້ອງຮຽນຈາກກັນແລະກັນ. ຈຸດທີ່ພົບຢູ່ຂ້າງໜຶ່ງຂອງເສັ້ນນັ້ນຈະເປັນຂອງຊັ້ນໜຶ່ງ, ໃນຂະນະທີ່ຈຸດທີ່ຢູ່ອີກດ້ານໜຶ່ງຂອງເສັ້ນນັ້ນເປັນຊັ້ນຮຽນທີ່ແຕກຕ່າງກັນ. ສະຫນັບສະຫນູນ Vector Machines ມີຈຸດປະສົງເພື່ອຂະຫຍາຍໄລຍະຫ່າງລະຫວ່າງເສັ້ນແລະຈຸດທີ່ພົບເຫັນຢູ່ໃນສອງຂ້າງຂອງເສັ້ນ, ແລະໄລຍະຫ່າງຫຼາຍ, ການຈັດປະເພດຄວາມຫມັ້ນໃຈຫຼາຍແມ່ນວ່າຈຸດເປັນຂອງຊັ້ນຫນຶ່ງແລະບໍ່ແມ່ນຊັ້ນອື່ນ.

Logistic Regression ເປັນສູດການຄິດໄລ່ທີ່ໃຊ້ໃນວຽກງານການຈັດປະເພດຄູ່ ເມື່ອຈຸດຂໍ້ມູນຕ້ອງຖືກຈັດປະເພດເປັນໜຶ່ງໃນສອງຊັ້ນຮຽນ. Logistic Regression ເຮັດວຽກໂດຍການຕິດສະຫຼາກຈຸດຂໍ້ມູນບໍ່ວ່າຈະເປັນ 1 ຫຼື a 0. ຖ້າຄ່າຮັບຮູ້ຂອງຈຸດຂໍ້ມູນແມ່ນ 0.49 ຫຼືຕໍ່າກວ່າ, ມັນຈະຖືກຈັດເປັນ 0, ໃນຂະນະທີ່ຖ້າມັນເປັນ 0.5 ຫຼືສູງກວ່ານັ້ນຈະຖືກຈັດເປັນ 1.

ສູດການຄິດໄລ່ຕົ້ນໄມ້ການຕັດສິນໃຈ ດໍາເນີນການໂດຍການແບ່ງຊຸດຂໍ້ມູນເປັນຊິ້ນສ່ວນນ້ອຍກວ່າແລະນ້ອຍກວ່າ. ເງື່ອນໄຂທີ່ແນ່ນອນທີ່ໃຊ້ໃນການແບ່ງຂໍ້ມູນແມ່ນຂຶ້ນກັບວິສະວະກອນການຮຽນຮູ້ເຄື່ອງຈັກ, ແຕ່ໃນທີ່ສຸດເປົ້າຫມາຍແມ່ນເພື່ອແບ່ງຂໍ້ມູນອອກເປັນຈຸດຂໍ້ມູນດຽວ, ເຊິ່ງຫຼັງຈາກນັ້ນຈະຖືກຈັດປະເພດໂດຍໃຊ້ລະຫັດ.

ສູດການຄິດໄລ່ປ່າໄມ້ແບບສຸ່ມແມ່ນເປັນຕົວຈັດປະເພດ Decision Tree ອັນສຳຄັນຫຼາຍອັນທີ່ເຊື່ອມໂຍງເຂົ້າກັນເປັນຕົວຈັດປະເພດທີ່ມີພະລັງກວ່າ.

ໄດ້ Naive Bayes ຕົວຈັດປະເພດ ຄິດໄລ່ຄວາມເປັນໄປໄດ້ທີ່ຈຸດຂໍ້ມູນທີ່ໄດ້ເກີດຂຶ້ນໂດຍອີງໃສ່ຄວາມເປັນໄປໄດ້ຂອງເຫດການກ່ອນໜ້າທີ່ເກີດຂຶ້ນ. ມັນແມ່ນອີງໃສ່ທິດສະດີ Bayes ແລະມັນວາງຈຸດຂໍ້ມູນເຂົ້າໄປໃນຫ້ອງຮຽນໂດຍອີງໃສ່ຄວາມເປັນໄປໄດ້ທີ່ຄິດໄລ່ຂອງພວກເຂົາ. ເມື່ອປະຕິບັດຕົວຈັດປະເພດ Naive Bayes, ມັນສົມມຸດວ່າຜູ້ຄາດຄະເນທັງຫມົດມີອິດທິພົນດຽວກັນກັບຜົນໄດ້ຮັບຂອງຊັ້ນຮຽນ.

An ເຄືອຂ່າຍປະສາດທຽມ, ຫຼື perceptron ຫຼາຍຊັ້ນ, ແມ່ນລະບົບການຮຽນຮູ້ເຄື່ອງຈັກທີ່ໄດ້ຮັບການດົນໃຈໂດຍໂຄງສ້າງແລະຫນ້າທີ່ຂອງສະຫມອງຂອງມະນຸດ. ເຄືອ​ຂ່າຍ​ປະ​ສາດ​ທຽມ​ໄດ້​ຮັບ​ຊື່​ຂອງ​ເຂົາ​ເຈົ້າ​ຈາກ​ຄວາມ​ຈິງ​ທີ່​ວ່າ​ພວກ​ເຂົາ​ເຈົ້າ​ໄດ້​ຖືກ​ສ້າງ​ຂຶ້ນ​ຈາກ​ຫຼາຍ nodes / neurons ທີ່​ເຊື່ອມ​ຕໍ່​ກັນ​. ທຸກໆ neuron ຈັດການຂໍ້ມູນດ້ວຍຫນ້າທີ່ທາງຄະນິດສາດ. ໃນເຄືອຂ່າຍ neural ທຽມ, ມີຊັ້ນປ້ອນຂໍ້ມູນ, ຊັ້ນເຊື່ອງໄວ້, ແລະຊັ້ນຜົນຜະລິດ.

ຊັ້ນທີ່ເຊື່ອງໄວ້ຂອງເຄືອຂ່າຍ neural ແມ່ນບ່ອນທີ່ຂໍ້ມູນຖືກຕີຄວາມຫມາຍແລະວິເຄາະຮູບແບບ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ມັນແມ່ນບ່ອນທີ່ algorithm ຮຽນຮູ້. neurons ເພີ່ມເຕີມຮ່ວມກັນເຮັດໃຫ້ເຄືອຂ່າຍສະລັບສັບຊ້ອນຫຼາຍສາມາດຮຽນຮູ້ຮູບແບບທີ່ສັບສົນຫຼາຍ.

ປະເພດຂອງການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງ

ຂັ້ນຕອນການຮຽນຮູ້ທີ່ບໍ່ໄດ້ຮັບການເບິ່ງແຍງປະກອບມີ:

  • K- meansາຍເຖິງການຈັດກຸ່ມ
  • ເຄື່ອງເຂົ້າລະຫັດອັດຕະໂນມັດ
  • ການວິເຄາະອົງປະກອບຫຼັກ

K- meansາຍເຖິງການຈັດກຸ່ມ ແມ່ນເຕັກນິກການຈັດປະເພດທີ່ບໍ່ມີການເບິ່ງແຍງ, ແລະມັນເຮັດວຽກໂດຍການແຍກຈຸດຂອງຂໍ້ມູນອອກເປັນກຸ່ມຫຼືກຸ່ມໂດຍອີງໃສ່ລັກສະນະຂອງເຂົາເຈົ້າ. K-means clustering ວິເຄາະລັກສະນະທີ່ພົບເຫັນຢູ່ໃນຈຸດຂໍ້ມູນ ແລະຈໍາແນກຮູບແບບໃນພວກມັນ ທີ່ເຮັດໃຫ້ຈຸດຂໍ້ມູນທີ່ພົບເຫັນຢູ່ໃນກຸ່ມກຸ່ມທີ່ໃຫ້ມາມີຄວາມຄ້າຍຄືກັນຫຼາຍກວ່າທີ່ເຂົາເຈົ້າມີຕໍ່ກັບກຸ່ມທີ່ມີຈຸດຂໍ້ມູນອື່ນໆ. ນີ້ແມ່ນເຮັດໄດ້ໂດຍການວາງສູນກາງທີ່ເປັນໄປໄດ້ສໍາລັບ cluster, ຫຼື centroids, ໃນເສັ້ນສະແດງຂໍ້ມູນແລະກໍາຫນົດຕໍາແຫນ່ງຂອງ centroid ອີກເທື່ອຫນຶ່ງຈົນກ່ວາການພົບເຫັນຕໍາແຫນ່ງທີ່ຫຼຸດຜ່ອນໄລຍະຫ່າງລະຫວ່າງ centroid ແລະຈຸດທີ່ເປັນຂອງຫ້ອງຮຽນ centroid ນັ້ນ. ນັກຄົ້ນຄວ້າສາມາດລະບຸຈໍານວນກຸ່ມທີ່ຕ້ອງການ.

ການວິເຄາະອົງປະກອບຫຼັກ ແມ່ນເຕັກນິກທີ່ຫຼຸດລັກສະນະ/ຕົວແປຈຳນວນຫຼາຍລົງໃສ່ພື້ນທີ່ຄຸນສົມບັດໜ້ອຍລົງ/ຄຸນສົມບັດໜ້ອຍລົງ. "ອົງປະກອບຫຼັກ" ຂອງຈຸດຂໍ້ມູນຖືກເລືອກໄວ້ສໍາລັບການເກັບຮັກສາ, ໃນຂະນະທີ່ລັກສະນະອື່ນໆແມ່ນຖືກບີບລົງເປັນການສະແດງຂະຫນາດນ້ອຍກວ່າ. ຄວາມສໍາພັນລະຫວ່າງ potions ຂໍ້ມູນຕົ້ນສະບັບຖືກຮັກສາໄວ້, ແຕ່ເນື່ອງຈາກຄວາມສັບສົນຂອງຈຸດຂໍ້ມູນແມ່ນງ່າຍດາຍ, ຂໍ້ມູນແມ່ນງ່າຍຕໍ່ການຄິດໄລ່ແລະອະທິບາຍ.

ເຄື່ອງເຂົ້າລະຫັດອັດຕະໂນມັດ ແມ່ນລຸ້ນຂອງເຄືອຂ່າຍ neural ທີ່ສາມາດໃຊ້ກັບວຽກງານການຮຽນຮູ້ທີ່ບໍ່ມີການເບິ່ງແຍງ. Autoencoders ມີຄວາມສາມາດທີ່ຈະເອົາຂໍ້ມູນທີ່ບໍ່ມີປ້າຍຊື່, ຮູບແບບຟຣີແລະປ່ຽນໃຫ້ເຂົາເຈົ້າເຂົ້າໄປໃນຂໍ້ມູນທີ່ເຄືອຂ່າຍ neural ສາມາດນໍາໃຊ້ໄດ້, ໂດຍພື້ນຖານແລ້ວແມ່ນການສ້າງຂໍ້ມູນການຝຶກອົບຮົມທີ່ມີປ້າຍຊື່ຂອງຕົນເອງ. ເປົ້າຫມາຍຂອງ autoencoder ແມ່ນເພື່ອປ່ຽນຂໍ້ມູນການປ້ອນຂໍ້ມູນແລະສ້າງມັນຄືນໃຫມ່ໄດ້ຢ່າງຖືກຕ້ອງເທົ່າທີ່ເປັນໄປໄດ້, ດັ່ງນັ້ນມັນຢູ່ໃນແຮງຈູງໃຈຂອງເຄືອຂ່າຍເພື່ອກໍານົດວ່າລັກສະນະໃດທີ່ສໍາຄັນທີ່ສຸດແລະສະກັດພວກມັນ.

Blogger ແລະ programmer ທີ່ມີຄວາມຊ່ຽວຊານໃນ ການຮຽນຮູ້ເຄື່ອງ ແລະ Deep Learning ຫົວຂໍ້. Daniel ຫວັງ​ວ່າ​ຈະ​ຊ່ວຍ​ໃຫ້​ຄົນ​ອື່ນ​ນໍາ​ໃຊ້​ພະ​ລັງ​ງານ​ຂອງ AI ເພື່ອ​ຄວາມ​ດີ​ຂອງ​ສັງ​ຄົມ.