ປັນຍາປະດິດ

ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມຍັງກ່ຽວຂ້ອງບໍ?

ຈັດພີມມາ

6 ເດືອນທີ່ແລ້ວ

ພະຈິກ 6, 2023

ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມຍັງກ່ຽວຂ້ອງບໍ?

ໃນຊຸມປີມໍ່ໆມານີ້, Generative AI ໄດ້ສະແດງໃຫ້ເຫັນຜົນໄດ້ຮັບທີ່ດີໃນການແກ້ໄຂວຽກງານ AI ທີ່ສັບສົນ. ຮູບແບບ AI ທີ່ທັນສະໄຫມເຊັ່ນ ສົນທະນາ GPT, Bard, ໂທ, DALL-E.3, ແລະ SAM ໄດ້ສະແດງໃຫ້ເຫັນຄວາມສາມາດທີ່ໂດດເດັ່ນໃນການແກ້ໄຂບັນຫາຫຼາຍດ້ານເຊັ່ນ: ການຕອບຄໍາຖາມແບບສາຍຕາ, ການແບ່ງສ່ວນ, ການໃຫ້ເຫດຜົນ, ແລະການສ້າງເນື້ອຫາ.

ຍິ່ງໄປກວ່ານັ້ນ, Multimodal AI ເຕັກນິກການໄດ້ເກີດຂຶ້ນ, ມີຄວາມສາມາດໃນການປະມວນຜົນຂໍ້ມູນຫຼາຍຮູບແບບ, ເຊັ່ນ, ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ແລະວິດີໂອພ້ອມກັນ. ດ້ວຍຄວາມກ້າວໜ້າເຫຼົ່ານີ້, ມັນເປັນເລື່ອງທຳມະຊາດທີ່ຈະສົງໄສ: ເຮົາໃກ້ຮອດຈຸດຈົບແລ້ວ ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມ (ML)?

ໃນບົດຄວາມນີ້, ພວກເຮົາຈະເບິ່ງສະພາບຂອງພູມສັນຖານການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມກ່ຽວກັບການປະດິດສ້າງ AI ທີ່ທັນສະໄຫມ.

ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມແມ່ນຫຍັງ? – ຂໍ້ຈໍາກັດຂອງຕົນແມ່ນຫຍັງ?

ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມແມ່ນເປັນຄໍາທີ່ກວ້າງຂວາງທີ່ກວມເອົາຫຼາກຫຼາຍຂອງ algorithms ຕົ້ນຕໍໂດຍສະຖິຕິ. ສອງປະເພດຕົ້ນຕໍຂອງສູດການຄິດໄລ່ ML ແບບດັ້ງເດີມແມ່ນ ຄວບຄຸມ ແລະບໍ່ມີການຄວບຄຸມ. ສູດການຄິດໄລ່ເຫຼົ່ານີ້ຖືກອອກແບບມາເພື່ອພັດທະນາຕົວແບບຈາກຊຸດຂໍ້ມູນທີ່ມີໂຄງສ້າງ.

ຂັ້ນຕອນການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມມາດຕະຖານປະກອບມີ:

Regression algorithms ເຊັ່ນ: linear, lasso, and ridge.
K ຫມາຍຄວາມວ່າການກຸ່ມ.
ການວິເຄາະອົງປະກອບຫຼັກ (PCA).
ສະຫນັບສະຫນູນ Vector Machines (SVM).
ສູດການຄິດໄລ່ຕາມຕົ້ນໄມ້ເຊັ່ນ: ຕົ້ນໄມ້ຕັດສິນໃຈ ແລະປ່າໄມ້ແບບສຸ່ມ.
ຮູບແບບການຊຸກຍູ້ເຊັ່ນ: gradient boosting ແລະ XGBoost.

ຂໍ້ຈໍາກັດຂອງການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມ

ML ແບບດັ້ງເດີມມີຂໍ້ຈໍາກັດຕໍ່ໄປນີ້:

ຄວາມສາມາດຂະຫຍາຍຕົວຈໍາກັດ: ຮູບແບບເຫຼົ່ານີ້ມັກຈະຕ້ອງການຄວາມຊ່ວຍເຫຼືອເພື່ອຂະຫຍາຍຊຸດຂໍ້ມູນທີ່ມີຂະຫນາດໃຫຍ່ ແລະຫຼາກຫຼາຍ.
ການປະມວນຜົນຂໍ້ມູນ ແລະວິສະວະກຳຄຸນສົມບັດ: ML ແບບດັ້ງເດີມຮຽກຮ້ອງໃຫ້ມີການປະມວນຜົນກ່ອນຢ່າງກວ້າງຂວາງເພື່ອປ່ຽນຊຸດຂໍ້ມູນຕາມຄວາມຕ້ອງການຂອງຕົວແບບ. ນອກຈາກນີ້, ວິສະວະກໍາຄຸນສົມບັດສາມາດໃຊ້ເວລາຫຼາຍແລະຮຽກຮ້ອງໃຫ້ມີການຊ້ໍາກັນຫຼາຍເພື່ອເກັບກໍາຄວາມສໍາພັນທີ່ຊັບຊ້ອນລະຫວ່າງລັກສະນະຂໍ້ມູນ.
ຂໍ້ມູນຂະໜາດສູງ ແລະບໍ່ມີໂຄງສ້າງ: ML ແບບດັ້ງເດີມຕໍ່ສູ້ກັບປະເພດຂອງຂໍ້ມູນທີ່ຊັບຊ້ອນເຊັ່ນ: ຮູບພາບ, ສຽງ, ວິດີໂອ, ແລະເອກະສານ.
ການປັບຕົວເຂົ້າກັບຂໍ້ມູນທີ່ບໍ່ເຫັນ: ໂມເດວເຫຼົ່ານີ້ອາດຈະບໍ່ປັບຕົວເຂົ້າກັບຂໍ້ມູນໃນໂລກທີ່ແທ້ຈິງທີ່ບໍ່ໄດ້ເປັນສ່ວນຫນຶ່ງຂອງພວກມັນ ຂໍ້ມູນການຝຶກອົບຮົມ.

ເຄືອຂ່າຍ Neural: ການເຄື່ອນຍ້າຍຈາກການຮຽນຮູ້ເຄື່ອງຈັກໄປສູ່ການຮຽນຮູ້ທີ່ເລິກເຊິ່ງ & Beyond

ແບບຈໍາລອງເຄືອຂ່າຍ Neural (NN) ມີຄວາມຊັບຊ້ອນຫຼາຍກ່ວາແບບຈໍາລອງ Machine Learning ແບບດັ້ງເດີມ. NN ງ່າຍທີ່ສຸດ - ຄວາມຮັບຮູ້ຫຼາຍຊັ້ນ (MLP) ປະກອບດ້ວຍຫຼາຍ neurons ເຊື່ອມຕໍ່ກັນເພື່ອເຂົ້າໃຈຂໍ້ມູນຂ່າວສານແລະປະຕິບັດວຽກງານ, ຄ້າຍຄືກັນກັບວິທີການສະຫມອງຂອງມະນຸດ.

ຄວາມກ້າວຫນ້າໃນເຕັກນິກເຄືອຂ່າຍ neural ໄດ້ສ້າງພື້ນຖານສໍາລັບການຫັນປ່ຽນຈາກ ການຮຽນຮູ້ເຄື່ອງຈັກເພື່ອການຮຽນຮູ້ເລິກ. ສໍາລັບຕົວຢ່າງ, NN ທີ່ໃຊ້ສໍາລັບວຽກງານການເບິ່ງເຫັນຄອມພິວເຕີ (ການຊອກຄົ້ນຫາວັດຖຸແລະການແບ່ງສ່ວນຮູບພາບ) ຖືກເອີ້ນວ່າ. ເຄືອຂ່າຍ neural convolutional (CNNs), ເຊັ່ນວ່າ AlexNet, ResNet, ແລະ YOLO.

ໃນມື້ນີ້, ເຕັກໂນໂລຢີ AI ທົ່ວໄປກໍາລັງໃຊ້ເຕັກນິກເຄືອຂ່າຍ neural ອີກບາດກ້າວຫນຶ່ງ, ເຮັດໃຫ້ມັນດີເລີດໃນໂດເມນ AI ຕ່າງໆ. ສໍາລັບຕົວຢ່າງ, ເຄືອຂ່າຍ neural ທີ່ໃຊ້ສໍາລັບວຽກງານການປຸງແຕ່ງພາສາທໍາມະຊາດ (ເຊັ່ນ: ການສະຫຼຸບຂໍ້ຄວາມ, ການຕອບຄໍາຖາມແລະການແປພາສາ) ແມ່ນເປັນທີ່ຮູ້ຈັກເປັນ. transformers. ຮູບແບບການຫັນເປັນທີ່ໂດດເດັ່ນປະກອບມີ ເບີ, GPT-4, ແລະ T5. ຕົວແບບເຫຼົ່ານີ້ພວມສ້າງຜົນກະທົບຕໍ່ອຸດສາຫະກຳນັບແຕ່ການດູແລສຸຂະພາບ, ການຄ້າປີກ, ການຕະຫຼາດ, ທາງດ້ານການເງິນ, ແລະອື່ນໆ

ພວກເຮົາຍັງຕ້ອງການວິທີການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມບໍ?

ໃນຂະນະທີ່ເຄືອຂ່າຍ neural ແລະຕົວແປທີ່ທັນສະໄຫມຂອງພວກເຂົາເຊັ່ນເຄື່ອງຫັນເປັນໄດ້ຮັບຄວາມສົນໃຈຫຼາຍ, ວິທີການ ML ແບບດັ້ງເດີມຍັງຄົງມີຄວາມສໍາຄັນ. ໃຫ້ພວກເຮົາເບິ່ງວ່າເປັນຫຍັງພວກມັນຍັງກ່ຽວຂ້ອງ.

1. ຄວາມຕ້ອງການຂໍ້ມູນແບບງ່າຍດາຍ

ເຄືອຂ່າຍ neural ຕ້ອງການຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ສໍາລັບການຝຶກອົບຮົມ, ໃນຂະນະທີ່ແບບຈໍາລອງ ML ສາມາດບັນລຸຜົນໄດ້ຮັບທີ່ສໍາຄັນດ້ວຍຊຸດຂໍ້ມູນຂະຫນາດນ້ອຍກວ່າແລະງ່າຍດາຍ. ດັ່ງນັ້ນ, ML ຈຶ່ງໄດ້ຮັບຄວາມນິຍົມຫຼາຍກວ່າການຮຽນຮູ້ເລິກສໍາລັບຊຸດຂໍ້ມູນທີ່ມີໂຄງສ້າງຂະຫນາດນ້ອຍກວ່າແລະໃນທາງກັບກັນ.

2. ຄວາມລຽບງ່າຍ ແລະ ການແປ

ຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມແມ່ນສ້າງຂຶ້ນຢູ່ເທິງສຸດຂອງຕົວແບບສະຖິຕິທີ່ງ່າຍກວ່າ ແລະຄວາມເປັນໄປໄດ້. ຕົວຢ່າງ, ເສັ້ນທີ່ເຫມາະສົມທີ່ສຸດໃນ ຖົດຖອຍເຊີງເສັ້ນ ສ້າງຄວາມສໍາພັນຂາເຂົ້າ-ອອກໂດຍໃຊ້ວິທີການສີ່ຫຼ່ຽມນ້ອຍທີ່ສຸດ, ການດໍາເນີນງານທາງສະຖິຕິ.

ເຊັ່ນດຽວກັນ, ຕົ້ນໄມ້ຕັດສິນໃຈໃຊ້ຫຼັກການທີ່ເປັນໄປໄດ້ສໍາລັບການຈັດປະເພດຂໍ້ມູນ. ການນໍາໃຊ້ຫຼັກການດັ່ງກ່າວສະຫນອງການຕີຄວາມຫມາຍແລະເຮັດໃຫ້ມັນງ່າຍຂຶ້ນສໍາລັບຜູ້ປະຕິບັດ AI ເພື່ອເຂົ້າໃຈການເຮັດວຽກຂອງ ML algorithms.

ສະຖາປັດຕະຍະກໍາ NN ທີ່ທັນສະໄຫມເຊັ່ນ: ຮູບແບບການຫັນປ່ຽນແລະການແຜ່ກະຈາຍ (ໂດຍປົກກະຕິແມ່ນໃຊ້ສໍາລັບການສ້າງຮູບພາບເຊັ່ນ ການແຜ່ກະຈາຍຄົງທີ່ or ກາງແຈ້ງ) ມີໂຄງສ້າງເຄືອຂ່າຍຫຼາຍຊັ້ນທີ່ຊັບຊ້ອນ. ຄວາມເຂົ້າໃຈກ່ຽວກັບເຄືອຂ່າຍດັ່ງກ່າວຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈກ່ຽວກັບແນວຄວາມຄິດທາງຄະນິດສາດທີ່ກ້າວຫນ້າ. ດ້ວຍເຫດຜົນນີ້, ພວກມັນຍັງຖືກເອີ້ນວ່າ 'ກ່ອງດຳ'.

3. ປະສິດທິພາບຂອງຊັບພະຍາກອນ

ເຄືອຂ່າຍ neural ທີ່ທັນສະໄຫມເຊັ່ນແບບຈໍາລອງພາສາຂະຫນາດໃຫຍ່ (LLMs) ໄດ້ຖືກຝຶກອົບຮົມຢູ່ໃນກຸ່ມຂອງ GPUs ລາຄາແພງຕໍ່ຄວາມຕ້ອງການຂອງຄອມພິວເຕີ້ຂອງພວກເຂົາ. ຕົວຢ່າງ, GPT4 ໄດ້ຖືກລາຍງານວ່າໄດ້ຮັບການຝຶກອົບຮົມ 25000 Nvidia GPUs ເປັນເວລາ 90 ຫາ 100 ມື້.

ຢ່າງໃດກໍຕາມ, ຮາດແວລາຄາແພງແລະເວລາການຝຶກອົບຮົມທີ່ຍາວນານແມ່ນບໍ່ເປັນໄປໄດ້ສໍາລັບທຸກໆນັກປະຕິບັດຫຼືທີມງານ AI. ໃນທາງກົງກັນຂ້າມ, ປະສິດທິພາບການຄິດໄລ່ຂອງເຄື່ອງຈັກການຮຽນຮູ້ແບບດັ້ງເດີມຊ່ວຍໃຫ້ຜູ້ປະຕິບັດສາມາດບັນລຸຜົນໄດ້ຮັບທີ່ມີຄວາມຫມາຍເຖິງແມ່ນວ່າມີຊັບພະຍາກອນຈໍາກັດ.

4. ບໍ່ແມ່ນທຸກບັນຫາຕ້ອງການການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ

Deep Learning ບໍ່ແມ່ນການແກ້ໄຂຢ່າງແທ້ຈິງສໍາລັບທຸກບັນຫາ. ສະຖານະການບາງຢ່າງມີຢູ່ບ່ອນທີ່ ML ປະຕິບັດການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ.

ຕົວຢ່າງ, ໃນ ການບົ່ງມະຕິທາງການແພດແລະການຄາດຄະເນ ມີຂໍ້ມູນຈໍາກັດ, ເປັນ ML algorithm ສໍາລັບ ການກວດພົບຜິດປົກກະຕິ ເຊັ່ນ REMED ໃຫ້ຜົນໄດ້ຮັບທີ່ດີກ່ວາການຮຽນຮູ້ເລິກ. ເຊັ່ນດຽວກັນ, ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມແມ່ນມີຄວາມສໍາຄັນໃນສະຖານະການທີ່ມີຄວາມສາມາດໃນການຄິດໄລ່ຕ່ໍາເປັນ ການແກ້ໄຂທີ່ມີຄວາມຍືດຫຍຸ່ນແລະປະສິດທິພາບ.

ຕົ້ນຕໍ, ການເລືອກຮູບແບບທີ່ດີທີ່ສຸດສໍາລັບບັນຫາໃດຫນຶ່ງແມ່ນຂຶ້ນກັບຄວາມຕ້ອງການຂອງອົງການຈັດຕັ້ງຫຼືຜູ້ປະຕິບັດແລະລັກສະນະຂອງບັນຫາຢູ່ໃນມື.

ການຮຽນຮູ້ເຄື່ອງຈັກໃນປີ 2023

ຮູບພາບທີ່ສ້າງຂຶ້ນໂດຍໃຊ້ Leonardo A.I.

ໃນປີ 2023, ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມຍັງສືບຕໍ່ພັດທະນາ ແລະກຳລັງແຂ່ງຂັນກັບການຮຽນຮູ້ແບບເລິກເຊິ່ງ ແລະ AI ທົ່ວໄປ. ມັນມີການນໍາໃຊ້ຫຼາຍຢ່າງໃນອຸດສາຫະກໍາ, ໂດຍສະເພາະໃນເວລາທີ່ຈັດການກັບຊຸດຂໍ້ມູນທີ່ມີໂຄງສ້າງ.

ຕົວຢ່າງ, ຫຼາຍ ສິນຄ້າຜູ້ບໍລິໂພກເຄື່ອນທີ່ໄວ (FMCG) ບໍລິສັດຈັດການກັບຂໍ້ມູນຕາຕະລາງຈໍານວນຫລາຍໂດຍອີງໃສ່ ML algorithms ສໍາລັບວຽກງານທີ່ສໍາຄັນເຊັ່ນການແນະນໍາຜະລິດຕະພັນສ່ວນບຸກຄົນ, ການເພີ່ມປະສິດທິພາບລາຄາ, ການຄຸ້ມຄອງສິນຄ້າຄົງຄັງແລະການເພີ່ມປະສິດທິພາບຂອງຕ່ອງໂສ້ການສະຫນອງ.

ນອກຈາກນັ້ນ, ຈໍານວນຫຼາຍ ວິໄສທັດ ແລະຮູບແບບພາສາ ຍັງອີງໃສ່ເຕັກນິກພື້ນເມືອງ, ສະເຫນີວິທີແກ້ໄຂໃນວິທີການປະສົມແລະຄໍາຮ້ອງສະຫມັກທີ່ພົ້ນເດັ່ນຂື້ນ. ສໍາລັບຕົວຢ່າງ, ການສຶກສາທີ່ຜ່ານມາທີ່ມີຫົວຂໍ້ "ພວກເຮົາຕ້ອງການຕົວແບບການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງສໍາລັບການຄາດຄະເນຊຸດເວລາບໍ?” ໄດ້ປຶກສາຫາລືກ່ຽວກັບວິທີການຊຸກຍູ້ການຖົດຖອຍຂອງຕົ້ນໄມ້ gradient-boosting regression (GBRTs) ມີປະສິດທິພາບຫຼາຍຂຶ້ນສໍາລັບ ການຄາດຄະເນໄລຍະເວລາ ກ່ວາເຄືອຂ່າຍ neural ເລິກ.

ການຕີຄວາມໝາຍຂອງ ML ຍັງມີຄຸນຄ່າສູງກັບເຕັກນິກເຊັ່ນ SHAP (Shapley ຄໍາອະທິບາຍເພີ່ມເຕີມ) ແລະ ໄລຍະເວລາ (Local Interpretable Model-Agnostic Explanations). ເຕັກນິກເຫຼົ່ານີ້ອະທິບາຍແບບຈໍາລອງ ML ທີ່ສັບສົນ ແລະໃຫ້ຄວາມເຂົ້າໃຈກ່ຽວກັບການຄາດຄະເນຂອງເຂົາເຈົ້າ, ດັ່ງນັ້ນຈຶ່ງຊ່ວຍໃຫ້ຜູ້ປະຕິບັດ ML ເຂົ້າໃຈຕົວແບບຂອງເຂົາເຈົ້າໄດ້ດີຂຶ້ນ.

ສຸດທ້າຍ, ການຮຽນຮູ້ເຄື່ອງຈັກແບບດັ້ງເດີມຍັງຄົງເປັນການແກ້ໄຂທີ່ເຂັ້ມແຂງສໍາລັບອຸດສາຫະກໍາທີ່ຫຼາກຫຼາຍເພື່ອແກ້ໄຂຂະຫນາດ, ຄວາມສັບສົນຂອງຂໍ້ມູນ, ແລະຂໍ້ຈໍາກັດຂອງຊັບພະຍາກອນ. ສູດການຄິດໄລ່ເຫຼົ່ານີ້ແມ່ນບໍ່ສາມາດທົດແທນໄດ້ສໍາລັບການວິເຄາະຂໍ້ມູນແລະການສ້າງແບບຈໍາລອງການຄາດເດົາແລະຈະສືບຕໍ່ເປັນສ່ວນຫນຶ່ງຂອງ ຄັງເກັບຂໍ້ມູນວິທະຍາສາດ.

ຖ້າຫົວຂໍ້ເຊັ່ນນີ້ intrigue ເຈົ້າ, ຄົ້ນຫາ ຮວມ AI ສໍາລັບຄວາມເຂົ້າໃຈເພີ່ມເຕີມ.