ກ້ານໃບ ວິທີການຮຽນຮູ້ເຮັດໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍການສັງເກດເບິ່ງມະນຸດ - Unite.AI
ເຊື່ອມຕໍ່ກັບພວກເຮົາ

ຫຸ່ນຍົນ

ວິທີການຮຽນຮູ້ເຮັດໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍການສັງເກດເບິ່ງມະນຸດ

ຈັດພີມມາ

 on

ຮູບພາບ: CMU

ວິທີການຮຽນຮູ້ໃຫມ່ທີ່ພັດທະນາໂດຍນັກຄົ້ນຄວ້າຢູ່ມະຫາວິທະຍາໄລ Carnegie Mellon (CMU) ຊ່ວຍໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍກົງຈາກວິດີໂອການພົວພັນກັບມະນຸດແລະນໍາຂໍ້ມູນທົ່ວໄປໄປສູ່ຫນ້າວຽກໃຫມ່, ເຊິ່ງຊ່ວຍໃຫ້ພວກເຂົາຮຽນຮູ້ວິທີການເຮັດວຽກເຮືອນ. ວິທີການຮຽນຮູ້ແມ່ນເອີ້ນວ່າ WHIRL, ເຊິ່ງຫຍໍ້ມາຈາກ In-the-wild Human Imitating Robot Learning, ແລະມັນຊ່ວຍໃຫ້ຫຸ່ນຍົນສັງເກດວຽກຕ່າງໆ ແລະເກັບກຳຂໍ້ມູນວິດີໂອເພື່ອຮຽນຮູ້ວິທີເຮັດສຳເລັດວຽກນັ້ນເອງ. 

ການຄົ້ນຄວ້າໄດ້ຖືກນໍາສະເຫນີຢູ່ໃນກອງປະຊຸມ Robotics: ວິທະຍາສາດແລະລະບົບໃນນິວຢອກ. 

Imitation ເປັນວິທີການຮຽນຮູ້

Shikhar Bahl ເປັນປະລິນຍາເອກ. ນັກສຶກສາທີ່ສະຖາບັນຫຸ່ນຍົນ (RI) ໃນໂຮງຮຽນວິທະຍາສາດຄອມພິວເຕີຂອງມະຫາວິທະຍາໄລ Carnegie Mellon. 

"ການຮຽນແບບເປັນວິທີທີ່ດີທີ່ຈະຮຽນຮູ້," Bahl ເວົ້າ. "ຕົວຈິງແລ້ວການມີຫຸ່ນຍົນຮຽນຮູ້ຈາກການເບິ່ງມະນຸດໂດຍກົງແມ່ນຍັງເປັນບັນຫາທີ່ບໍ່ໄດ້ຮັບການແກ້ໄຂໃນພາກສະຫນາມ, ແຕ່ວຽກງານນີ້ໃຊ້ບາດກ້າວທີ່ສໍາຄັນໃນການເຮັດໃຫ້ຄວາມສາມາດດັ່ງກ່າວ."

Bahl ໄດ້ເຮັດວຽກຄຽງຄູ່ກັບ Deepak Pathak ແລະ Abhinav Gupta, ທັງສອງຄົນຍັງເປັນຄະນະວິຊາໃນ RI. ທີມງານໄດ້ເພີ່ມກ້ອງຖ່າຍຮູບ ແລະຊອບແວຂອງເຂົາເຈົ້າໃສ່ຫຸ່ນຍົນນອກຊັ້ນວາງທີ່ຮຽນຮູ້ວິທີເຮັດສຳເລັດຫຼາຍກວ່າ 20 ໜ້າວຽກ. ວຽກ​ງານ​ເຫຼົ່າ​ນີ້​ລວມ​ທັງ​ການ​ເປີດ​ແລະ​ປິດ​ເຄື່ອງ​ໃຊ້​ໃນ​ການ​ເອົາ​ຖົງ​ຂີ້​ເຫຍື້ອ​ອອກ​ຈາກ​ຖັງ​ໄດ້​. ແຕ່ລະຄັ້ງທີ່ຫຸ່ນຍົນເບິ່ງມະນຸດໃຫ້ສໍາເລັດວຽກງານກ່ອນທີ່ຈະພະຍາຍາມມັນເອງ. 

Patak ເປັນຜູ້ຊ່ວຍອາຈານໃນ RI.

"ວຽກງານນີ້ນໍາສະເຫນີວິທີການນໍາເອົາຫຸ່ນຍົນເຂົ້າໄປໃນເຮືອນ," Pathak ເວົ້າ. “ແທນທີ່ຈະລໍຖ້າໃຫ້ຫຸ່ນຍົນຖືກຕັ້ງໂປຣແກມ ຫຼື ເຝິກອົບຮົມໃຫ້ປະສົບຜົນສຳເລັດໃນໜ້າວຽກຕ່າງໆ ກ່ອນທີ່ຈະນຳໄປໃຊ້ໃນເຮືອນຂອງຄົນ, ເທັກໂນໂລຢີນີ້ເຮັດໃຫ້ເຮົາສາມາດນຳໃຊ້ຫຸ່ນຍົນໄດ້ ແລະ ໃຫ້ພວກເຂົາຮຽນຮູ້ວິທີເຮັດສຳເລັດໜ້າວຽກ, ຕະຫຼອດການປັບຕົວເຂົ້າກັບສະພາບແວດລ້ອມ ແລະ ປັບປຸງແຕ່ພຽງຜູ້ດຽວ. ໂດຍການເບິ່ງ.” 

WHIRL: ການປອມຈາກມະນຸດກັບຫຸ່ນຍົນໃນປ່າ. ຈັດພີມມາຢູ່ RSS 2022.

WHIRL ທຽບກັບວິທີການປະຈຸບັນ

ວິທີການປະຈຸບັນສ່ວນໃຫຍ່ສໍາລັບການສອນຫຸ່ນຍົນເປັນວຽກງານແມ່ນອີງໃສ່ການຮຽນຮູ້ແບບຮຽນແບບຫຼືເສີມສ້າງ. ດ້ວຍການຮຽນຮູ້ແບບຮຽນແບບ, ມະນຸດເຮັດຫຸ່ນຍົນດ້ວຍມື ແລະສອນວິທີເຮັດສຳເລັດວຽກໃດໜຶ່ງ, ເຊິ່ງຮຽກຮ້ອງໃຫ້ມີການປະຕິບັດຫຼາຍຄັ້ງກ່ອນທີ່ຫຸ່ນຍົນຈະຮຽນຮູ້. ດ້ວຍການຮຽນຮູ້ການເສີມສ້າງ, ຫຸ່ນຍົນປົກກະຕິແລ້ວແມ່ນໄດ້ຮັບການຝຶກອົບຮົມໃນຫຼາຍລ້ານຕົວຢ່າງໃນການຈໍາລອງກ່ອນທີ່ຈະປັບການຝຶກອົບຮົມໄປສູ່ໂລກທີ່ແທ້ຈິງ. 

ໃນຂະນະທີ່ທັງສອງຕົວແບບເຫຼົ່ານີ້ມີປະສິດທິພາບໃນການສອນຫຸ່ນຍົນເປັນວຽກງານດຽວໃນສະພາບແວດລ້ອມທີ່ມີໂຄງສ້າງ, ພວກມັນພິສູດໄດ້ຍາກໃນການຂະຫຍາຍແລະນໍາໃຊ້. ແຕ່ດ້ວຍ WHIRL, ຫຸ່ນຍົນສາມາດຮຽນຮູ້ຈາກວິດີໂອໃດໆຂອງມະນຸດທີ່ເຮັດສໍາເລັດວຽກງານ. ມັນຍັງສາມາດຂະຫຍາຍໄດ້ງ່າຍ, ບໍ່ຈໍາກັດກັບວຽກງານສະເພາະໃດຫນຶ່ງ, ແລະສາມາດດໍາເນີນການໃນສະພາບແວດລ້ອມເຮືອນ. 

WHIRL ຊ່ວຍໃຫ້ຫຸ່ນຍົນສາມາດປະຕິບັດວຽກງານຕ່າງໆໃນສະພາບແວດລ້ອມທໍາມະຊາດຂອງເຂົາເຈົ້າ. ແລະໃນຂະນະທີ່ຄວາມພະຍາຍາມສອງສາມຄັ້ງທໍາອິດມັກຈະສິ້ນສຸດລົງໃນຄວາມລົ້ມເຫລວ, ມັນສາມາດຮຽນຮູ້ໄດ້ຢ່າງໄວວາຫຼັງຈາກປະສົບຜົນສໍາເລັດບໍ່ຫຼາຍປານໃດ. ຫຸ່ນຍົນບໍ່ສະເຫມີເຮັດສໍາເລັດວຽກງານທີ່ມີການເຄື່ອນໄຫວດຽວກັນກັບມະນຸດ, ແຕ່ເນື່ອງຈາກວ່າມັນມີພາກສ່ວນທີ່ແຕກຕ່າງກັນທີ່ເຄື່ອນຍ້າຍທີ່ແຕກຕ່າງກັນ. ພ້ອມ​ກັນ​ນັ້ນ, ໝາກຜົນ​ທີ່​ສຸດ​ຂອງ​ການ​ປະຕິບັດ​ໜ້າ​ທີ່​ປະສົບ​ຜົນສຳ​ເລັດ​ລ້ວນ​ແຕ່​ຄື​ກັນ.

"ເພື່ອຂະຫຍາຍຫຸ່ນຍົນໃນປ່າທໍາມະຊາດ, ຂໍ້ມູນຕ້ອງມີຄວາມຫນ້າເຊື່ອຖືແລະຫມັ້ນຄົງ, ແລະຫຸ່ນຍົນຄວນຈະກາຍເປັນທີ່ດີກວ່າໃນສະພາບແວດລ້ອມຂອງເຂົາເຈົ້າໂດຍການປະຕິບັດດ້ວຍຕົນເອງ," Patak ເວົ້າ. 

Alex McFarland ເປັນນັກຂ່າວ AI ແລະນັກຂຽນທີ່ຄົ້ນຫາການພັດທະນາຫລ້າສຸດໃນປັນຍາປະດິດ. ລາວໄດ້ຮ່ວມມືກັບ AI startups ແລະສິ່ງພິມຕ່າງໆໃນທົ່ວໂລກ.