ຫຸ່ນຍົນ

ວິທີການຮຽນຮູ້ເຮັດໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍການສັງເກດເບິ່ງມະນຸດ

ຈັດພີມມາ

2 ປີກ່ອນຫນ້ານີ້

ເດືອນກໍລະກົດ 26, 2022

ຮູບພາບ: CMU

ວິທີການຮຽນຮູ້ໃຫມ່ທີ່ພັດທະນາໂດຍນັກຄົ້ນຄວ້າຢູ່ມະຫາວິທະຍາໄລ Carnegie Mellon (CMU) ຊ່ວຍໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍກົງຈາກວິດີໂອການພົວພັນກັບມະນຸດແລະນໍາຂໍ້ມູນທົ່ວໄປໄປສູ່ຫນ້າວຽກໃຫມ່, ເຊິ່ງຊ່ວຍໃຫ້ພວກເຂົາຮຽນຮູ້ວິທີການເຮັດວຽກເຮືອນ. ວິທີການຮຽນຮູ້ແມ່ນເອີ້ນວ່າ WHIRL, ເຊິ່ງຫຍໍ້ມາຈາກ In-the-wild Human Imitating Robot Learning, ແລະມັນຊ່ວຍໃຫ້ຫຸ່ນຍົນສັງເກດວຽກຕ່າງໆ ແລະເກັບກຳຂໍ້ມູນວິດີໂອເພື່ອຮຽນຮູ້ວິທີເຮັດສຳເລັດວຽກນັ້ນເອງ.

ການຄົ້ນຄວ້າໄດ້ຖືກນໍາສະເຫນີຢູ່ໃນກອງປະຊຸມ Robotics: ວິທະຍາສາດແລະລະບົບໃນນິວຢອກ.

Imitation ເປັນວິທີການຮຽນຮູ້

Shikhar Bahl ເປັນປະລິນຍາເອກ. ນັກສຶກສາທີ່ສະຖາບັນຫຸ່ນຍົນ (RI) ໃນໂຮງຮຽນວິທະຍາສາດຄອມພິວເຕີຂອງມະຫາວິທະຍາໄລ Carnegie Mellon.

"ການຮຽນແບບເປັນວິທີທີ່ດີທີ່ຈະຮຽນຮູ້," Bahl ເວົ້າ. "ຕົວຈິງແລ້ວການມີຫຸ່ນຍົນຮຽນຮູ້ຈາກການເບິ່ງມະນຸດໂດຍກົງແມ່ນຍັງເປັນບັນຫາທີ່ບໍ່ໄດ້ຮັບການແກ້ໄຂໃນພາກສະຫນາມ, ແຕ່ວຽກງານນີ້ໃຊ້ບາດກ້າວທີ່ສໍາຄັນໃນການເຮັດໃຫ້ຄວາມສາມາດດັ່ງກ່າວ."

Bahl ໄດ້ເຮັດວຽກຄຽງຄູ່ກັບ Deepak Pathak ແລະ Abhinav Gupta, ທັງສອງຄົນຍັງເປັນຄະນະວິຊາໃນ RI. ທີມງານໄດ້ເພີ່ມກ້ອງຖ່າຍຮູບ ແລະຊອບແວຂອງເຂົາເຈົ້າໃສ່ຫຸ່ນຍົນນອກຊັ້ນວາງທີ່ຮຽນຮູ້ວິທີເຮັດສຳເລັດຫຼາຍກວ່າ 20 ໜ້າວຽກ. ວຽກງານເຫຼົ່ານີ້ລວມທັງການເປີດແລະປິດເຄື່ອງໃຊ້ໃນການເອົາຖົງຂີ້ເຫຍື້ອອອກຈາກຖັງໄດ້. ແຕ່ລະຄັ້ງທີ່ຫຸ່ນຍົນເບິ່ງມະນຸດໃຫ້ສໍາເລັດວຽກງານກ່ອນທີ່ຈະພະຍາຍາມມັນເອງ.

Patak ເປັນຜູ້ຊ່ວຍອາຈານໃນ RI.

"ວຽກງານນີ້ນໍາສະເຫນີວິທີການນໍາເອົາຫຸ່ນຍົນເຂົ້າໄປໃນເຮືອນ," Pathak ເວົ້າ. “ແທນທີ່ຈະລໍຖ້າໃຫ້ຫຸ່ນຍົນຖືກຕັ້ງໂປຣແກມ ຫຼື ເຝິກອົບຮົມໃຫ້ປະສົບຜົນສຳເລັດໃນໜ້າວຽກຕ່າງໆ ກ່ອນທີ່ຈະນຳໄປໃຊ້ໃນເຮືອນຂອງຄົນ, ເທັກໂນໂລຢີນີ້ເຮັດໃຫ້ເຮົາສາມາດນຳໃຊ້ຫຸ່ນຍົນໄດ້ ແລະ ໃຫ້ພວກເຂົາຮຽນຮູ້ວິທີເຮັດສຳເລັດໜ້າວຽກ, ຕະຫຼອດການປັບຕົວເຂົ້າກັບສະພາບແວດລ້ອມ ແລະ ປັບປຸງແຕ່ພຽງຜູ້ດຽວ. ໂດຍການເບິ່ງ.”

WHIRL: ການປອມຈາກມະນຸດກັບຫຸ່ນຍົນໃນປ່າ. ຈັດພີມມາຢູ່ RSS 2022.

WHIRL: Human-to-Robot Imitation in the Wild. Published at RSS 2022.

Watch this video on YouTube

WHIRL ທຽບກັບວິທີການປະຈຸບັນ

ວິທີການປະຈຸບັນສ່ວນໃຫຍ່ສໍາລັບການສອນຫຸ່ນຍົນເປັນວຽກງານແມ່ນອີງໃສ່ການຮຽນຮູ້ແບບຮຽນແບບຫຼືເສີມສ້າງ. ດ້ວຍການຮຽນຮູ້ແບບຮຽນແບບ, ມະນຸດເຮັດຫຸ່ນຍົນດ້ວຍມື ແລະສອນວິທີເຮັດສຳເລັດວຽກໃດໜຶ່ງ, ເຊິ່ງຮຽກຮ້ອງໃຫ້ມີການປະຕິບັດຫຼາຍຄັ້ງກ່ອນທີ່ຫຸ່ນຍົນຈະຮຽນຮູ້. ດ້ວຍການຮຽນຮູ້ການເສີມສ້າງ, ຫຸ່ນຍົນປົກກະຕິແລ້ວແມ່ນໄດ້ຮັບການຝຶກອົບຮົມໃນຫຼາຍລ້ານຕົວຢ່າງໃນການຈໍາລອງກ່ອນທີ່ຈະປັບການຝຶກອົບຮົມໄປສູ່ໂລກທີ່ແທ້ຈິງ.

ໃນຂະນະທີ່ທັງສອງຕົວແບບເຫຼົ່ານີ້ມີປະສິດທິພາບໃນການສອນຫຸ່ນຍົນເປັນວຽກງານດຽວໃນສະພາບແວດລ້ອມທີ່ມີໂຄງສ້າງ, ພວກມັນພິສູດໄດ້ຍາກໃນການຂະຫຍາຍແລະນໍາໃຊ້. ແຕ່ດ້ວຍ WHIRL, ຫຸ່ນຍົນສາມາດຮຽນຮູ້ຈາກວິດີໂອໃດໆຂອງມະນຸດທີ່ເຮັດສໍາເລັດວຽກງານ. ມັນຍັງສາມາດຂະຫຍາຍໄດ້ງ່າຍ, ບໍ່ຈໍາກັດກັບວຽກງານສະເພາະໃດຫນຶ່ງ, ແລະສາມາດດໍາເນີນການໃນສະພາບແວດລ້ອມເຮືອນ.

WHIRL ຊ່ວຍໃຫ້ຫຸ່ນຍົນສາມາດປະຕິບັດວຽກງານຕ່າງໆໃນສະພາບແວດລ້ອມທໍາມະຊາດຂອງເຂົາເຈົ້າ. ແລະໃນຂະນະທີ່ຄວາມພະຍາຍາມສອງສາມຄັ້ງທໍາອິດມັກຈະສິ້ນສຸດລົງໃນຄວາມລົ້ມເຫລວ, ມັນສາມາດຮຽນຮູ້ໄດ້ຢ່າງໄວວາຫຼັງຈາກປະສົບຜົນສໍາເລັດບໍ່ຫຼາຍປານໃດ. ຫຸ່ນຍົນບໍ່ສະເຫມີເຮັດສໍາເລັດວຽກງານທີ່ມີການເຄື່ອນໄຫວດຽວກັນກັບມະນຸດ, ແຕ່ເນື່ອງຈາກວ່າມັນມີພາກສ່ວນທີ່ແຕກຕ່າງກັນທີ່ເຄື່ອນຍ້າຍທີ່ແຕກຕ່າງກັນ. ພ້ອມກັນນັ້ນ, ໝາກຜົນທີ່ສຸດຂອງການປະຕິບັດໜ້າທີ່ປະສົບຜົນສຳເລັດລ້ວນແຕ່ຄືກັນ.

"ເພື່ອຂະຫຍາຍຫຸ່ນຍົນໃນປ່າທໍາມະຊາດ, ຂໍ້ມູນຕ້ອງມີຄວາມຫນ້າເຊື່ອຖືແລະຫມັ້ນຄົງ, ແລະຫຸ່ນຍົນຄວນຈະກາຍເປັນທີ່ດີກວ່າໃນສະພາບແວດລ້ອມຂອງເຂົາເຈົ້າໂດຍການປະຕິບັດດ້ວຍຕົນເອງ," Patak ເວົ້າ.