ຫຸ່ນຍົນ
ວິທີການຮຽນຮູ້ເຮັດໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍການສັງເກດເບິ່ງມະນຸດ
ວິທີການຮຽນຮູ້ໃຫມ່ທີ່ພັດທະນາໂດຍນັກຄົ້ນຄວ້າຢູ່ມະຫາວິທະຍາໄລ Carnegie Mellon (CMU) ຊ່ວຍໃຫ້ຫຸ່ນຍົນສາມາດຮຽນຮູ້ໂດຍກົງຈາກວິດີໂອການພົວພັນກັບມະນຸດແລະນໍາຂໍ້ມູນທົ່ວໄປໄປສູ່ຫນ້າວຽກໃຫມ່, ເຊິ່ງຊ່ວຍໃຫ້ພວກເຂົາຮຽນຮູ້ວິທີການເຮັດວຽກເຮືອນ. ວິທີການຮຽນຮູ້ແມ່ນເອີ້ນວ່າ WHIRL, ເຊິ່ງຫຍໍ້ມາຈາກ In-the-wild Human Imitating Robot Learning, ແລະມັນຊ່ວຍໃຫ້ຫຸ່ນຍົນສັງເກດວຽກຕ່າງໆ ແລະເກັບກຳຂໍ້ມູນວິດີໂອເພື່ອຮຽນຮູ້ວິທີເຮັດສຳເລັດວຽກນັ້ນເອງ.
ການຄົ້ນຄວ້າໄດ້ຖືກນໍາສະເຫນີຢູ່ໃນກອງປະຊຸມ Robotics: ວິທະຍາສາດແລະລະບົບໃນນິວຢອກ.
Imitation ເປັນວິທີການຮຽນຮູ້
Shikhar Bahl ເປັນປະລິນຍາເອກ. ນັກສຶກສາທີ່ສະຖາບັນຫຸ່ນຍົນ (RI) ໃນໂຮງຮຽນວິທະຍາສາດຄອມພິວເຕີຂອງມະຫາວິທະຍາໄລ Carnegie Mellon.
"ການຮຽນແບບເປັນວິທີທີ່ດີທີ່ຈະຮຽນຮູ້," Bahl ເວົ້າ. "ຕົວຈິງແລ້ວການມີຫຸ່ນຍົນຮຽນຮູ້ຈາກການເບິ່ງມະນຸດໂດຍກົງແມ່ນຍັງເປັນບັນຫາທີ່ບໍ່ໄດ້ຮັບການແກ້ໄຂໃນພາກສະຫນາມ, ແຕ່ວຽກງານນີ້ໃຊ້ບາດກ້າວທີ່ສໍາຄັນໃນການເຮັດໃຫ້ຄວາມສາມາດດັ່ງກ່າວ."
Bahl ໄດ້ເຮັດວຽກຄຽງຄູ່ກັບ Deepak Pathak ແລະ Abhinav Gupta, ທັງສອງຄົນຍັງເປັນຄະນະວິຊາໃນ RI. ທີມງານໄດ້ເພີ່ມກ້ອງຖ່າຍຮູບ ແລະຊອບແວຂອງເຂົາເຈົ້າໃສ່ຫຸ່ນຍົນນອກຊັ້ນວາງທີ່ຮຽນຮູ້ວິທີເຮັດສຳເລັດຫຼາຍກວ່າ 20 ໜ້າວຽກ. ວຽກງານເຫຼົ່ານີ້ລວມທັງການເປີດແລະປິດເຄື່ອງໃຊ້ໃນການເອົາຖົງຂີ້ເຫຍື້ອອອກຈາກຖັງໄດ້. ແຕ່ລະຄັ້ງທີ່ຫຸ່ນຍົນເບິ່ງມະນຸດໃຫ້ສໍາເລັດວຽກງານກ່ອນທີ່ຈະພະຍາຍາມມັນເອງ.
Patak ເປັນຜູ້ຊ່ວຍອາຈານໃນ RI.
"ວຽກງານນີ້ນໍາສະເຫນີວິທີການນໍາເອົາຫຸ່ນຍົນເຂົ້າໄປໃນເຮືອນ," Pathak ເວົ້າ. “ແທນທີ່ຈະລໍຖ້າໃຫ້ຫຸ່ນຍົນຖືກຕັ້ງໂປຣແກມ ຫຼື ເຝິກອົບຮົມໃຫ້ປະສົບຜົນສຳເລັດໃນໜ້າວຽກຕ່າງໆ ກ່ອນທີ່ຈະນຳໄປໃຊ້ໃນເຮືອນຂອງຄົນ, ເທັກໂນໂລຢີນີ້ເຮັດໃຫ້ເຮົາສາມາດນຳໃຊ້ຫຸ່ນຍົນໄດ້ ແລະ ໃຫ້ພວກເຂົາຮຽນຮູ້ວິທີເຮັດສຳເລັດໜ້າວຽກ, ຕະຫຼອດການປັບຕົວເຂົ້າກັບສະພາບແວດລ້ອມ ແລະ ປັບປຸງແຕ່ພຽງຜູ້ດຽວ. ໂດຍການເບິ່ງ.”
WHIRL ທຽບກັບວິທີການປະຈຸບັນ
ວິທີການປະຈຸບັນສ່ວນໃຫຍ່ສໍາລັບການສອນຫຸ່ນຍົນເປັນວຽກງານແມ່ນອີງໃສ່ການຮຽນຮູ້ແບບຮຽນແບບຫຼືເສີມສ້າງ. ດ້ວຍການຮຽນຮູ້ແບບຮຽນແບບ, ມະນຸດເຮັດຫຸ່ນຍົນດ້ວຍມື ແລະສອນວິທີເຮັດສຳເລັດວຽກໃດໜຶ່ງ, ເຊິ່ງຮຽກຮ້ອງໃຫ້ມີການປະຕິບັດຫຼາຍຄັ້ງກ່ອນທີ່ຫຸ່ນຍົນຈະຮຽນຮູ້. ດ້ວຍການຮຽນຮູ້ການເສີມສ້າງ, ຫຸ່ນຍົນປົກກະຕິແລ້ວແມ່ນໄດ້ຮັບການຝຶກອົບຮົມໃນຫຼາຍລ້ານຕົວຢ່າງໃນການຈໍາລອງກ່ອນທີ່ຈະປັບການຝຶກອົບຮົມໄປສູ່ໂລກທີ່ແທ້ຈິງ.
ໃນຂະນະທີ່ທັງສອງຕົວແບບເຫຼົ່ານີ້ມີປະສິດທິພາບໃນການສອນຫຸ່ນຍົນເປັນວຽກງານດຽວໃນສະພາບແວດລ້ອມທີ່ມີໂຄງສ້າງ, ພວກມັນພິສູດໄດ້ຍາກໃນການຂະຫຍາຍແລະນໍາໃຊ້. ແຕ່ດ້ວຍ WHIRL, ຫຸ່ນຍົນສາມາດຮຽນຮູ້ຈາກວິດີໂອໃດໆຂອງມະນຸດທີ່ເຮັດສໍາເລັດວຽກງານ. ມັນຍັງສາມາດຂະຫຍາຍໄດ້ງ່າຍ, ບໍ່ຈໍາກັດກັບວຽກງານສະເພາະໃດຫນຶ່ງ, ແລະສາມາດດໍາເນີນການໃນສະພາບແວດລ້ອມເຮືອນ.
WHIRL ຊ່ວຍໃຫ້ຫຸ່ນຍົນສາມາດປະຕິບັດວຽກງານຕ່າງໆໃນສະພາບແວດລ້ອມທໍາມະຊາດຂອງເຂົາເຈົ້າ. ແລະໃນຂະນະທີ່ຄວາມພະຍາຍາມສອງສາມຄັ້ງທໍາອິດມັກຈະສິ້ນສຸດລົງໃນຄວາມລົ້ມເຫລວ, ມັນສາມາດຮຽນຮູ້ໄດ້ຢ່າງໄວວາຫຼັງຈາກປະສົບຜົນສໍາເລັດບໍ່ຫຼາຍປານໃດ. ຫຸ່ນຍົນບໍ່ສະເຫມີເຮັດສໍາເລັດວຽກງານທີ່ມີການເຄື່ອນໄຫວດຽວກັນກັບມະນຸດ, ແຕ່ເນື່ອງຈາກວ່າມັນມີພາກສ່ວນທີ່ແຕກຕ່າງກັນທີ່ເຄື່ອນຍ້າຍທີ່ແຕກຕ່າງກັນ. ພ້ອມກັນນັ້ນ, ໝາກຜົນທີ່ສຸດຂອງການປະຕິບັດໜ້າທີ່ປະສົບຜົນສຳເລັດລ້ວນແຕ່ຄືກັນ.
"ເພື່ອຂະຫຍາຍຫຸ່ນຍົນໃນປ່າທໍາມະຊາດ, ຂໍ້ມູນຕ້ອງມີຄວາມຫນ້າເຊື່ອຖືແລະຫມັ້ນຄົງ, ແລະຫຸ່ນຍົນຄວນຈະກາຍເປັນທີ່ດີກວ່າໃນສະພາບແວດລ້ອມຂອງເຂົາເຈົ້າໂດຍການປະຕິບັດດ້ວຍຕົນເອງ," Patak ເວົ້າ.