ປັນຍາປະດິດ

DeepMind ຄົ້ນພົບເຕັກນິກການຝຶກອົບຮົມ AI ທີ່ອາດຈະເຮັດວຽກຢູ່ໃນສະຫມອງຂອງພວກເຮົາ

ການປັບປຸງ on ເດືອນທັນວາ 9, 2022

DeepMind ບໍ່ດົນມານີ້ ຈັດພີມມາເຈ້ຍ ລາຍລະອຽດວິທີການຮຽນຮູ້ການເສີມສ້າງປະເພດໃຫມ່ສາມາດອະທິບາຍວິທີການໃຫ້ລາງວັນພາຍໃນສະຫມອງຂອງມະນຸດ. ຕາມການລາຍງານຂອງ NewScientist, ວິທີການການຝຶກອົບຮົມການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນເອີ້ນວ່າການຮຽນຮູ້ການເສີມການແຈກຢາຍແລະກົນໄກທີ່ຢູ່ເບື້ອງຫລັງມັນເບິ່ງຄືວ່າຈະອະທິບາຍຢ່າງຈະແຈ້ງວ່າ dopamine ຖືກປ່ອຍອອກມາໂດຍ neurons ພາຍໃນສະຫມອງ.

Neuroscience ແລະວິທະຍາສາດຄອມພິວເຕີມີປະຫວັດສາດອັນຍາວນານຮ່ວມກັນ. ມາຮອດປີ 1951, Marvin Minksy ໄດ້ໃຊ້ລະບົບການໃຫ້ລາງວັນ ແລະ ການລົງໂທດ ເພື່ອສ້າງໂປຣແກຣມຄອມພິວເຕີທີ່ສາມາດແກ້ບັນຫາໄດ້. Minksy ໄດ້ຮັບການດົນໃຈຈາກການເຮັດວຽກຂອງ Ivan Pavlov, ນັກວິທະຍາສາດດ້ານຮ່າງກາຍທີ່ສະແດງໃຫ້ເຫັນວ່າຫມາສາມາດຮຽນຮູ້ໂດຍຜ່ານລາງວັນແລະການລົງໂທດ. ເອກະສານໃຫມ່ຂອງ Deepmind ເພີ່ມປະຫວັດສາດທີ່ເຊື່ອມໂຍງກັນຂອງ neuroscience ແລະວິທະຍາສາດຄອມພິວເຕີໂດຍການນໍາໃຊ້ປະເພດຂອງການຮຽນຮູ້ເສີມເພື່ອສ້າງຄວາມເຂົ້າໃຈກ່ຽວກັບວິທີການ neurons dopamine ອາດຈະເຮັດວຽກ.

ເມື່ອໃດກໍ່ຕາມທີ່ຄົນ, ຫຼືສັດ, ກໍາລັງຈະດໍາເນີນການ, ການເກັບກໍາ neurons ໃນສະຫມອງຂອງເຂົາເຈົ້າທີ່ຮັບຜິດຊອບສໍາລັບການປ່ອຍ dopamine ເຮັດໃຫ້ມີການຄາດເດົາວ່າການປະຕິບັດຈະໄດ້ຮັບລາງວັນແນວໃດ. ເມື່ອການປະຕິບັດໄດ້ຖືກປະຕິບັດແລະຜົນສະທ້ອນ (ລາງວັນ) ຂອງການກະທໍານັ້ນປາກົດຂື້ນ, ສະຫມອງຈະປ່ອຍ dopamine. ຢ່າງໃດກໍ່ຕາມ, ການປ່ອຍ dopamine ນີ້ຖືກປັບຂະຫນາດໃຫ້ສອດຄ່ອງກັບຂະຫນາດຂອງຄວາມຜິດພາດໃນການຄາດຄະເນ. ຖ້າລາງວັນໃຫຍ່ກວ່າ / ດີກວ່າທີ່ຄາດໄວ້, ການເພີ່ມຂຶ້ນຂອງ dopamine ແມ່ນກະຕຸ້ນ. ໃນທາງກົງກັນຂ້າມ, ລາງວັນທີ່ຮ້າຍແຮງກວ່າເກົ່າເຮັດໃຫ້ dopamine ຫນ້ອຍລົງ. dopamine ເຮັດຫນ້າທີ່ເປັນການແກ້ໄຂທີ່ເຮັດໃຫ້ neurons ປັບການຄາດເດົາຂອງເຂົາເຈົ້າຈົນກ່ວາພວກເຂົາ converge ກັບລາງວັນຕົວຈິງທີ່ໄດ້ຮັບ. ນີ້ແມ່ນຄ້າຍຄືກັນກັບວິທີການຮຽນຮູ້ການເສີມສ້າງ algorithms ເຮັດວຽກ.

ໃນປີ 2017 ເຫັນວ່ານັກຄົ້ນຄວ້າ DeepMind ເປີດເຜີຍສະບັບປັບປຸງຂອງວິທີການຮຽນການເສີມທີ່ໃຊ້ທົ່ວໄປ, ແລະວິທີການຮຽນຮູ້ທີ່ເໜືອກວ່ານີ້ແມ່ນສາມາດເພີ່ມປະສິດທິພາບໃນວຽກງານການຮຽນຮູ້ການເສີມສ້າງຫຼາຍຢ່າງ. ທີມງານ DeepMind ຄິດວ່າກົນໄກທີ່ຢູ່ເບື້ອງຫລັງ algorithm ໃຫມ່ສາມາດຖືກນໍາໃຊ້ເພື່ອອະທິບາຍໄດ້ດີກວ່າວິທີການ neurons dopamine ດໍາເນີນການພາຍໃນສະຫມອງຂອງມະນຸດ.

ໃນທາງກົງກັນຂ້າມກັບລະບົບການຮຽນຮູ້ການເສີມສ້າງແບບເກົ່າ, ສູດການຄິດໄລ່ໃໝ່ກວ່າຂອງ DeepMind ເປັນຕົວແທນຂອງລາງວັນເປັນການແຈກຢາຍ. ວິທີການຮຽນຮູ້ການເສີມສ້າງແບບເກົ່າສະແດງໃຫ້ເຫັນລາງວັນທີ່ຄາດຄະເນວ່າເປັນພຽງແຕ່ຕົວເລກດຽວທີ່ຢືນຢູ່ສໍາລັບຜົນໄດ້ຮັບສະເລ່ຍທີ່ຄາດໄວ້. ການປ່ຽນແປງນີ້ເຮັດໃຫ້ຕົວແບບສາມາດເປັນຕົວແທນຂອງລາງວັນທີ່ເປັນໄປໄດ້ໄດ້ຢ່າງຖືກຕ້ອງກວ່າ ແລະ ເຮັດວຽກໄດ້ດີຂຶ້ນ. ປະສິດທິພາບທີ່ດີກວ່າຂອງວິທີການຝຶກອົບຮົມໃຫມ່ໄດ້ກະຕຸ້ນໃຫ້ນັກຄົ້ນຄວ້າ DeepMind ສືບສວນຖ້າຫາກວ່າ neurons dopamine ໃນສະຫມອງຂອງມະນຸດດໍາເນີນການໃນຮູບແບບທີ່ຄ້າຍຄືກັນ.

ເພື່ອສືບສວນການເຮັດວຽກຂອງ neurons dopamine, DeepMind ໄດ້ເຮັດວຽກຄຽງຄູ່ກັບ Harvard ເພື່ອຄົ້ນຄ້ວາກິດຈະກໍາຂອງ neurons dopamine ໃນຫນູ. ນັກຄົ້ນຄວ້າໄດ້ໃຫ້ຫນູປະຕິບັດວຽກງານຕ່າງໆແລະໃຫ້ລາງວັນໃຫ້ເຂົາເຈົ້າໂດຍອີງໃສ່ການມ້ວນຂອງ dice, ບັນທຶກວິທີການ neurons dopamine ຂອງເຂົາເຈົ້າຍິງ. neurons ທີ່ແຕກຕ່າງກັນເບິ່ງຄືວ່າຈະຄາດຄະເນຜົນໄດ້ຮັບທີ່ເປັນໄປໄດ້ທີ່ແຕກຕ່າງກັນ, ປ່ອຍປະລິມານທີ່ແຕກຕ່າງກັນຂອງ dopamine. ບາງ neurons ຄາດຄະເນຕ່ໍາກວ່າລາງວັນຕົວຈິງໃນຂະນະທີ່ບາງລາງວັນຄາດຄະເນສູງກວ່າລາງວັນຕົວຈິງ. ຫຼັງຈາກຕາຕະລາງການແຈກຢາຍຂອງການຄາດຄະເນລາງວັນ, ນັກຄົ້ນຄວ້າພົບວ່າການແຈກຢາຍຂອງການຄາດຄະເນແມ່ນຂ້ອນຂ້າງໃກ້ຊິດກັບການແຈກຢາຍລາງວັນທີ່ແທ້ຈິງ. ນີ້ຊີ້ໃຫ້ເຫັນວ່າສະຫມອງເຮັດໃຫ້ການນໍາໃຊ້ລະບົບການແຈກຢາຍໃນເວລາທີ່ເຮັດການຄາດເດົາແລະປັບການຄາດເດົາໃຫ້ກົງກັບຄວາມເປັນຈິງ.

ການສຶກສາສາມາດແຈ້ງໃຫ້ທັງສອງ neuroscience nad ວິທະຍາສາດຄອມພິວເຕີ. ການສຶກສາສະຫນັບສະຫນູນການນໍາໃຊ້ການຮຽນຮູ້ການເສີມການແຈກຢາຍເປັນວິທີການສ້າງແບບຈໍາລອງ AI ທີ່ກ້າວຫນ້າ. ນອກເຫນືອຈາກນັ້ນ, ມັນສາມາດມີຜົນສະທ້ອນຕໍ່ທິດສະດີຂອງພວກເຮົາກ່ຽວກັບວິທີທີ່ສະຫມອງເຮັດວຽກກ່ຽວກັບລະບົບລາງວັນ. ຖ້າ neurons dopamine ໄດ້ຖືກແຈກຢາຍແລະບາງຄົນມີແງ່ດີຫຼືແງ່ດີຫຼາຍກ່ວາຄົນອື່ນ, ຄວາມເຂົ້າໃຈການແຈກຢາຍເຫຼົ່ານີ້ສາມາດປ່ຽນແປງວິທີທີ່ພວກເຮົາເຂົ້າຫາລັກສະນະຂອງຈິດຕະວິທະຍາເຊັ່ນ: ສຸຂະພາບຈິດແລະແຮງຈູງໃຈ.

ດັ່ງທີ່ MIT Technology View ລາຍງານ, Matt Botvinik, ຜູ້ອໍານວຍການຂອງການຄົ້ນຄວ້າທາງດ້ານ neuroscience ຢູ່ DeepMind, ໄດ້ອະທິບາຍເຖິງຄວາມສໍາຄັນຂອງການຄົ້ນພົບຢູ່ໃນກອງປະຊຸມຂ່າວ. Botvinik ເວົ້າວ່າ:

“ຖ້າສະໝອງໃຊ້ມັນ, ມັນອາດຈະເປັນຄວາມຄິດທີ່ດີ. ມັນບອກພວກເຮົາວ່ານີ້ແມ່ນເຕັກນິກການຄິດໄລ່ທີ່ສາມາດປັບຂະຫນາດໃນສະຖານະການຕົວຈິງ. ມັນຈະເຫມາະກັບຂະບວນການຄອມພິວເຕີ້ອື່ນໆ. ມັນເຮັດໃຫ້ພວກເຮົາມີທັດສະນະໃຫມ່ກ່ຽວກັບສິ່ງທີ່ເກີດຂື້ນໃນສະຫມອງຂອງພວກເຮົາໃນຊີວິດປະຈໍາວັນ”

ຫົວຂໍ້ທີ່ກ່ຽວຂ້ອງ:ສະຫມອງ Deepmind dopamine ການຮຽນຮູ້ການເສີມສ້າງ

ຂຶ້ນຕໍ່ໄປ

ສູດການຄິດໄລ່ຄອມພິວເຕີສາມາດກໍານົດລັກສະນະການເຕັ້ນເປັນເອກະລັກ

ຢ່າພາດ

Warner Bros. ເພື່ອເລີ່ມຕົ້ນໃຊ້ເຄື່ອງມືການວິເຄາະ AI ເພື່ອຊ່ວຍໃນ Greenlighting ຮູບເງົາ

Daniel Nelson

Blogger ແລະ programmer ທີ່ມີຄວາມຊ່ຽວຊານໃນ ການຮຽນຮູ້ເຄື່ອງ ແລະ Deep Learning ຫົວຂໍ້. Daniel ຫວັງວ່າຈະຊ່ວຍໃຫ້ຄົນອື່ນນໍາໃຊ້ພະລັງງານຂອງ AI ເພື່ອຄວາມດີຂອງສັງຄົມ.