ກ້ານໃບ ແບບຈໍາລອງ AI ທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນທີ່ມີຄວາມລໍາອຽງທາງເພດປະຕິບັດຮ້າຍແຮງກວ່າເກົ່າໃນການວິນິດໄສພະຍາດ - Unite.AI
ເຊື່ອມຕໍ່ກັບພວກເຮົາ

ຮັກ​ສາ​ສຸ​ຂະ​ພາບ

ແບບຈໍາລອງ AI ທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນທີ່ມີຄວາມລໍາອຽງທາງເພດປະຕິບັດຮ້າຍແຮງກວ່າເກົ່າໃນການວິນິດໄສພະຍາດ

mm

ຈັດພີມມາ

 on

ບໍ່ດົນມານີ້, a ການສຶກສາຈັດພີມມາ ໃນວາລະສານ PNAS ແລະດໍາເນີນການໂດຍນັກຄົ້ນຄວ້າຈາກອາເຈນຕິນາ, implied ວ່າການປະກົດຕົວຂອງຂໍ້ມູນການຝຶກອົບຮົມທາງເພດ skewed ນໍາໄປສູ່ການປະຕິບັດຕົວແບບທີ່ຮ້າຍແຮງກວ່າເກົ່າໃນເວລາທີ່ການວິນິດໄສພະຍາດແລະບັນຫາທາງການແພດອື່ນໆ. ຕາມລາຍງານຂອງ Statsnews, ທີມງານຂອງນັກຄົ້ນຄວ້າໄດ້ທົດລອງກັບແບບຈໍາລອງການຝຶກອົບຮົມທີ່ຄົນເຈັບທີ່ເປັນເພດຍິງແມ່ນສັງເກດເຫັນຫນ້ອຍຫຼືຖືກຍົກເວັ້ນທັງຫມົດ, ແລະພົບວ່າ algorithm ປະຕິບັດຮ້າຍແຮງກວ່າເກົ່າໃນເວລາທີ່ການວິນິດໄສເຂົາເຈົ້າ. ຂະນະດຽວກັນຍັງຖືເປັນຄວາມຈິງສໍາລັບເຫດການທີ່ຄົນເຈັບຜູ້ຊາຍໄດ້ຖືກຍົກເວັ້ນຫຼືມີການສະແດງຫນ້ອຍ.

ໃນໄລຍະເຄິ່ງທົດສະວັດທີ່ຜ່ານມາ, ເນື່ອງຈາກແບບຈໍາລອງ AI ແລະການຮຽນຮູ້ເຄື່ອງຈັກໄດ້ກາຍເປັນທີ່ກວ້າງຂວາງ, ການເອົາໃຈໃສ່ຫຼາຍຂຶ້ນຕໍ່ກັບບັນຫາຂອງຊຸດຂໍ້ມູນທີ່ມີອະຄະຕິ ແລະແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກທີ່ມີອະຄະຕິທີ່ເປັນຜົນມາຈາກພວກມັນ. ຄວາມລໍາອຽງຂອງຂໍ້ມູນໃນການຮຽນຮູ້ຂອງເຄື່ອງຈັກສາມາດນໍາໄປສູ່ການງຸ່ມງ່າມ, ຄວາມເສຍຫາຍຕໍ່ສັງຄົມ, ແລະຄໍາຮ້ອງສະຫມັກ AI ສະເພາະ, ແຕ່ວ່າໃນເວລາທີ່ມັນມາກັບຄໍາຮ້ອງສະຫມັກທາງການແພດຊີວິດສາມາດຢູ່ໃນເສັ້ນ. ຢ່າງໃດກໍ່ຕາມ, ເຖິງວ່າຈະມີຄວາມຮູ້ກ່ຽວກັບບັນຫາ, ການສຶກສາຈໍານວນຫນ້ອຍໄດ້ພະຍາຍາມປະເມີນວ່າຊຸດຂໍ້ມູນທີ່ມີຄວາມລໍາອຽງສາມາດທໍາລາຍໄດ້ແນວໃດ. ການສຶກສາທີ່ດໍາເນີນໂດຍທີມງານຄົ້ນຄ້ວາພົບວ່າຄວາມລໍາອຽງຂອງຂໍ້ມູນສາມາດມີຜົນກະທົບທີ່ຮ້າຍແຮງກວ່າທີ່ຜູ້ຊ່ຽວຊານຫຼາຍຄົນຄາດຄະເນໄວ້ກ່ອນຫນ້ານີ້.

ຫນຶ່ງໃນການນໍາໃຊ້ທີ່ນິຍົມທີ່ສຸດສໍາລັບ AI ໃນສອງສາມປີຜ່ານມາ, ໃນສະພາບການທາງການແພດ, ແມ່ນການນໍາໃຊ້ຕົວແບບ AI ເພື່ອວິນິດໄສຄົນເຈັບໂດຍອີງໃສ່ຮູບພາບທາງການແພດ. ທີມວິໄຈໄດ້ວິເຄາະແບບຈໍາລອງທີ່ໃຊ້ເພື່ອກວດຫາສະພາບທາງການແພດຕ່າງໆເຊັ່ນ: ປອດອັກເສບ, cardiomegaly, ຫຼື hernias ຈາກ X-rays. ທີມວິໄຈໄດ້ສຶກສາສາມສະຖາປັດຕະຍະກຳແບບເປີດແຫຼ່ງ: Inception-v3, ResNet, ແລະ DenseNet-121. ຮູບແບບດັ່ງກ່າວໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບການ X-rays ຫນ້າເອິກທີ່ດຶງມາຈາກສອງຊຸດຂໍ້ມູນ open-source ທີ່ມາຈາກມະຫາວິທະຍາໄລ Stanford ແລະສະຖາບັນສຸຂະພາບແຫ່ງຊາດ. ເຖິງແມ່ນວ່າຊຸດຂໍ້ມູນຕົວເອງມີຄວາມສົມດູນພໍສົມຄວນເມື່ອເວົ້າເຖິງການເປັນຕົວແທນທາງເພດ, ນັກຄົ້ນຄວ້າໄດ້ບິດເບືອນຂໍ້ມູນປອມໂດຍການແຍກພວກມັນອອກເປັນຊຸດຍ່ອຍທີ່ມີຄວາມບໍ່ສົມດຸນທາງເພດ.

ທີມງານຄົ້ນຄ້ວາໄດ້ສ້າງຊຸດຂໍ້ມູນການຝຶກອົບຮົມຫ້າຊຸດທີ່ແຕກຕ່າງກັນ, ແຕ່ລະຄົນປະກອບດ້ວຍອັດຕາສ່ວນທີ່ແຕກຕ່າງກັນຂອງການສະແກນຄົນເຈັບເພດຊາຍ / ຍິງ. ຊຸດ​ຝຶກ​ອົບ​ຮົມ XNUMX ຊຸດ​ໄດ້​ແບ່ງ​ອອກ​ເປັນ​ດັ່ງ​ນີ້:

  • ຮູບພາບທັງໝົດແມ່ນຂອງຄົນເຈັບຜູ້ຊາຍ
  • ຮູບພາບທັງໝົດແມ່ນຂອງຄົນເຈັບເພດຍິງ
  • ຄົນເຈັບເພດຊາຍ 25% ແລະ ຄົນເຈັບເພດຍິງ 75%.
  • ຄົນເຈັບຍິງ 75% ແລະ ຄົນເຈັບຊາຍ 25%.
  • ຄົນເຈັບເຄິ່ງເພດຊາຍ ແລະ ຄົນເຈັບເຄິ່ງຍິງ

ຫຼັງຈາກຮູບແບບດັ່ງກ່າວໄດ້ຮັບການຝຶກອົບຮົມໃນຫນຶ່ງຂອງຊຸດຍ່ອຍ, ມັນໄດ້ຖືກທົດສອບໃນການເກັບກໍາການສະແກນຈາກຄົນເຈັບທັງຊາຍແລະຍິງ. ມີທ່າອ່ຽງທີ່ໂດດເດັ່ນທີ່ປະກົດຂຶ້ນໃນທົ່ວເງື່ອນໄຂທາງການແພດຕ່າງໆ, ຄວາມຖືກຕ້ອງຂອງແບບຈໍາລອງແມ່ນຮ້າຍແຮງຂຶ້ນຫຼາຍເມື່ອຂໍ້ມູນການຝຶກອົບຮົມແມ່ນມີຄວາມວິຕົກກັງວົນທາງເພດ. ສິ່ງທີ່ຫນ້າສົນໃຈທີ່ຄວນສັງເກດແມ່ນວ່າຖ້າເພດຫນຶ່ງຖືກສະແດງຫຼາຍເກີນໄປໃນຂໍ້ມູນການຝຶກອົບຮົມ, ເພດນັ້ນເບິ່ງຄືວ່າບໍ່ໄດ້ຮັບຜົນປະໂຫຍດຈາກການເປັນຕົວແທນຫຼາຍເກີນໄປ. ໂດຍບໍ່ສົນເລື່ອງບໍ່ວ່າຈະເປັນແບບຈໍາລອງໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນ skewed ສໍາລັບການຮ່ວມເພດຫນຶ່ງຫຼືອື່ນໆ, ມັນບໍ່ໄດ້ປະຕິບັດທີ່ດີກວ່າກ່ຽວກັບການຮ່ວມເພດນັ້ນເມື່ອທຽບກັບເວລາທີ່ມັນໄດ້ຖືກຝຶກອົບຮົມໃນຊຸດຂໍ້ມູນລວມ.

ຜູ້ຂຽນອາວຸໂສຂອງການສຶກສາ, Enzo Ferrante, ອ້າງເຖິງຂໍ້ຄວາມຈາກ Statnews ເປັນການອະທິບາຍວ່າການສຶກສາໄດ້ຊີ້ໃຫ້ເຫັນເຖິງຄວາມສໍາຄັນຂອງຂໍ້ມູນການຝຶກອົບຮົມເພື່ອໃຫ້ມີຄວາມຫຼາກຫຼາຍແລະເປັນຕົວແທນສໍາລັບປະຊາກອນທັງຫມົດທີ່ທ່ານຕັ້ງໃຈຈະທົດສອບຕົວແບບ.

ມັນບໍ່ເປັນທີ່ຈະແຈ້ງເລີຍວ່າ ເປັນຫຍັງແບບຈໍາລອງທີ່ຝຶກການຮ່ວມເພດແບບໜຶ່ງມີທ່າອ່ຽງຈະປະຕິບັດໄດ້ບໍ່ດີກວ່າເມື່ອມີການຮ່ວມເພດອື່ນ. ຄວາມແຕກຕ່າງບາງຢ່າງອາດເປັນຍ້ອນຄວາມແຕກຕ່າງທາງດ້ານສະລີລະວິທະຍາ, ແຕ່ປັດໃຈຕ່າງໆທາງດ້ານສັງຄົມ ແລະວັດທະນະ ທຳ ຍັງສາມາດຄິດເຖິງຄວາມແຕກຕ່າງບາງຢ່າງ. ສໍາລັບຕົວຢ່າງ, ແມ່ຍິງອາດຈະໄດ້ຮັບການ X-rays ໃນຂັ້ນຕອນທີ່ແຕກຕ່າງກັນຂອງຄວາມຄືບຫນ້າຂອງພະຍາດຂອງເຂົາເຈົ້າເມື່ອທຽບກັບຜູ້ຊາຍ. ຖ້ານີ້ແມ່ນຄວາມຈິງ, ມັນສາມາດສົ່ງຜົນກະທົບຕໍ່ລັກສະນະຕ່າງໆ (ແລະດັ່ງນັ້ນຮູບແບບທີ່ໄດ້ຮຽນຮູ້ໂດຍຕົວແບບ) ທີ່ພົບເຫັນຢູ່ໃນຮູບພາບການຝຶກອົບຮົມ. ຖ້າເປັນເຊັ່ນນີ້, ມັນເຮັດໃຫ້ມັນຍາກຫຼາຍສໍາລັບນັກຄົ້ນຄວ້າທີ່ຈະ de-bias ຊຸດຂໍ້ມູນຂອງເຂົາເຈົ້າ, ຍ້ອນວ່າຄວາມລໍາອຽງຈະຖືກເຂົ້າໄປໃນຊຸດຂໍ້ມູນໂດຍຜ່ານກົນໄກຂອງການເກັບກໍາຂໍ້ມູນ.

ເຖິງແມ່ນວ່ານັກຄົ້ນຄວ້າຜູ້ທີ່ເອົາໃຈໃສ່ຢ່າງໃກ້ຊິດກັບຄວາມຫຼາກຫຼາຍຂອງຂໍ້ມູນບາງຄັ້ງກໍ່ບໍ່ມີທາງເລືອກນອກເຫນືອຈາກການເຮັດວຽກກັບຂໍ້ມູນທີ່ບິດເບືອນຫຼືມີຄວາມລໍາອຽງ. ສະຖານະການທີ່ມີຄວາມບໍ່ສົມດຸນລະຫວ່າງວິທີການກວດພະຍາດທາງການແພດມັກຈະເຮັດໃຫ້ຂໍ້ມູນຄວາມບໍ່ສົມດຸນ. ຕົວຢ່າງ, ຂໍ້ມູນຂອງຄົນເຈັບທີ່ເປັນມະເຮັງເຕົ້ານົມແມ່ນເກືອບທັງຫມົດເກັບກໍາຈາກແມ່ຍິງ. ເຊັ່ນດຽວກັນ, autism manifests ແຕກຕ່າງກັນລະຫວ່າງແມ່ຍິງແລະຜູ້ຊາຍ, ແລະເປັນຜົນມາຈາກ, ສະພາບການໄດ້ຖືກວິນິດໄສໃນອັດຕາທີ່ສູງກວ່າເດັກນ້ອຍຊາຍຫຼາຍກ່ວາເດັກຍິງ.

ຢ່າງໃດກໍຕາມ, ມັນເປັນສິ່ງສໍາຄັນທີ່ສຸດສໍາລັບນັກຄົ້ນຄວ້າທີ່ຈະຄວບຄຸມຂໍ້ມູນ skewed ແລະຄວາມລໍາອຽງຂອງຂໍ້ມູນໃນທາງໃດກໍ່ຕາມທີ່ເຂົາເຈົ້າສາມາດເຮັດໄດ້. ເພື່ອເຮັດສິ່ງນີ້, ການສຶກສາໃນອະນາຄົດຈະຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າປະເມີນຜົນກະທົບຂອງຂໍ້ມູນທີ່ມີຄວາມລໍາອຽງ.

Blogger ແລະ programmer ທີ່ມີຄວາມຊ່ຽວຊານໃນ ການຮຽນຮູ້ເຄື່ອງ ແລະ Deep Learning ຫົວຂໍ້. Daniel ຫວັງ​ວ່າ​ຈະ​ຊ່ວຍ​ໃຫ້​ຄົນ​ອື່ນ​ນໍາ​ໃຊ້​ພະ​ລັງ​ງານ​ຂອງ AI ເພື່ອ​ຄວາມ​ດີ​ຂອງ​ສັງ​ຄົມ.