ກ້ານໃບ 3 ວິທີທີ່ຈະຮັກສາຂໍ້ເທັດຈິງທີ່ຍັງຄົງຄ້າງຢູ່ໃນຕົວແບບພາສາຂະຫນາດໃຫຍ່ - Unite.AI
ເຊື່ອມຕໍ່ກັບພວກເຮົາ

ຜູ້ ນຳ ທີ່ຄິດ

3 ວິທີທີ່ຈະຮັກສາຂໍ້ເທັດຈິງທີ່ຄົງຄ້າງຢູ່ໃນຕົວແບບພາສາຂະຫນາດໃຫຍ່

mm

ຈັດພີມມາ

 on

ຮູບແບບພາສາຂະຫນາດໃຫຍ່ (LLM) ເຊັ່ນ GPT3, ChatGPT ແລະ BARD ແມ່ນຄວາມໂກດແຄ້ນໃນມື້ນີ້. ທຸກຄົນມີຄວາມຄິດເຫັນກ່ຽວກັບວິທີເຄື່ອງມືເຫຼົ່ານີ້ດີຫຼືບໍ່ດີສໍາລັບສັງຄົມແລະສິ່ງທີ່ພວກເຂົາຫມາຍເຖິງອະນາຄົດຂອງ AI. ກູໂກໄດ້ຮັບຫຼາຍ flak ສໍາລັບຮູບແບບໃຫມ່ຂອງຕົນ BARD ໄດ້ຮັບຄໍາຖາມທີ່ສັບສົນທີ່ຜິດພາດ (ເລັກນ້ອຍ). ເມື່ອຖືກຖາມວ່າ "ການຄົ້ນພົບໃຫມ່ອັນໃດຈາກກ້ອງສ່ອງທາງໄກອາວະກາດ James Webb ຂ້ອຍສາມາດບອກເດັກນ້ອຍ 9 ປີຂອງຂ້ອຍໄດ້ບໍ?" - chatbot ໃຫ້ສາມຄໍາຕອບ, ໃນນັ້ນ 2 ຖືກຕ້ອງແລະ 1 ຜິດ. ອັນທີ່ຜິດພາດແມ່ນວ່າຮູບ "exoplanet" ທໍາອິດຖືກຖ່າຍໂດຍ JWST, ເຊິ່ງບໍ່ຖືກຕ້ອງ. ດັ່ງນັ້ນໂດຍພື້ນຖານແລ້ວ, ຮູບແບບມີຄວາມຈິງທີ່ບໍ່ຖືກຕ້ອງຖືກເກັບໄວ້ໃນຖານຂໍ້ມູນຄວາມຮູ້ຂອງມັນ. ສໍາລັບຮູບແບບພາສາຂະຫນາດໃຫຍ່ເພື່ອໃຫ້ມີປະສິດທິພາບ, ພວກເຮົາຕ້ອງການວິທີການຮັກສາຂໍ້ເທັດຈິງເຫຼົ່ານີ້ປັບປຸງຫຼືເພີ່ມຂໍ້ເທັດຈິງດ້ວຍຄວາມຮູ້ໃຫມ່.

ທໍາອິດໃຫ້ເບິ່ງວ່າຂໍ້ເທັດຈິງຖືກເກັບໄວ້ພາຍໃນຕົວແບບພາສາຂະຫນາດໃຫຍ່ (LLM). ຮູບແບບພາສາຂະຫນາດໃຫຍ່ບໍ່ເກັບຮັກສາຂໍ້ມູນແລະຂໍ້ເທັດຈິງໃນຄວາມຮູ້ສຶກແບບດັ້ງເດີມເຊັ່ນຖານຂໍ້ມູນຫຼືໄຟລ໌. ແທນທີ່ຈະ, ພວກເຂົາໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຂໍ້ຄວາມຈໍານວນຫລາຍແລະໄດ້ຮຽນຮູ້ຮູບແບບແລະຄວາມສໍາພັນໃນຂໍ້ມູນນັ້ນ. ນີ້ເຮັດໃຫ້ພວກເຂົາສາມາດສ້າງຄໍາຕອບທີ່ຄ້າຍຄືກັບມະນຸດຕໍ່ຄໍາຖາມ, ແຕ່ພວກເຂົາບໍ່ມີບ່ອນເກັບມ້ຽນສະເພາະສໍາລັບຂໍ້ມູນທີ່ຮຽນຮູ້ຂອງພວກເຂົາ. ເມື່ອຕອບຄໍາຖາມ, ຕົວແບບໃຊ້ການຝຶກອົບຮົມຂອງຕົນເພື່ອສ້າງຄໍາຕອບໂດຍອີງໃສ່ວັດສະດຸປ້ອນທີ່ໄດ້ຮັບ. ຂໍ້ມູນແລະຄວາມຮູ້ທີ່ຕົວແບບພາສາມີແມ່ນເປັນຜົນມາຈາກຮູບແບບທີ່ມັນໄດ້ຮຽນຮູ້ໃນຂໍ້ມູນທີ່ມັນໄດ້ຮັບການຝຶກອົບຮົມ, ບໍ່ແມ່ນຜົນມາຈາກມັນຖືກເກັບໄວ້ຢ່າງຊັດເຈນໃນຫນ່ວຍຄວາມຈໍາຂອງຕົວແບບ. ສະຖາປັດຕະຍະກໍາ Transformers ທີ່ LLMs ທີ່ທັນສະໄຫມທີ່ສຸດແມ່ນອີງໃສ່ການເຂົ້າລະຫັດພາຍໃນຂອງຂໍ້ເທັດຈິງທີ່ຖືກນໍາໃຊ້ສໍາລັບການຕອບຄໍາຖາມທີ່ຖາມໃນທັນທີ.

ດັ່ງນັ້ນ, ຖ້າຂໍ້ເທັດຈິງພາຍໃນຫນ່ວຍຄວາມຈໍາພາຍໃນຂອງ LLM ແມ່ນຜິດພາດຫຼື stale, ຂໍ້ມູນໃຫມ່ຕ້ອງໄດ້ຮັບການສະຫນອງໃຫ້ໂດຍຜ່ານການກະຕຸ້ນເຕືອນ. Prompt ແມ່ນຂໍ້ຄວາມທີ່ຖືກສົ່ງໄປຫາ LLM ດ້ວຍການສອບຖາມແລະຫຼັກຖານສະຫນັບສະຫນູນທີ່ສາມາດເປັນຂໍ້ເທັດຈິງໃຫມ່ຫຼືແກ້ໄຂໄດ້. ນີ້ແມ່ນ 3 ວິທີທີ່ຈະເຂົ້າຫາເລື່ອງນີ້.

1. ວິທີໜຶ່ງໃນການແກ້ໄຂຂໍ້ເທັດຈິງທີ່ຖືກເຂົ້າລະຫັດຂອງ LLM ແມ່ນການສະໜອງຂໍ້ເທັດຈິງໃໝ່ທີ່ກ່ຽວຂ້ອງກັບບໍລິບົດໂດຍໃຊ້ພື້ນຖານຄວາມຮູ້ພາຍນອກ. ພື້ນຖານຄວາມຮູ້ນີ້ອາດຈະເປັນການໂທ API ເພື່ອໃຫ້ໄດ້ຮັບຂໍ້ມູນທີ່ກ່ຽວຂ້ອງຫຼືຊອກຫາຢູ່ໃນຖານຂໍ້ມູນ SQL, No-SQL, ຫຼື Vector. ຄວາມຮູ້ກ້າວຫນ້າທາງດ້ານຫຼາຍສາມາດສະກັດຈາກກາຟຄວາມຮູ້ທີ່ເກັບຮັກສາຫນ່ວຍງານຂໍ້ມູນແລະການພົວພັນລະຫວ່າງພວກເຂົາ. ອີງຕາມຂໍ້ມູນທີ່ຜູ້ໃຊ້ກໍາລັງສອບຖາມ, ຂໍ້ມູນສະພາບການທີ່ກ່ຽວຂ້ອງສາມາດຖືກດຶງເອົາແລະໃຫ້ເປັນຂໍ້ເທັດຈິງເພີ່ມເຕີມໃຫ້ກັບ LLM. ຂໍ້ເທັດຈິງເຫຼົ່ານີ້ອາດຈະຖືກຈັດຮູບແບບໃຫ້ຄ້າຍຄືກັບຕົວຢ່າງການຝຶກອົບຮົມເພື່ອປັບປຸງຂະບວນການຮຽນຮູ້. ຕົວຢ່າງ, ທ່ານອາດຈະຜ່ານຄູ່ຄໍາຖາມຄໍາຖາມສໍາລັບຕົວແບບເພື່ອຮຽນຮູ້ວິທີການໃຫ້ຄໍາຕອບ.

2. ວິທີການທີ່ມີນະວັດຕະກໍາຫຼາຍຂຶ້ນ (ແລະລາຄາແພງກວ່າ) ເພື່ອເພີ່ມ LLM ແມ່ນການປັບແຕ່ງຕົວຈິງໂດຍໃຊ້ຂໍ້ມູນການຝຶກອົບຮົມ. ດັ່ງນັ້ນແທນທີ່ຈະສອບຖາມພື້ນຖານຄວາມຮູ້ສໍາລັບຂໍ້ເທັດຈິງສະເພາະທີ່ຈະເພີ່ມ, ພວກເຮົາສ້າງຊຸດຂໍ້ມູນການຝຶກອົບຮົມໂດຍການເກັບຕົວຢ່າງພື້ນຖານຄວາມຮູ້. ການນໍາໃຊ້ເຕັກນິກການຮຽນຮູ້ການຊີ້ນໍາເຊັ່ນ: ການປັບລະອຽດພວກເຮົາສາມາດສ້າງສະບັບໃຫມ່ຂອງ LLM ທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຄວາມຮູ້ເພີ່ມເຕີມນີ້. ຂະບວນການນີ້ປົກກະຕິແລ້ວມີລາຄາແພງແລະສາມາດມີຄ່າໃຊ້ຈ່າຍສອງສາມພັນໂດລາເພື່ອສ້າງແລະຮັກສາຮູບແບບການປັບໄຫມໃນ OpenAI. ແນ່ນອນ, ຄ່າໃຊ້ຈ່າຍຄາດວ່າຈະໄດ້ຮັບລາຄາຖືກກວ່າໃນໄລຍະເວລາ.

3. ທາງເລືອກອື່ນແມ່ນການໃຊ້ວິທີການເຊັ່ນ Reinforcement Learning (RL) ເພື່ອຝຶກອົບຮົມຕົວແທນທີ່ມີຄວາມຄິດເຫັນຂອງມະນຸດແລະຮຽນຮູ້ນະໂຍບາຍກ່ຽວກັບວິທີຕອບຄໍາຖາມ. ວິທີການນີ້ມີປະສິດທິຜົນສູງໃນການສ້າງຕົວແບບຮອຍຕີນທີ່ນ້ອຍກວ່າເຊິ່ງໄດ້ຮັບຜົນດີໃນວຽກງານສະເພາະ. ຕົວຢ່າງ, ChatGPT ທີ່ມີຊື່ສຽງທີ່ປ່ອຍອອກມາໂດຍ OpenAI ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບການປະສົມປະສານຂອງການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງແລະ RL ທີ່ມີຄວາມຄິດເຫັນຂອງມະນຸດ.

ສະຫລຸບລວມແລ້ວ, ນີ້ແມ່ນພື້ນທີ່ທີ່ມີການພັດທະນາສູງກັບທຸກໆບໍລິສັດໃຫຍ່ທີ່ຕ້ອງການທີ່ຈະເຂົ້າໄປໃນແລະສະແດງໃຫ້ເຫັນຄວາມແຕກຕ່າງຂອງພວກເຂົາ. ໃນໄວໆນີ້ພວກເຮົາຈະເຫັນເຄື່ອງມື LLM ທີ່ສໍາຄັນໃນພື້ນທີ່ສ່ວນໃຫຍ່ເຊັ່ນ: ການຂາຍຍ່ອຍ, ການດູແລສຸຂະພາບແລະການທະນາຄານທີ່ສາມາດຕອບສະຫນອງໃນລັກສະນະທີ່ຄ້າຍຄືກັບມະນຸດທີ່ເຂົ້າໃຈຄວາມແຕກຕ່າງຂອງພາສາ. ເຄື່ອງມືທີ່ຂັບເຄື່ອນໂດຍ LLM ເຫຼົ່ານີ້ປະສົມປະສານກັບຂໍ້ມູນວິສາຫະກິດສາມາດປັບປຸງການເຂົ້າເຖິງແລະເຮັດໃຫ້ຂໍ້ມູນທີ່ຖືກຕ້ອງກັບຄົນທີ່ຖືກຕ້ອງໃນເວລາທີ່ເຫມາະສົມ.

Dattaraj Rao, ຫົວໜ້ານັກວິທະຍາສາດຂໍ້ມູນ ລະບົບຄົງທີ່, ແມ່ນຜູ້ຂຽນຂອງຫນັງສື "Keras to Kubernetes: ການເດີນທາງຂອງເຄື່ອງຈັກການຮຽນຮູ້ກັບການຜະລິດ." ຢູ່ລະບົບຄົງທີ່, Dattaraj ນໍາພາຫ້ອງທົດລອງ AI ທີ່ຄົ້ນຄວ້າລະບົບວິໄສທັດທີ່ທັນສະໄໝໃນຄອມພິວເຕີວິໄສທັດ, ຄວາມເຂົ້າໃຈພາສາທໍາມະຊາດ, ການສ້າງໂປຣແກມ Probabilistic, ການຮຽນຮູ້ເສີມ, AI ທີ່ສາມາດອະທິບາຍໄດ້, ແລະອື່ນໆ ແລະສະແດງໃຫ້ເຫັນເຖິງຄວາມສາມາດໃນການດູແລສຸຂະພາບ, ການທະນາຄານ ແລະອຸດສາຫະກໍາ. Dattaraj ມີ 11 ສິດທິບັດໃນ Machine Learning ແລະ Computer Vision.