ປັນຍາປະດິດ
ສະແດງຄວາມຮູ້ສຶກຜ່ານການພິມດ້ວຍ AI
ທ່າອ່ຽງ ແລະ ນະວັດຕະກໍາໃນປະຈຸບັນໃນການສື່ສານທາງຂໍ້ຄວາມ (ລວມທັງອີເມລ໌, ຂໍ້ຄວາມ, ແລະລະບົບການບັນຍາຍ) ຈະຕ້ອງເຈລະຈາກ່ຽວກັບ chasm ທີ່ມີຜົນກະທົບລະຫວ່າງຄໍາເວົ້າທີ່ເປັນລາຍລັກອັກສອນແລະເວົ້າໃນທາງທີ່ໂຫດຮ້າຍແລະປະມານ.
ສໍາລັບຕົວຢ່າງ, ສອງສາມປີຜ່ານມາໄດ້ນໍາເອົາ ໝວກສະຫຼັບ ເຂົ້າໄປໃນ vogue ເປັນ meme provocative ໃນສົງຄາມ flame ສື່ມວນຊົນສັງຄົມ, ໃນຂະນະທີ່, ໄດ້ ຊັງຫຼາຍ ການນໍາໃຊ້ caps lock (ເຊັ່ນດຽວກັນກັບຜົນກະທົບ typographic ກ້າຫານແລະ jarring ອະນຸຍາດໃຫ້ໂດຍບາງເວທີຄໍາເຫັນ) ຍັງສືບຕໍ່ provoke ການແຊກແຊງຈາກຜູ້ຄວບຄຸມ. ເຫຼົ່ານີ້ແມ່ນ monotone ແລະພຽງແຕ່ວິທີການເປັນຕົວແທນຢ່າງກວ້າງຂວາງເພື່ອຊີ້ແຈງຄວາມຕັ້ງໃຈຂອງຄໍາທີ່ຂຽນ.
ໃນເວລາດຽວກັນ, ການຂະຫຍາຍຕົວຂອງຄວາມນິຍົມຂອງ emoticons ແລະ emojis, ເປັນເຄື່ອງຖ່າຍທອດຄວາມຮູ້ສຶກຂອງຂໍ້ຄວາມ / ສາຍຕາແບບປະສົມ, ມີ. ມີສ່ວນຮ່ວມຢ່າງຫ້າວຫັນ ຂະແຫນງການຄົ້ນຄວ້າການປຸງແຕ່ງພາສາທໍາມະຊາດ (NLP) ໃນຊຸມປີທີ່ຜ່ານມາ, ພ້ອມກັບຄວາມສົນໃຈໃນ ຄວາມຫມາຍຂອງ GIFs ເຄື່ອນໄຫວ ທີ່ຜູ້ໃຊ້ປະກາດໃນຫົວຂໍ້ຄໍາເຫັນ.
ເມື່ອເວລາຜ່ານໄປ, ພາສາຂຽນໄດ້ພັດທະນາກອງທຶນປະດິດສ້າງຂອງວິທີການພາສາ 'ສິ່ງເພີ່ມເຕີມ' ເຫຼົ່ານີ້, ເຊິ່ງພະຍາຍາມເຮັດໃຫ້ຄວາມຮູ້ສຶກຂອງຕົວແທນຫຼືການກະຕຸ້ນມັນໃນເວລາທີ່ບໍ່ມີຂໍ້ມູນສຽງໃນຄໍາເວົ້າ.
ໂດຍປົກກະຕິແລ້ວ, ແນວໃດກໍ່ຕາມ, ພວກເຮົາຈໍາເປັນຕ້ອງສະແດງຄວາມຮູ້ສຶກທີ່ດີທີ່ສຸດທີ່ພວກເຮົາສາມາດເຮັດໄດ້ຈາກສະພາບການຂອງຄໍາສັບທີ່ຂຽນ. ພິຈາລະນາ, ສໍາລັບການຍົກຕົວຢ່າງ, ໄດ້ clາຍທ້ວງ 'ໂອ້, ໂອ້ຍ!', ໃນບົດສະຫຼຸບຂອງ soliloquy nocturnal deranged ຂອງ Lady Macbeth, ເປັນກໍລະນີສຶກສາກ່ຽວກັບຂອບເຂດທີ່ intonation ສາມາດສົ່ງຜົນກະທົບຕໍ່ຄວາມຫມາຍ.
ໃນການປັບຕົວຫຼາຍທີ່ສຸດ, ການຮ້ອງໄຫ້ທີ່ເຈັບປວດນີ້ໃຊ້ເວລາ 2-6 ວິນາທີ; ໃນ 1976 Trevor Nunn ຂອງ Royal Shakespeare ບໍ ລິ ສັດ ການ ຜະ ລິດ ຂອງ ແມັກເບັດ, Judi Dench ເອົາການອ່ານເສັ້ນນີ້ໄປຫາບັນທຶກບາງທີທີ່ບໍ່ທ້າທາຍ ວິນາທີ 24.45, ໃນການຕີຄວາມໝາຍຂອງບົດບາດ.
(ລະບົບການບັນຍາຍອັດຕະໂນມັດຂອງ YouTube ສໍາລັບຄລິບນີ້ອະທິບາຍເຖິງການລໍ້ລວງຂອງ Dench ເປັນ. [ເພງ])
ການແປ Prosody ກັບ Typography
ເອກະສານສະບັບບໍ່ດົນມານີ້ຈາກປະເທດບຣາຊິນໄດ້ສະເໜີລະບົບການພິມຕົວພິມແບບແບບຄຳເວົ້າທີ່ອາດຈະລວມເອົາສິ່ງດັ່ງກ່າວ. ນິທານ, ແລະອົງປະກອບ paralinguistic ອື່ນໆ, ໂດຍກົງເຂົ້າໄປໃນຄໍາເວົ້າທີ່ມີຄໍາບັນຍາຍ, ເພີ່ມຂະຫນາດຂອງຄວາມຮູ້ສຶກທີ່ຈັບໄດ້ບໍ່ດີໂດຍການ prepending ຂອງ adjectives ເຊັ່ນ: [ສຽງຮ້ອງ], ຫຼື tricks 'ຮາບພຽງ' ອື່ນ ໆ ທີ່ມີຢູ່ໃນສົນທິສັນຍາການບັນຍາຍຄໍາບັນຍາຍ.
'ພວກເຮົາສະເໜີຮູບແບບນະວະນິຍາຍຂອງ Speech-Modulated Typography, ບ່ອນທີ່ລັກສະນະສຽງຈາກສຽງເວົ້າຖືກໃຊ້ເພື່ອປັບປ່ຽນລັກສະນະພາບຂອງຂໍ້ຄວາມ. ນີ້ສາມາດອະນຸຍາດໃຫ້ການຖອດຂໍ້ຄວາມຂອງຄໍາເວົ້າທີ່ໃຫ້ບໍ່ພຽງແຕ່ເປັນຕົວແທນຂອງຄໍາທີ່ຖືກເວົ້າ, ແຕ່ພວກເຂົາເວົ້າແນວໃດ.
'ດ້ວຍນີ້, ພວກເຮົາຫວັງວ່າຈະເປີດເຜີຍຕົວກໍານົດການພິມທີ່ສາມາດໄດ້ຮັບການຮັບຮູ້ໂດຍທົ່ວໄປວ່າເປັນຕົວແທນສາຍຕາສໍາລັບລັກສະນະ prosodic ຂອງຄວາມກວ້າງໄກ, pitch, ແລະໄລຍະເວລາ.'
ໄດ້ ເຈ້ຍ ແມ່ນຫົວຂໍ້ ສຽງອ້ວນທີ່ເຊື່ອງໄວ້, ສຽງກະຊິບ, ແລະສຽງຮ້ອງ: ສາມາດສ້າງຂໍ້ຄວາມໃຫ້ມີສຽງຫຼາຍກວ່າຄໍາເວົ້າຂອງມັນໄດ້ບໍ?, ແລະມາຈາກ Calua de Lacerda Pataca ແລະ Paula Dornhofer Paro Costa, ສອງນັກຄົ້ນຄວ້າຢູ່ Universidade Estadual de Campinas ໃນ Brazil.
ຄໍາທີ່ກ້າຫານ
ເຖິງແມ່ນວ່າຈຸດປະສົງທີ່ກວ້າງກວ່າຂອງໂຄງການແມ່ນການພັດທະນາລະບົບທີ່ສາມາດຖ່າຍທອດພາສາ prosody ແລະລັກສະນະພາສາ parametric ອື່ນໆໃນຄໍາບັນຍາຍ, ຜູ້ຂຽນຍັງເຊື່ອວ່າລະບົບລັກສະນະນີ້ສາມາດພັດທະນາຜູ້ຊົມທີ່ກວ້າງຂວາງໃນໂລກໄດ້ຍິນ.
ມີການລິເລີ່ມຫຼາຍຢ່າງໃນພື້ນທີ່ນີ້, ລວມທັງ a 1983 ໂຄງການ ທີ່ສະເຫນີລະບົບການບັນຍາຍທີ່ອາດຈະປະກອບມີ 'ເອັບເຟັກພິເສດ, ສີ, ແລະຕົວພິມໃຫຍ່ [ເພື່ອເປັນຕົວແທນ] ຂໍ້ມູນສຽງທີ່ອຸດົມສົມບູນໄດ້ປະຕິເສດເດັກນ້ອຍຫູໜວກ[.]'.
ໃນທາງກົງກັນຂ້າມ, ໂຄງການ Brazilian ສາມາດໃຊ້ປະໂຍດທັງການຖອດຂໍ້ຄວາມອັດຕະໂນມັດແລະການພັດທະນາໃຫມ່ໃນການຮັບຮູ້ຜົນກະທົບ, ເຊິ່ງປະສົມປະສານເພື່ອໃຫ້ຂະບວນການເຮັດວຽກທີ່ສາມາດນໍາເຂົ້າແລະລັກສະນະຂອງອົງປະກອບໃນ soundtrack ຄໍາເວົ້າ.
ຫຼັງຈາກລັກສະນະ prosodic ໄດ້ຖືກສະກັດແລະປຸງແຕ່ງ, ພວກມັນຖືກຈັດໃສ່ກັບເວລາປະທັບຕາຂອງຄໍາສັບຕ່າງໆໃນຄໍາເວົ້າ, ການຜະລິດ tokens ເຊິ່ງສາມາດຖືກນໍາໃຊ້ເພື່ອນໍາໃຊ້ modulation ຕາມກົດລະບຽບຂອງຕົວພິມຄໍາບັນຍາຍ (ເບິ່ງຮູບພາບຂ້າງເທິງ).
ຜົນໄດ້ຮັບນີ້ສາມາດສະແດງໃຫ້ເຫັນເຖິງຂອບເຂດທີ່ພະຍາງສະເພາະໃດນຶ່ງອາດຈະຍືດເຍື້ອ, ກະຊິບ, ເນັ້ນໃສ່, ຫຼືຖືເອົາຂໍ້ມູນບໍລິບົດທີ່ຈະສູນເສຍໄປໃນການຖອດຂໍ້ຄວາມດິບ.
ຜູ້ຂຽນຈະແຈ້ງວ່າວຽກງານຂອງເຂົາເຈົ້າບໍ່ໄດ້ມີຈຸດປະສົງເພື່ອປະກອບສ່ວນໂດຍກົງຕໍ່ການຮັບຮູ້ຄວາມຮູ້ສຶກແລະຜົນກະທົບຕໍ່ການຄົ້ນຄວ້າການຮັບຮູ້, ແຕ່ແທນທີ່ຈະຊອກຫາການຈັດປະເພດລັກສະນະຂອງການປາກເວົ້າແລະເປັນຕົວແທນໃຫ້ເຂົາເຈົ້າມີຂອບເຂດທີ່ງ່າຍດາຍແລະຈໍາກັດຂອງສົນທິສັນຍາການເບິ່ງເຫັນ Novell ໄດ້.
ຢ່າງຫນ້ອຍ, ການເນັ້ນຫນັກໃສ່ການເພີ່ມເຕີມຂອງລະບົບສະຫນອງປະໂຫຍກທີ່ບໍ່ຊ້ໍາກັນທີ່ຈຸດປະສົງຂອງການປະຕິບັດອາດຈະບໍ່ຊັດເຈນກັບຜູ້ຊົມທີ່ບໍ່ສາມາດໄດ້ຍິນສຽງ (ບໍ່ວ່າຈະຜ່ານຄວາມພິການຫຼືສະຖານະການຂອງການຫຼິ້ນ, ເຊັ່ນ: ສະພາບແວດລ້ອມທີ່ມີສຽງດັງ).
ເພື່ອຢືມຕົວຢ່າງຂອງຂ້ອຍເອງຈາກປີ 2017, ເຊິ່ງໄດ້ເບິ່ງວິທີການທີ່ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກສາມາດເຮັດໄດ້ ຍັງມີຄວາມຫຍຸ້ງຍາກ ໃນການເຂົ້າໃຈວ່າວັດຖຸແລະການກະ ທຳ ຢູ່ໃນປະໂຫຍກໃດ ໜຶ່ງ, ມັນງ່າຍທີ່ຈະເຫັນຂອບເຂດທີ່ການເນັ້ນ ໜັກ ສາມາດປ່ຽນຄວາມ ໝາຍ ຂອງປະໂຫຍກທີ່ງ່າຍດາຍ:
I ບໍ່ໄດ້ລັກອັນນັ້ນ. (ມີຄົນອື່ນລັກມັນ)
I ບໍ່ໄດ້ ລັກມັນ, (ຂ້ອຍປະຕິເສດການກ່າວຫາວ່າຂ້ອຍລັກມັນ)
ຂ້ອຍບໍ່ໄດ້ ລັກ ນັ້ນ. (ຂ້ອຍເປັນເຈົ້າຂອງມັນ, ການລັກບໍ່ໄດ້ນໍາໃຊ້)
ຂ້ອຍບໍ່ໄດ້ລັກ ທີ່. (ແຕ່ຂ້ອຍໄດ້ລັກອັນອື່ນ)
ທ່າແຮງ, ຂະບວນການເຮັດວຽກທາງດ້ານກົນຈັກ> typography ເຊັ່ນ: ຜູ້ຂຽນ Brazilian ແນະນໍາຍັງສາມາດເປັນປະໂຫຍດເປັນສ່ວນເສີມໃນການພັດທະນາຊຸດຂໍ້ມູນສໍາລັບຜົນການຄົ້ນຄວ້າຄອມພິວເຕີ້, ເນື່ອງຈາກວ່າມັນອໍານວຍຄວາມສະດວກໃນການປຸງແຕ່ງຂໍ້ມູນຂໍ້ຄວາມທີ່ບໍລິສຸດ, ຢ່າງໃດກໍຕາມ, ປະກອບດ້ວຍບາງ paralinguistic ລ່ວງຫນ້າ. ຂະຫນາດ.
ນອກຈາກນັ້ນ, ນັກຄົ້ນຄວ້າສັງເກດເຫັນ, ຄ່າໃຊ້ຈ່າຍທາງດ້ານພາສາພິເສດຂອງຂໍ້ຄວາມທີ່ຮູ້ຈັກ prosody ສາມາດເປັນປະໂຫຍດໃນຫຼາຍໆວຽກງານທີ່ອີງໃສ່ NLP, ລວມທັງການປະເມີນຄວາມພໍໃຈຂອງລູກຄ້າ, ແລະສໍາລັບການສະຫຼຸບຂອງຄວາມຊຶມເສົ້າຈາກເນື້ອໃນຂໍ້ຄວາມ.
Elastic Typography
ໂຄງຮ່າງການພັດທະນາໂດຍນັກຄົ້ນຄວ້າໄດ້ສະເຫນີການປ່ຽນແປງໃນການປ່ຽນແປງພື້ນຖານ, ບ່ອນທີ່ຈົດຫມາຍອາດຈະສູງກວ່າຫຼືຕ່ໍາທຽບກັບ 'ເສັ້ນພື້ນຖານ' ທີ່ປະໂຫຍກພັກຜ່ອນ; kerning, ບ່ອນທີ່ຊ່ອງຫວ່າງລະຫວ່າງຕົວອັກສອນຂອງຄໍາສັບໃດຫນຶ່ງອາດຈະຖືກສັນຍາຫຼືຂະຫຍາຍ; ແລະ font-weight (ຄວາມກ້າຫານ).
ສາມຄໍເຕົ້າໄຂ່ທີ່ສ້າງແຜນທີ່ກັບລັກສະນະທີ່ສະກັດອອກມາຂອງຄໍາເວົ້າທີ່ໂຄງການໄດ້ຈໍາກັດຕົວມັນເອງ: ຕາມລໍາດັບ, pitch, ໄລຍະເວລາ, ແລະ ຂະຫນາດ.
ເນື່ອງຈາກຕົວພິມດຽວອາດຈະຕ້ອງການຕົວອັກສອນເພີ່ມເຕີມແລະແຍກຕ່າງຫາກສໍາລັບການປ່ຽນແປງເຊັ່ນ: ຕົວຫນາແລະຕົວອຽງ, ນັກຄົ້ນຄວ້າໄດ້ໃຊ້ Google. ການປະຕິບັດ ຂອງຟອນ OpenType ອິນເຕີມິລານ, ເຊິ່ງລວມເອົາລະດັບນ້ຳໜັກເປັນເມັດເຂົ້າເປັນຟອນດຽວ.
ການທົດສອບ
ການສະແດງອອກຂອງ kerning ແລະການປ່ຽນແປງພື້ນຖານໄດ້ຖືກລວມເຂົ້າໃນ plugin ຂອງຕົວທ່ອງເວັບ, ເຊິ່ງເຮັດໃຫ້ການທົດສອບໄດ້ດໍາເນີນຢູ່ໃນ 117 ຜູ້ເຂົ້າຮ່ວມທີ່ສາມາດຟັງໄດ້.
ຊຸດຂໍ້ມູນສໍາລັບການທົດສອບໄດ້ຖືກສ້າງຂື້ນໂດຍສະເພາະສໍາລັບໂຄງການ, ໂດຍການຈ້າງນັກສະແດງທີ່ອ່ານບົດກະວີຫຼາຍໆຄັ້ງໂດຍເນັ້ນໃສ່ທີ່ແຕກຕ່າງກັນໃນແຕ່ລະຄັ້ງ, ກົງກັບສາມລັກສະນະທີ່ໂຄງການກໍາລັງສຶກສາ. ບົດກະວີໄດ້ຖືກເລືອກເພາະວ່າມັນອະນຸຍາດໃຫ້ມີການເນັ້ນຫນັກຫຼາຍ (ເຖິງແມ່ນວ່າເກີນຄວາມຕັ້ງໃຈຂອງນັກກະວີ) ໂດຍບໍ່ມີສຽງປອມໃນທໍາມະຊາດ.
ຜູ້ເຂົ້າຮ່ວມໄດ້ຖືກແບ່ງອອກເປັນສອງກຸ່ມ. ຄັ້ງທໍາອິດໄດ້ຖືກມອບໃຫ້ 15 ຮອບຂອງການອ່ານ stanza ຂອງນັກສະແດງພ້ອມກັບຂໍ້ຄວາມ synchronized, animated ແລະ modulated, ເຊິ່ງ unfurled ໃນທີ່ໃຊ້ເວລາກັບ clip ສຽງ.
ກຸ່ມທີສອງໄດ້ຮັບຊຸດວຽກດຽວກັນຢ່າງແທ້ຈິງ, ແຕ່ໄດ້ຖືກນໍາສະເຫນີດ້ວຍຮູບພາບຄົງທີ່ຂອງຂໍ້ຄວາມທີ່ຖືກດັດແປງ, ເຊິ່ງບໍ່ປ່ຽນແປງທັງຫມົດໃນລະຫວ່າງການຫຼີ້ນການອ່ານຂອງຜູ້ສະແດງ.
ອັດຕາສະເລ່ຍຂອງຄໍາຕອບທີ່ຖືກຕ້ອງແມ່ນ 67% ທີ່ບໍ່ແມ່ນແບບສຸ່ມສໍາລັບກຸ່ມຮູບພາບສະຖິດ, ແລະ 63% ສໍາລັບກຸ່ມຂໍ້ຄວາມເຄື່ອນໄຫວ. ຄວາມຄິດເຫັນຂອງຜູ້ເຂົ້າຮ່ວມທີ່ຮຽກຮ້ອງໂດຍນັກຄົ້ນຄວ້າຫຼັງຈາກການທົດລອງໄດ້ຢືນຢັນທິດສະດີຂອງພວກເຂົາວ່າການໂຫຼດມັນສະຫມອງຂອງການຕີຄວາມແບບເຄື່ອນໄຫວອາດຈະເຮັດໃຫ້ຄະແນນຕ່ໍາສໍາລັບການທົດສອບທີ່ບໍ່ສະຖິດ. ຢ່າງໃດກໍຕາມ, ປະເພດຂອງຄໍາບັນຍາຍແລະລະບົບຂໍ້ຄວາມທີ່ກອບດັ່ງກ່າວຈະມີຈຸດປະສົງສໍາລັບການໂດຍປົກກະຕິໃຫ້ຂໍ້ຄວາມທີ່ສໍາເລັດໂດຍຄ່າເລີ່ມຕົ້ນ.
ຄວາມຄິດເຫັນຂອງຜູ້ເຂົ້າຮ່ວມຍັງຊີ້ໃຫ້ເຫັນວ່າມີຂໍ້ຈໍາກັດທີ່ຍາກໃນການນໍາໃຊ້ kerning ເພື່ອຊີ້ບອກໄລຍະເວລາ, ໂດຍຜູ້ສະແດງຄວາມຄິດເຫັນຫນຶ່ງສັງເກດເຫັນວ່າເມື່ອຕົວອັກສອນຢູ່ຫ່າງກັນເກີນໄປ, ມັນຍາກທີ່ຈະກໍານົດຄໍາສັບໃດຫນຶ່ງ.
ນັກຄົ້ນຄວ້າຍັງສັງເກດວ່າ:
' [ບາງຄົນ] ຮູ້ສຶກວ່າຕົວແບບຄວນຈະສາມາດປະກອບການເປັນຕົວແທນຂອງຄໍາເວົ້າທີ່ມີລັກສະນະແລະສັບສົນຫຼາຍ, ເຊິ່ງມັນຄວນຈະເຮັດກັບຄໍາສັບຕ່າງໆທີ່ມີຄວາມຫລາກຫລາຍແລະສະແດງອອກ. ໃນຂະນະທີ່ນີ້ບໍ່ແມ່ນວຽກທີ່ງ່າຍດາຍ, ຢ່າງໃດກໍຕາມ, ມັນຍັງເປັນກໍາລັງໃຈທີ່ຈະຈິນຕະນາການວິທີການທີ່ແຕກຕ່າງກັນຂອງ typography ຮູບແບບການປາກເວົ້າສາມາດແຍກອອກເປັນພາກສະຫນາມໃຫມ່ນີ້ພັດທະນາ.'
ພິມຄັ້ງທຳອິດໃນວັນທີ 24 ກຸມພາ 2022.