Хиймэл оюун
GPT-3 болон бусад нарийн төвөгтэй хэлний загварт "галлюцинация" -аас урьдчилан сэргийлэх

"Хуурамч мэдээний" нэг онцлог шинж чанар нь үнэн зөв мэдээллийн хүрээнд худал мэдээллийг байнга гаргаж байдаг ба худал мэдээлэл нь утга зохиолын осмос хэлбэрээр хүлээн зөвшөөрөгдсөн эрх мэдлийг олж авдаг нь хагас үнэний хүчийг түгшээж харуулах явдал юм.
GPT-3 зэрэг байгалийн хэлний боловсруулалтын (NLP) боловсронгуй загварууд нь мөн ийм хандлагатай байдаг. "галлюцинат" энэ төрлийн хуурамч мэдээлэл. Энэ нь зарим талаараа хэлний загварууд нь үйл явдал, баримтуудыг утга санааны үйл явцаас хамгаалж, тодорхойлох, багтаах, "битүүмжлэх" чадвартай архитектурын ямар ч хязгаарлалтгүйгээр урт, ихэвчлэн лабиринт хэлбэртэй текстийг дахин өгүүлэх, нэгтгэн дүгнэх чадварыг шаарддагтай холбоотой юм. сэргээн босголт.
Тиймээс баримтууд нь NLP загварын хувьд ариун биш юм; Тэдгээрийг "семантик Лего тоосго" -ын хүрээнд хялбархан боловсруулж болно, ялангуяа нарийн төвөгтэй дүрмийн болон нууцлаг эх сурвалж нь салангид объектуудыг хэлний бүтцээс салгахад хэцүү болгодог.

Эргэлзээтэй хэллэгтэй эх материал нь GPT-3 гэх мэт хэлний нарийн төвөгтэй загваруудыг төөрөлдүүлж болохыг ажигласан. Эх сурвалж: Гүнзгийрүүлэх сургалтыг ашиглан парафраза үүсгэх
Энэ асуудал нь текстэд суурилсан машин сургалтаас компьютерийн харааны судалгаанд, ялангуяа объектыг тодорхойлох эсвэл дүрслэхийн тулд семантик ялгаварлан гадуурхах аргыг ашигладаг салбаруудад дамждаг.

Галлюцинация ба "гоо сайхны" буруу тайлбар нь компьютерийн харааны судалгаанд мөн нөлөөлдөг.
GPT-3-ын хувьд загвар нь аль хэдийн хөндсөн сэдвээр давтан асуулт асуухад урам хугарах болно. Хамгийн сайн тохиолдолд энэ нь ялагдлаа хүлээн зөвшөөрөх болно:

GPT-3 дээрх үндсэн Davinci хөдөлгүүртэй миний саяхан хийсэн туршилт. Загвар өмсөгч эхний оролдлогоор л хариултаа авдаг ч хоёр дахь удаагаа асуулт асуухад бухимддаг. Энэ нь өмнөх хариултын богино хугацааны санах ойг хадгалж, дахин давтагдсан асуултыг хариултаас татгалзсан гэж үздэг тул ялагдлаа хүлээн зөвшөөрдөг. Эх сурвалж: https://www.scalr.ai/post/business-applications-for-gpt-3
DaVinci болон DaVinci Instruct (Бета) нь API-ээр дамжуулан ашиглах боломжтой бусад GPT-3 загваруудаас илүү сайн ажилладаг. Энд Кюри загвар буруу хариулт өгдөг бол Баббижийн загвар нь мөн адил буруу хариулт дээр итгэлтэйгээр өргөжиж байна.
Эйнштейний хэзээ ч хэлж байгаагүй зүйлс
Эйнштейний "Бурхан орчлон ертөнцтэй шоо тоглодоггүй" гэсэн алдартай ишлэлд зориулж GPT-3 DaVinci Instruct хөдөлгүүрийг (одоогоор хамгийн чадвартай юм шиг санагдаж байна) асуухад ДаВинчи зааварчилгааг олж чадаагүй бөгөөд ишлэл бус ишлэл зохион бүтээжээ. ижил төстэй асуултын хариуд харьцангуй үнэмшилтэй, огт байхгүй гурван ишлэлийг (Эйнштейн эсвэл хэн нэгний бичсэн) хийсвэрлэх:

GPT-3 нь Эйнштейний дөрвөн үнэмшилтэй ишлэл гаргадаг бөгөөд эдгээрийн аль нь ч бүрэн текстээр интернет хайлт хийхэд ямар ч үр дүн өгдөггүй ч зарим нь Эйнштейний "төсөөлөл" сэдвээр өөр (бодит) ишлэлүүдийг үүсгэдэг.
Хэрэв GPT-3 нь иш татахдаа байнга алдаатай байсан бол эдгээр хий үзэгдэлийг программчлан бууруулахад хялбар байх болно. Гэсэн хэдий ч, ишлэл нь илүү тархсан, алдартай байх тусам GPT-3 нь үнийн саналыг зөв авах магадлал өндөр болно.

GPT-3 нь хувь нэмрээ оруулсан өгөгдөлд сайн илэрхийлэгдсэн тохиолдолд зөв ишлэлүүдийг олдог бололтой.
GPT-3-ийн сессийн түүхийн мэдээлэл шинэ асуулт болж хувирах үед хоёр дахь асуудал гарч ирж болно:
Эйнштейн энэ үгийг өөрт нь хамаатай гэж хэлвэл шуугиан тарьж магадгүй. Энэ ишлэл нь бодит амьдрал дээр байсан Уинстон Черчиллийн утгагүй хий үзэгдэл бололтой. афоризм. Өмнөх GPT-3 хуралдааны Черчилль (Эйнштейн биш) болон GPT-3-тай холбоотой асуулт нь хариултыг мэдэгдэхийн тулд энэ сессийн жетоныг андуурч ашигласан бололтой.
Галлюцинациятай тэмцэх нь эдийн засгийн хувьд
Галлюцинация нь нарийн төвөгтэй NLP загваруудыг судалгааны хэрэгсэл болгон ашиглахад ихээхэн саад болж байгаа бөгөөд ийм хөдөлгүүрийн гаралт нь түүнийг үүсгэсэн эх сурвалжаас маш их хийсвэр байх тусам ишлэл, баримтын үнэн зөвийг тогтооход бэрхшээлтэй болдог.
Тиймээс NLP-ийн өнөөгийн нэг ерөнхий судалгааны сорилт бол баримтуудыг салангид биет болгон нэгтгэсэн, тодорхойлж, баталгаажуулдаг цоо шинэ NLP загваруудыг төсөөлөх шаардлагагүйгээр хий үзэгдэлтэй бичвэрүүдийг тодорхойлох арга хэрэгслийг бий болгох явдал юм (хэд хэдэн өргөн компьютерт урт хугацааны, тусдаа зорилго юм). судалгааны салбарууд).
Галлюцинтэй контентыг тодорхойлох, үүсгэх
шинэ хамтын ажиллагаа Карнеги Меллон Их Сургууль болон Facebook-ийн хооронд хиймэл оюун ухаан судлал нь хий үзэгдэлтэй гаралтыг тодорхойлох аргыг боловсруулж, хиймэл хий үзэгдэлтэй текстийг ашиглан ирээдүйн шүүлтүүр, механизмд суурь болгон ашиглаж болох мэдээллийн багцыг бий болгох замаар хий үзэгдэлтэй холбоотой шинэ хандлагыг санал болгож байна. NLP архитектурын үндсэн хэсэг.

Эх сурвалж: https://arxiv.org/pdf/2011.02593.pdf
Дээрх зураг дээр эх материалыг үг тус бүрээр нь ангилсан бөгөөд залруулах үгэнд '0' шошго, хий үзэгдэлтэй үгэнд '1' шошго оноож өгсөн. Доор бид оролтын мэдээлэлтэй холбоотой, гэхдээ жинхэнэ бус өгөгдлөөр нэмэгдүүлсэн хий үзэгдэлтэй гаралтын жишээг харж байна.
Уг систем нь урьдчилан бэлтгэгдсэн дуу алдалтын автомат кодлогчийг ашигладаг бөгөөд энэ нь эвдэрсэн хувилбарыг үүсгэсэн эх бичвэрт нь хий үзэгдэлтэй мөрийг буулгах чадвартай (интернет хайлтаар худал ишлэлийн гарал үүслийг илрүүлсэн дээрх жишээнүүдийн адил, гэхдээ программчлагдсан болон автоматжуулсан семантик арга зүй). Тодруулбал, Facebook-ийн БАРТ Автомат кодлогчийн загварыг эвдэрсэн өгүүлбэрийг гаргахад ашигладаг.

Шошгоны даалгавар.
Өндөр түвшний NLP загваруудын нийтлэг хувилбарт боломжгүй байдаг хий үзэгдэлийг эх сурвалж руу буцаах үйл явц нь "засварлах зай"-ыг зураглах боломжийг олгодог бөгөөд хий үзэгдэлтэй агуулгыг тодорхойлох алгоритмын хандлагыг хөнгөвчилдөг.
Судлаачид сургалтын явцад олж авсан лавлах материалд хандах боломжгүй үед систем нь ерөнхийлөн сайн дүгнэж чаддаг болохыг тогтоожээ. Энэ нь үзэл баримтлалын загвар нь зөв бөгөөд өргөн хүрээнд давтагдах боломжтой болохыг харуулж байна.
Хэт тааруулахтай тэмцэх
Хэт тааруулахаас сэргийлж, өргөнөөр ашиглах боломжтой архитектурт хүрэхийн тулд судлаачид процессоос токенуудыг санамсаргүй байдлаар хаяж, мөн үг хэллэг болон бусад дуу чимээний функцуудыг ашигласан.
Машины орчуулга (MT) нь мөн энэ төөрөгдүүлэх үйл явцын нэг хэсэг юм, учир нь текстийг хэлээр орчуулах нь утгыг найдвартай хадгалж, хэт зохицохоос сэргийлдэг. Тиймээс хий үзэгдэлийг орчуулж, төслийн хувьд хоёр хэлээр ярьдаг хүмүүс гарын авлагын тэмдэглэгээний давхаргад тодорхойлсон.
Энэхүү санаачлага нь хэд хэдэн стандарт салбарын туршилтуудад шинэ шилдэг үр дүнд хүрсэн бөгөөд 10 саяас дээш тооны жетон ашиглан хүлээн зөвшөөрөгдөхүйц үр дүнд хүрсэн анхных юм.
гэсэн гарчигтай төслийн код Нөхцөлт мэдрэлийн дараалал үүсгэх явцад хий үзэгдэлтэй контентыг илрүүлэх, болоод өнгөрсөн GitHub дээр гарсан, мөн хэрэглэгчдэд ямар ч текстээс BART ашиглан өөрсдийн синтетик өгөгдлийг үүсгэх боломжийг олгодог. Мөн галлюцинация илрүүлэх дараагийн загваруудыг бий болгохоор тусгасан.