Хиймэл оюун

Уламжлалт машин сурах нь хамааралтай хэвээр байна уу?

Нийтэлсэн

6 сарын өмнө

Арваннэгдүгээр 6, 2023

Уламжлалт машин сурах нь хамааралтай хэвээр байна уу?

Сүүлийн жилүүдэд Generative AI нь хиймэл оюун ухааны нарийн төвөгтэй даалгавруудыг шийдвэрлэхэд ирээдүйтэй үр дүнг харуулсан. Орчин үеийн AI загваруудад дуртай GPT чат, Бард, Дуудлага, DALL-E.3Болон Сам харааны асуултын хариулт, сегментчилэл, үндэслэл, агуулга үүсгэх зэрэг олон талт асуудлыг шийдвэрлэх гайхалтай чадварыг харуулсан.

Түүнээс гадна, Multimodal AI Текст, зураг, аудио, видео зэрэг олон өгөгдлийн горимыг боловсруулах чадвартай техникүүд бий болсон. Эдгээр дэвшлийн ачаар бид төгсгөлд нь ойртож байна уу гэж гайхах нь зүйн хэрэг уламжлалт машин сургалт (ML)?

Энэ нийтлэлд бид орчин үеийн хиймэл оюун ухааны инновацийн талаархи уламжлалт машин сургалтын ландшафтын төлөв байдлыг авч үзэх болно.

Уламжлалт машин сургалт гэж юу вэ? -Түүний хязгаарлалт юу вэ?

Уламжлалт машин сургалт гэдэг нь үндсэндээ статистикт тулгуурласан олон төрлийн алгоритмуудыг хамарсан өргөн нэр томъёо юм. Уламжлалт ML алгоритмын үндсэн хоёр төрөл нь хяналттай, хараа хяналтгүй. Эдгээр алгоритмууд нь бүтэцлэгдсэн өгөгдлийн багцаас загвар боловсруулахад зориулагдсан.

Стандарт уламжлалт машин сургалтын алгоритмууд нь:

Шугаман, lasso, ridge зэрэг регрессийн алгоритмууд.
K- бөөгнөрөл гэсэн үг.
Үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ (PCA).
Вектор машинуудыг (SVM) дэмжих.
Шийдвэрлэх мод, санамсаргүй ой гэх мэт модонд суурилсан алгоритмууд.
Өсгөх загварууд, тухайлбал градиент нэмэгдүүлэх болон XGBoost.

Уламжлалт машин сургалтын хязгаарлалтууд

Уламжлалт ML нь дараахь хязгаарлалттай байдаг.

Хязгаарлагдмал өргөтгөх чадвар: Эдгээр загварууд нь ихэвчлэн том, олон төрлийн өгөгдлийн багцыг өргөжүүлэхэд тусламж хэрэгтэй байдаг.
Өгөгдлийн урьдчилсан боловсруулалт ба онцлог инженерчлэл: Уламжлалт ML нь загварын шаардлагын дагуу өгөгдлийн багцыг өөрчлөхийн тулд өргөн хэмжээний урьдчилсан боловсруулалтыг шаарддаг. Түүнчлэн, функцын инженерчлэл нь цаг хугацаа их шаарддаг бөгөөд өгөгдлийн функцүүдийн хоорондын нарийн төвөгтэй харилцааг олж авахын тулд олон давталт шаарддаг.
Өндөр хэмжээст ба бүтэцгүй өгөгдөл: Уламжлалт ML нь зураг, аудио, видео, баримт бичиг гэх мэт нарийн төвөгтэй мэдээллийн төрлүүдтэй тэмцдэг.
Үл үзэгдэх өгөгдөлд дасан зохицох чадвар: Эдгээр загварууд нь тэдний нэг хэсэг биш байсан бодит өгөгдөлд сайн дасан зохицохгүй байж магадгүй юм сургалтын өгөгдөл.

Мэдрэлийн сүлжээ: Машины сургалтаас гүн гүнзгий суралцах ба цааш нь шилжих

Мэдрэлийн сүлжээний (NN) загварууд нь уламжлалт Machine Learning загваруудаас хамаагүй илүү төвөгтэй байдаг. Хамгийн энгийн NN - Олон давхаргат перцептрон (MLP) Хүний тархи хэрхэн ажилладагтай адил мэдээллийг ойлгож, даалгавруудыг гүйцэтгэхийн тулд хоорондоо холбогдсон хэд хэдэн мэдрэлийн эсүүдээс бүрддэг.

Мэдрэлийн сүлжээний техник технологийн дэвшил нь түүнээс шилжих суурь болсон машин суралцахаас гүнзгий суралцах. Жишээлбэл, компьютерийн харааны ажилд (объект илрүүлэх, дүрсийг сегментчлэх) ашигладаг NN гэж нэрлэдэг Convolutional Neural Networks (CNNs)Зэрэг AlexNet, ResNetБолон YOLO.

Өнөөдөр хиймэл хиймэл оюун ухааны технологи нь мэдрэлийн сүлжээний техникийг нэг алхам урагшлуулж, төрөл бүрийн хиймэл оюун ухааны салбарт амжилт гаргах боломжийг олгож байна. Жишээлбэл, байгалийн хэлийг боловсруулахад ашигладаг мэдрэлийн сүлжээг (текстийн хураангуй, асуултын хариулт, орчуулга гэх мэт) гэж нэрлэдэг. трансформаторууд. Трансформаторын алдартай загварууд орно БЕРТ, GPT-4Болон T5. Эдгээр загварууд нь эрүүл мэнд, жижиглэнгийн худалдаа, маркетинг, санхүүГэх мэт

Бидэнд уламжлалт машин сургалтын алгоритмууд хэрэгтэй хэвээр байна уу?

Мэдрэлийн сүлжээнүүд болон тэдгээрийн трансформаторууд гэх мэт орчин үеийн хувилбарууд нь ихээхэн анхаарал татаж байгаа ч уламжлалт ML аргууд чухал хэвээр байна. Тэд яагаад хамааралтай хэвээр байгааг харцгаая.

1. Өгөгдлийн илүү энгийн шаардлага

Мэдрэлийн сүлжээ нь сургалтанд том өгөгдлийн багц шаарддаг бол ML загварууд нь жижиг, энгийн мэдээллийн багцаар мэдэгдэхүйц үр дүнд хүрч чадна. Тиймээс ML нь жижиг бүтэцтэй өгөгдлийн багцуудад гүнзгий суралцахаас илүү давуу талтай ба эсрэгээр.

2. Энгийн байдал, тайлбарлах боломжтой байдал

Уламжлалт машин сургалтын загварууд нь илүү энгийн статистик болон магадлалын загварууд дээр суурилдаг. Жишээлбэл, хамгийн сайн тохирох шугам шугаман регресс статистикийн үйлдэл болох хамгийн бага квадратын аргыг ашиглан оролт-гаралтын хамаарлыг тогтооно.

Үүний нэгэн адил шийдвэрийн мод нь өгөгдлийг ангилахдаа магадлалын зарчмуудыг ашигладаг. Ийм зарчмуудыг ашиглах нь тайлбарлах боломжийг олгодог бөгөөд хиймэл оюун ухааны дадлагажигчдад ML алгоритмуудын үйл ажиллагааг ойлгоход хялбар болгодог.

Орчин үеийн NN архитектурууд нь трансформатор ба диффузийн загварууд (ихэвчлэн зураг үүсгэхэд ашиглагддаг Тогтвортой тархалт or Замын дунд) олон давхаргат сүлжээний цогц бүтэцтэй байх. Ийм сүлжээг ойлгохын тулд математикийн дэвшилтэт ойлголтуудыг ойлгох шаардлагатай. Тийм ч учраас тэднийг "Хар хайрцаг" гэж нэрлэдэг.

3. Нөөцийн үр ашиг

Том хэлний загвар (LLM) гэх мэт орчин үеийн мэдрэлийн сүлжээг тооцоолох шаардлагад нийцүүлэн үнэтэй GPU-ийн кластерууд дээр сургадаг. Жишээлбэл, GPT4 дээр бэлтгэл хийсэн гэж мэдээлсэн 25000 Nvidia GPU 90-100 хоногийн турш.

Гэсэн хэдий ч үнэтэй техник хангамж, урт хугацааны сургалтын хугацаа нь дадлагажигч эсвэл хиймэл оюун ухааны багийн хувьд боломжгүй юм. Нөгөөтэйгүүр, уламжлалт машин сургалтын алгоритмуудын тооцооллын үр ашиг нь дадлагажигчдад хязгаарлагдмал нөөцтэй байсан ч чухал үр дүнд хүрэх боломжийг олгодог.

4. Бүх асуудалд гүн гүнзгий суралцах шаардлагагүй

Гүн сурах бүх асуудлыг шийдэх туйлын шийдэл биш юм. ML нь гүнзгий суралцахаас давсан зарим хувилбарууд байдаг.

Жишээ нь: эмнэлгийн оношлогоо, прогноз хязгаарлагдмал өгөгдөлтэй, ML алгоритм аномали илрүүлэх REMED нь гүнзгий суралцахаас илүү сайн үр дүнг өгдөг. Үүний нэгэн адил, уламжлалт машин сургалт нь тооцоолох чадвар багатай хувилбаруудад чухал ач холбогдолтой уян хатан, үр дүнтэй шийдэл.

Юуны өмнө аливаа асуудалд хамгийн сайн загварыг сонгох нь тухайн байгууллага эсвэл эмчийн хэрэгцээ, тулгарч буй асуудлын мөн чанараас хамаарна.

2023 онд машин сургалт

Зургийг ашиглан үүсгэсэн Леонардо AI

2023 онд уламжлалт машин сургалт улам бүр хөгжиж, гүнзгий суралцах, бий болгох хиймэл оюун ухаантай өрсөлдөж байна. Энэ нь салбарт, ялангуяа бүтэцлэгдсэн өгөгдлийн багцтай ажиллахад хэд хэдэн хэрэглээтэй.

Жишээлбэл, олон Хурдан гүйдэг хэрэглээний бараа (FMCG) компаниуд хувийн болгосон бүтээгдэхүүний зөвлөмж, үнийг оновчтой болгох, бараа материалын менежмент, нийлүүлэлтийн сүлжээг оновчтой болгох зэрэг чухал ажлуудад ML алгоритм дээр тулгуурласан хүснэгтэн мэдээллийн дийлэнх хэсгийг боловсруулдаг.

Цаашлаад олон алсын хараа, хэлний загварууд нь уламжлалт техник дээр суурилсан хэвээр байгаа бөгөөд эрлийз арга барил, шинээр гарч ирж буй хэрэглээнд шийдэл санал болгодог. Жишээлбэл, саяхан хийсэн судалгаанд "Бидэнд цаг хугацааны цуврал урьдчилан таамаглахад гүн гүнзгий суралцах загварууд үнэхээр хэрэгтэй байна уу?” нь градиентийг нэмэгдүүлэх регрессийн мод (GBRT) хэрхэн илүү үр дүнтэй болохыг хэлэлцсэн. хугацааны цувралын таамаглал гүн мэдрэлийн сүлжээнээс илүү.

ML-ийн тайлбарлах чадвар нь зэрэг техникүүдийн хувьд маш үнэ цэнэтэй хэвээр байна SHAP (Шэйплийн нэмэлт тайлбарууд) болон Лайм (Орон нутгийн тайлбарлах загвар-агностик тайлбар). Эдгээр аргууд нь ML-ийн нарийн төвөгтэй загваруудыг тайлбарлаж, тэдгээрийн таамаглалын талаархи ойлголтыг өгдөг бөгөөд ингэснээр ML дадлагажигчдад загвараа илүү сайн ойлгоход тусалдаг.

Эцэст нь уламжлалт машин сургалт нь өргөтгөх чадвар, өгөгдлийн нарийн төвөгтэй байдал, нөөцийн хязгаарлалт зэрэг олон салбаруудад зориулсан бат бөх шийдэл хэвээр байна. Эдгээр алгоритмууд нь өгөгдөлд дүн шинжилгээ хийх, урьдчилан таамаглах загварчлалд орлуулашгүй бөгөөд мэдээлэл судлаачийн зэвсэг.

Иймэрхүү сэдвүүд таны сонирхлыг татаж байвал судлаарай AI-г нэгтгэ нэмэлт ойлголт авахын тулд.