AI 101

Машин сурах гэж юу вэ?

шинэчлэгдсэн on Наймдугаар сарын 23, 2020

Машины сургалт нь хамгийн хурдацтай хөгжиж буй технологийн салбаруудын нэг боловч "машины сургалт" гэсэн үгсийг хэчнээн олон удаа хаядаг ч машин сургалт гэж юу болохыг ойлгоход хэцүү байдаг.

Машины сургалт гэдэг нь зөвхөн нэг зүйлд хамаарахгүй бөгөөд энэ нь олон янзын ойлголт, арга техникт хэрэглэж болох дээвэр нэр томъёо юм. Машины сургалтын талаар ойлгох нь загварын дүн шинжилгээ, хувьсагч, алгоритмын янз бүрийн хэлбэрийг мэддэг байхыг хэлнэ. Энэ нь юуг хамарч байгааг илүү сайн ойлгохын тулд машин сургалтыг нарийвчлан авч үзье.

Машины сургалт гэж юу вэ?

Машин сурах гэдэг нэр томъёог олон янзын зүйлд хэрэглэж болох боловч ерөнхийдөө энэ нэр томьёо нь компьютерт тодорхой зааварчилгаа авалгүйгээр даалгавруудыг гүйцэтгэх боломжийг олгодог. Компьютер нь өгөгдөл доторх хэв маягт дүн шинжилгээ хийж, эдгээр хэв маягийг шинэ өгөгдөлд нэгтгэх замаар "сурах" чадвартай тул машин сургалтын мэргэжилтэн асуудлыг шийдвэрлэхэд шаардлагатай бүх алхмуудыг бичих шаардлагагүй.

Машин сургалтын систем нь гурван үндсэн хэсгээс бүрдэнэ.

орц
Алгоритмууд
Гарц бүтээгдэхүүн

Оролтууд нь машин сургалтын системд тэжээгддэг өгөгдөл бөгөөд оролтын өгөгдлийг шошго, онцлогт хувааж болно. Онцлогууд нь холбогдох хувьсагчууд, хэв маягийг сурч, дүгнэлт гаргахын тулд дүн шинжилгээ хийх хувьсагч юм. Үүний зэрэгцээ шошго нь өгөгдлийн бие даасан тохиолдлуудад өгөгдсөн анги/тайлбар юм.

Онцлог болон шошгыг хяналттай суралцах ба хяналтгүй суралцах гэсэн хоёр өөр төрлийн машин сургалтын асуудалд ашиглаж болно.

Хяналтгүй сургалтын эсрэг

In хяналт тавьж сурах, оролтын өгөгдөл нь үндсэн үнэн дагалддаг. Хяналттай сургалтын асуудлууд нь өгөгдлийн багцын нэг хэсэг болох зөв гаралтын утгыг агуулдаг тул хүлээгдэж буй ангиудыг урьдчилан мэддэг. Энэ нь өгөгдөл судлаачдад туршилтын өгөгдлийн багц дээрх өгөгдлийг туршиж, хэдэн хувь нь зөв ангилагдсаныг харах замаар алгоритмын гүйцэтгэлийг шалгах боломжтой болгодог.

Үүний эсрэгээр, хяналтгүй суралцах асуудлуудад үндсэн үнэний шошго хавсаргадаггүй. Хяналтгүй сургалтын даалгавруудыг гүйцэтгэхээр бэлтгэгдсэн машин сургалтын алгоритм нь өгөгдөл дэх холбогдох хэв маягийг өөртөө дүгнэлт хийх чадвартай байх ёстой.

Хяналттай сургалтын алгоритмуудыг ихэвчлэн ангиллын асуудалд ашигладаг бөгөөд үүнд олон төрлийн ангиудын аль нэгэнд ангилах шаардлагатай жишээнүүдээр дүүрсэн том өгөгдлийн багц байдаг. Хяналттай сургалтын өөр нэг төрөл бол регрессийн даалгавар бөгөөд алгоритмын гаралтын утга нь ангиллын оронд тасралтгүй шинж чанартай байдаг.

Үүний зэрэгцээ хяналтгүй сургалтын алгоритмуудыг нягтралын тооцоолол, бөөгнөрөл, дүрслэлд суралцах зэрэг ажлуудад ашигладаг. Эдгээр гурван даалгаварт өгөгдлийн бүтцийг гаргахын тулд машин сургалтын загвар шаардлагатай бөгөөд загварт урьдчилан тодорхойлсон ангиуд байхгүй.

Хяналтгүй сургалт болон хяналттай сургалтын аль алинд хэрэглэгддэг хамгийн түгээмэл алгоритмуудын заримыг товчхон авч үзье.

Хяналттай сургалтын төрлүүд

Хяналттай сургалтын нийтлэг алгоритмууд нь:

Гэнэн Байес
Вектор машиныг дэмжих
Логистик регресс
Санамсаргүй ой
Хиймэл мэдрэлийн сүлжээ

Вектор машиныг дэмжих өгөгдлийн багцыг өөр өөр ангилалд хуваах алгоритмууд юм. Өгөгдлийн цэгүүд нь ангиудыг бие биенээсээ тусгаарлах шугамаар кластерт хуваагддаг. Шугамын нэг талд олсон цэгүүд нэг ангилалд хамаарах бол нөгөө талд байгаа цэгүүд өөр ангилалд хамаарна. Дэмжлэгийн вектор машинууд нь шугам ба шугамын хоёр талд байрлах цэгүүдийн хоорондох зайг хамгийн их байлгахыг зорьдог бөгөөд хол байх тусам ангилагч нь тухайн цэг нь нэг ангид хамаарахгүй, нөгөө ангид хамаарахгүй гэдэгт илүү итгэлтэй байх болно.

Логистик регресс нь өгөгдлийн цэгүүдийг хоёр ангиллын аль нэгэнд хамаарах гэж ангилах шаардлагатай үед хоёртын ангиллын даалгаварт хэрэглэгддэг алгоритм юм. Логистик регресс нь өгөгдлийн цэгийг 1 эсвэл 0 гэж тэмдэглэснээр ажилладаг. Хэрэв өгөгдлийн цэгийн хүлээн зөвшөөрөгдсөн утга 0.49 ба түүнээс доош байвал 0, 0.5 ба түүнээс дээш бол 1 гэж ангилдаг.

Шийдвэрийн модны алгоритмууд өгөгдлийн багцыг жижиг, жижиг хэсгүүдэд хуваах замаар ажилладаг. Өгөгдлийг хуваахад ашигладаг шалгуур нь машин сургалтын инженерээс хамаарна, гэхдээ зорилго нь эцсийн эцэст өгөгдлийг нэг өгөгдлийн цэг болгон хуваах бөгөөд дараа нь түлхүүр ашиглан ангилах болно.

Санамсаргүй ойн алгоритм нь үндсэндээ илүү хүчирхэг ангилагч болгон өөр хоорондоо холбогдсон Шийдвэрийн модны олон ангилагч юм.

The Naive Bayes ангилагч Өмнөх үйл явдлын магадлалд үндэслэн тухайн өгөгдлийн цэг тохиолдсон байх магадлалыг тооцдог. Энэ нь Бэйсийн теорем дээр үндэслэсэн бөгөөд өгөгдлийн цэгүүдийг тооцоолсон магадлалд үндэслэн ангилдаг. Naive Bayes ангилагчийг хэрэгжүүлэхдээ бүх таамаглагчид ангийн үр дүнд ижил нөлөө үзүүлдэг гэж үздэг.

An Хиймэл мэдрэлийн сүлжээ, эсвэл олон давхаргат перцептрон нь хүний тархины бүтэц, үйл ажиллагаанаас сэдэвлэсэн машин сургалтын алгоритмууд юм. Хиймэл мэдрэлийн сүлжээ нь хоорондоо холбогдсон олон зангилаа/нейронуудаас бүрддэг тул нэрээ авсан. Нейрон бүр өгөгдлийг математик функцээр удирддаг. Хиймэл мэдрэлийн сүлжээнд оролтын давхарга, далд давхарга, гаралтын давхаргууд байдаг.

Мэдрэлийн сүлжээний далд давхарга нь өгөгдлийг бодитоор тайлбарлаж, загварт дүн шинжилгээ хийдэг газар юм. Өөрөөр хэлбэл, алгоритм сурдаг газар юм. Илүү олон мэдрэлийн эсүүд нэгдэж, илүү нарийн төвөгтэй хэв маягийг сурах чадвартай илүү нарийн төвөгтэй сүлжээг бий болгодог.

Хяналтгүй сургалтын төрлүүд

Хяналтгүй сургалтын алгоритмууд нь:

К-нь бөөгнөрөх гэсэн утгатай
Автомат кодлогч
Үндсэн бүрэлдэхүүн хэсгийн шинжилгээ

К-нь бөөгнөрөх гэсэн утгатай нь хяналтгүй ангилах арга бөгөөд өгөгдлийн цэгүүдийг шинж чанарт нь үндэслэн кластер эсвэл бүлэгт хуваах замаар ажилладаг. K- гэсэн үг кластерчлал нь өгөгдлийн цэгүүдээс олдсон шинж чанаруудад дүн шинжилгээ хийж, тухайн ангийн кластерт байгаа өгөгдлийн цэгүүдийг бусад өгөгдлийн цэгүүдийг агуулсан кластеруудтай харьцуулахад өөр хоорондоо илүү төстэй болгодог хэв маягийг ялгадаг. Энэ нь өгөгдлийн графикт кластер буюу центроидуудын боломжит төвүүдийг байрлуулж, центроид болон тухайн төвийн ангид хамаарах цэгүүдийн хоорондох зайг багасгах байрлалыг олох хүртэл төвийн байрлалыг дахин хуваарилах замаар хийгддэг. Судлаач хүссэн кластерын тоог зааж өгч болно.

Үндсэн бүрэлдэхүүн хэсгийн шинжилгээ Энэ нь олон тооны функц/хувьсагчийг жижиг функцийн орон зай/цөөн функц болгон бууруулсан техник юм. Мэдээллийн цэгүүдийн "үндсэн бүрэлдэхүүн хэсгүүдийг" хадгалахаар сонгосон бол бусад шинж чанаруудыг жижиг дүрслэл болгон шахаж авдаг. Анхны өгөгдлийн бэлдмэлүүдийн хоорондын хамаарал хадгалагдан үлдсэн боловч өгөгдлийн цэгүүдийн нарийн төвөгтэй байдал нь илүү хялбар байдаг тул өгөгдлийг тоолж, дүрслэх нь илүү хялбар байдаг.

Автомат кодлогч нь хяналтгүй сургалтын даалгаварт хэрэглэж болох мэдрэлийн сүлжээний хувилбарууд юм. Автомат кодлогч нь шошгогүй, чөлөөт хэлбэрийн өгөгдлийг авч, тэдгээрийг мэдрэлийн сүлжээ ашиглах боломжтой өгөгдөл болгон хувиргах чадвартай бөгөөд үндсэндээ өөрсдийн шошготой сургалтын өгөгдлийг бий болгодог. Автомат кодлогчийн зорилго нь оролтын өгөгдлийг хөрвүүлэх, аль болох нарийвчлалтай дахин бүтээх явдал тул аль онцлог нь хамгийн чухал болохыг тодорхойлж, тэдгээрийг гаргаж авах нь сүлжээний урам зориг юм.

Холбогдох сэдвүүд:101

Дараа хүртэл

Гүнзгий суралцах гэж юу вэ?

Даниел Нельсон

Мэргэшсэн блоггер, программист Машины сургалт болон Гүн сурах сэдвүүд. Даниел бусад хүмүүст хиймэл оюун ухааны хүчийг нийгмийн сайн сайхны төлөө ашиглахад тусална гэж найдаж байна.

Unite.AI

Машин сурах гэж юу вэ?

AI 101

Машин сурах гэж юу вэ?

Агуулгын хүснэгт

Машины сургалт гэж юу вэ?

Хяналтгүй сургалтын эсрэг

Хяналттай сургалтын төрлүүд

Хяналтгүй сургалтын төрлүүд

Unite.AI

Машин сурах гэж юу вэ?

Агуулгын хүснэгт

Машины сургалт гэж юу вэ?

Хяналтгүй сургалтын эсрэг

Хяналттай сургалтын төрлүүд

Хяналтгүй сургалтын төрлүүд

Та хүсч болно