stub Хяналттай ба Хяналтгүй сургалт - Unite.AI
бидэнтэй хамт холбоно
AI мастер анги:

AI 101

Хяналттай болон хяналтгүй сургалт

mm
шинэчлэгдсэн on

Машин сургалтын хувьд ихэнх ажлыг хяналттай сургалтын асуудал эсвэл хяналтгүй сургалтын асуудал гэсэн хоёр өөр ангийн аль нэгэнд хялбархан ангилж болно. Хяналттай сургалтын хувьд өгөгдөлд шошго эсвэл анги хавсаргасан байдаг бол хараа хяналтгүй суралцах тохиолдолд өгөгдөл нь шошгогүй байдаг. Энэ ялгаа нь яагаад чухал болохыг сайтар судалж, сургалтын төрөл бүртэй холбоотой зарим алгоритмуудыг авч үзье.

Хяналттай болон хяналтгүй сургалт

Ихэнх машин сургалтын ажлууд нь домэйнд байдаг хяналттай суралцах. Хяналттай сургалтын алгоритмуудад өгөгдлийн багц дахь бие даасан тохиолдлууд/өгөгдлийн цэгүүд нь анги эсвэл шошготой байдаг. Энэ нь машин сургалтын загвар нь тухайн ангитай ямар шинж чанарууд хамааралтай болохыг ялгаж сурах боломжтой гэсэн үг бөгөөд машин сургалтын инженер хэр олон тохиолдлыг зөв ангилсан болохыг харж, загварын гүйцэтгэлийг шалгаж чадна гэсэн үг юм. Өгөгдлийг зохих ангиудаар тэмдэглэсэн тохиолдолд олон нарийн төвөгтэй хэв маягийг ялгахын тулд ангиллын алгоритмуудыг ашиглаж болно. Жишээлбэл, машин сургалтын алгоритм нь "сахал", "сүүл", "сарвуу" гэх мэт шинж чанарт үндэслэн өөр өөр амьтдыг бие биенээсээ ялгаж сурах боломжтой.

Хяналттай сургалтаас ялгаатай, хяналтгүй суралцах нь шошгогүй өгөгдлөөс хэв маягийг гаргаж авах чадвартай загварыг бий болгох явдал юм. Өөрөөр хэлбэл, компьютер оролтын шинж чанаруудад дүн шинжилгээ хийж, хамгийн чухал шинж чанар, хэв маяг нь юу болохыг өөрөө тодорхойлдог. Хяналтгүй сургалт нь янз бүрийн тохиолдлуудын хоорондын ижил төстэй байдлыг олохыг оролддог. Хэрэв хяналттай сургалтын алгоритм нь өгөгдлийн цэгүүдийг мэдэгдэж буй ангиудад байрлуулахыг зорьдог бол хяналтгүй сургалтын алгоритмууд нь объектын тохиолдлуудад нийтлэг шинж чанаруудыг судалж, эдгээр шинж чанарууд дээр үндэслэн тэдгээрийг бүлэг болгон байрлуулж, үндсэндээ өөрийн ангиудыг бий болгоно.

Хяналттай сургалтын алгоритмуудын жишээ нь Шугаман регресс, логистик регресс, K-хамгийн ойрын хөршүүд, шийдвэрийн мод, дэмжлэгийн вектор машинууд юм.

Үүний зэрэгцээ, хяналтгүй сургалтын алгоритмуудын зарим жишээ нь Үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ ба K-Means Clustering юм.

Хяналттай сургалтын алгоритм

Шугаман регресс нь хоёр шинж чанарыг авч тэдгээрийн хоорондын хамаарлыг харуулсан алгоритм юм. Шугаман регрессийг бусад тоон хувьсагчтай холбоотой тоон утгыг таамаглахад ашигладаг. Шугаман регресс нь Y = a +bX тэгшитгэлтэй бөгөөд b нь шугамын налуу, а нь X тэнхлэгийг гаталж буй газар юм.

Логистик регресс нь хоёртын ангиллын алгоритм юм. Алгоритм нь тоон шинж чанаруудын хоорондын хамаарлыг судалж, жишээг хоёр өөр ангийн аль нэгэнд ангилах магадлалыг олдог. Магадлалын утгууд нь 0 эсвэл 1-ийн аль нэг рүү "шахагдсан". Өөрөөр хэлбэл, хүчтэй магадлал 0.99, сул магадлал 0-д ойртох болно.

K-хамгийн ойрын хөршүүд сургалтын багц дахь зарим сонгосон хөршүүдийн оноогдсон ангиудад үндэслэн шинэ өгөгдлийн цэгүүдэд анги оноодог. Алгоритмоор авч үзсэн хөршүүдийн тоо чухал бөгөөд хэтэрхий цөөн эсвэл хэт олон хөршүүд оноог буруу ангилж болно.

Шийдвэр гаргах мод нь ангилал ба регрессийн алгоритмын нэг төрөл юм. Шийдвэрлэх мод нь өгөгдлийн багцыг жижиг, жижиг хэсгүүдэд хуваах замаар дэд олонлогуудыг цаашид хувааж болохгүй ба үр дүнд нь зангилаа, навчтай мод гарч ирдэг. Зангилаанууд нь өгөгдлийн цэгүүдийн талаарх шийдвэрийг янз бүрийн шүүлтүүрийн шалгуураар гаргадаг бол навчнууд нь ямар нэгэн шошго (ангилсан өгөгдлийн цэг) өгсөн тохиолдлууд юм. Шийдвэрийн модны алгоритмууд нь тоон болон категорийн өгөгдлийг хоёуланг нь зохицуулах чадвартай. Тодорхой хувьсагч/онцлогууд дээр модонд хуваалт хийдэг.

Вектор машиныг дэмжих нь өгөгдлийн цэгүүдийн хооронд гипер хавтгай буюу тусгаарлах шугам зурах замаар ажилладаг ангиллын алгоритм юм. Өгөгдлийн цэгүүд нь гипер хавтгайн аль талд байрлаж байгаагаас хамааран ангиудад хуваагдана. Хавтгайд хэд хэдэн гиперпланг зурж, мэдээллийн багцыг олон ангилалд хувааж болно. Ангилагч нь шумбах гиперплан болон онгоцны хоёр тал дахь цэгүүдийн хоорондох зайг хамгийн их байлгахыг хичээх бөгөөд шугам ба цэгийн хоорондох зай их байх тусам ангилагч илүү итгэлтэй болно.

Хяналтгүй сургалтын алгоритмууд

Үндсэн бүрэлдэхүүн хэсгийн шинжилгээ хэмжигдэхүүнийг багасгахад ашигладаг арга бөгөөд өгөгдлийн хэмжээст байдал эсвэл нарийн төвөгтэй байдлыг илүү энгийн байдлаар илэрхийлдэг. Үндсэн бүрэлдэхүүн хэсгийн шинжилгээний алгоритм нь ортогональ өгөгдлийн шинэ хэмжигдэхүүнүүдийг олдог. Өгөгдлийн хэмжээсийг багасгахын зэрэгцээ өгөгдлийн хоорондын зөрүүг аль болох хадгалах хэрэгтэй. Энэ нь практик утгаараа юу гэсэн үг вэ гэвэл энэ нь өгөгдлийн багц дахь функцуудыг авч, ихэнх өгөгдлийн төлөөлдөг цөөн тооны шинж чанар болгон задалдаг гэсэн үг юм.

K-бүлэглэх гэсэн үг нь ижил төстэй шинж чанарт үндэслэн өгөгдлийн цэгүүдийг автоматаар кластер болгон бүлэглэдэг алгоритм юм. Өгөгдлийн багц дахь хэв маягт дүн шинжилгээ хийж, өгөгдлийн цэгүүдийг эдгээр загварт үндэслэн бүлэг болгон хуваадаг. Үндсэндээ K-means нь шошгогүй өгөгдлөөр өөрийн ангиудыг үүсгэдэг. K-Means алгоритм нь кластерууд буюу центроидуудад төвүүдийг хуваарилж, төвүүдийн оновчтой байрлалыг олох хүртэл төвүүдийг хөдөлгөх замаар ажилладаг. Хамгийн оновчтой байрлал нь анги доторх центроидуудын хоорондох зайг тойрсон өгөгдлийн цэгүүдийн хоорондох зай байх болно. K-бүлэглэл дэх "K" нь хэдэн центроид сонгогдсоныг илэрхийлнэ.

Дүгнэлт

Хаахын тулд тэдгээрийн хоорондох гол ялгааг хурдан авч үзье хяналттай болон хяналтгүй суралцах.

Бид өмнө нь ярилцсанчлан хяналттай сургалтын даалгавруудад оролтын өгөгдлийг шошголож, ангиудын тоог мэддэг. Үүний зэрэгцээ, оролтын өгөгдөл нь шошгогүй бөгөөд хяналтгүй сургалтын тохиолдлуудад ангийн тоо тодорхойгүй байна. Хяналтгүй суралцах нь тооцоолоход төвөгтэй байх хандлагатай байдаг бол хяналттай сургалт нь тооцоолоход илүү төвөгтэй байдаг. Хяналттай сургалтын үр дүн өндөр нарийвчлалтай байх хандлагатай байдаг бол хяналтгүй сургалтын үр дүн бага нарийвчлалтай/дунд зэргийн нарийвчлалтай байдаг.

Мэргэшсэн блоггер, программист Машины сургалт болон Гүн сурах сэдвүүд. Даниел бусад хүмүүст хиймэл оюун ухааны хүчийг нийгмийн сайн сайхны төлөө ашиглахад тусална гэж найдаж байна.