stub Шийдвэрийн мод гэж юу вэ? - Нэгдсэн.AI
бидэнтэй хамт холбоно
AI мастер анги:

AI 101

Шийдвэрийн мод гэж юу вэ?

mm
шинэчлэгдсэн on

Шийдвэрийн мод гэж юу вэ?

A шийдвэрийн мод нь регресс болон ангиллын ажлуудад ашиглагддаг ашигтай машин сургалтын алгоритм юм. "Шийдвэрийн мод" гэсэн нэр нь алгоритм нь өгөгдлийн багцыг дан ганц тохиолдлоор хувааж, дараа нь ангилах хүртэл өгөгдлийн багцыг жижиг, жижиг хэсгүүдэд хуваадагтай холбоотой юм. Хэрэв та алгоритмын үр дүнг төсөөлөх юм бол ангиллыг хуваах арга нь мод, олон навчтай төстэй байх болно.

Энэ бол шийдвэрийн модны товч тодорхойлолт боловч шийдвэрийн мод хэрхэн ажилладаг талаар гүнзгий судалцгаая. Шийдвэрийн мод хэрхэн ажилладаг, тэдгээрийн хэрэглээний тохиолдлуудын талаар илүү сайн ойлголттой байх нь машин сургалтын төслийн явцад тэдгээрийг хэзээ ашиглах талаар мэдэхэд тусална.

Шийдвэрийн модны формат

Шийдвэрийн мод гэдэг урсгал диаграмтай их төстэй. Урсгал диаграммыг ашиглахын тулд та диаграмын эхлэл цэгээс буюу эх цэгээс эхэлж, дараа нь тухайн эхлэлийн зангилааны шүүлтүүрийн шалгуурт хэрхэн хариулсаны үндсэн дээр дараагийн боломжит цэгүүдийн аль нэгэнд шилжинэ. Энэ үйл явц нь төгсгөлд хүрэх хүртэл давтана.

Шийдвэрийн мод нь үндсэндээ ижил зарчмаар ажилладаг бөгөөд модны дотоод зангилаа бүр нь зарим төрлийн туршилт/шүүлтийн шалгуур болдог. Гадна талын зангилаа, модны төгсгөлийн цэгүүд нь тухайн мэдээллийн цэгийн шошго бөгөөд тэдгээрийг "навч" гэж нэрлэдэг. Дотоод зангилаанаас дараагийн зангилаа руу хөтөлдөг салбарууд нь онцлог шинж чанарууд эсвэл шинж чанаруудын холболтууд юм. Өгөгдлийн цэгүүдийг ангилахад ашигладаг дүрмүүд нь үндэснээс навч хүртэлх замууд юм.

Шийдвэрийн модны алгоритмууд

Шийдвэрийн мод нь янз бүрийн шалгуурын дагуу өгөгдлийн багцыг бие даасан өгөгдлийн цэгүүдэд хуваах алгоритмын арга барил дээр ажилладаг. Эдгээр хуваалтыг өөр өөр хувьсагч эсвэл өгөгдлийн багцын өөр өөр шинж чанаруудаар хийдэг. Жишээлбэл, зорилго нь нохой, муурыг оролтын функцээр дүрсэлсэн эсэхийг тодорхойлох зорилготой бол өгөгдлийг хуваах хувьсагч нь "сарвуу", "хуцах" гэх мэт зүйл байж болно.

Тэгэхээр өгөгдлийг салбар, навч болгон хуваахад ямар алгоритмууд ашиглагддаг вэ? Модыг хуваахын тулд янз бүрийн арга хэрэглэж болох ч хамгийн түгээмэл хуваах арга нь магадгүй "гэж нэрлэдэг техник юм.рекурсив хоёртын хуваагдал”. Энэ хуваах аргыг хэрэгжүүлэх үед процесс нь үндэснээс эхэлдэг бөгөөд өгөгдлийн багц дахь боломжуудын тоо нь боломжит хуваагдлын тоог илэрхийлдэг. Боломжит хуваалт бүр хэр нарийвчлалтай байхыг тодорхойлох функцийг ашигладаг бөгөөд хамгийн бага нарийвчлалыг золиослох шалгуурыг ашиглан хуваах болно. Энэ үйл явц нь рекурсив байдлаар явагддаг бөгөөд ижил ерөнхий стратеги ашиглан дэд бүлгүүдийг үүсгэдэг.

Төлөө хуваах зардлыг тодорхойлох, зардлын функцийг ашигладаг. Регрессийн даалгавар болон ангиллын даалгаварт өөр зардлын функцийг ашигладаг. Зардлын хоёр функцийн зорилго нь аль салбар нь хамгийн төстэй хариултын утгатай, эсвэл хамгийн нэгэн төрлийн салбартай болохыг тодорхойлох явдал юм. Та тодорхой ангийн тестийн өгөгдлийг тодорхой зам дагуу байлгахыг хүсч байгаа бөгөөд энэ нь ойлгомжтой байх болно гэдгийг анхаарч үзээрэй.

Рекурсив хоёртын хуваагдлын регрессийн зардлын функцийн хувьд зардлыг тооцоолох алгоритм нь дараах байдалтай байна.

нийлбэр(y – таамаглал)^2

Тодорхой бүлгийн өгөгдлийн цэгүүдийн таамаглал нь тухайн бүлгийн сургалтын өгөгдлийн хариултуудын дундаж юм. Бүх өгөгдлийн цэгүүдийг зардлын функцээр ажиллуулж, боломжит бүх хуваалтын зардлыг тодорхойлж, хамгийн бага өртөгтэй хуваалтыг сонгоно.

Ангилах зардлын функцийн хувьд функц нь дараах байдалтай байна.

G = нийлбэр (pk * (1 – pk))

Энэ бол Жини оноо бөгөөд хуваагдлын үр дүнд бий болсон бүлгүүдэд өөр өөр ангиудын хэдэн тохиолдол байгааг үндэслэн хуваах үр дүнгийн хэмжүүр юм. Өөрөөр хэлбэл, хуваагдсаны дараа бүлгүүд хэр холилдсоныг тоон байдлаар илэрхийлдэг. Хуваалтын үр дүнд үүссэн бүх бүлгүүд зөвхөн нэг ангийн оролтоос бүрдэх үед оновчтой хуваагдал юм. Хэрэв оновчтой хуваалт үүссэн бол "pk" утга нь 0 эсвэл 1 байх ба G нь тэгтэй тэнцүү байх болно. Хоёртын ангиллын хувьд хуваагдал дахь ангиудын 50-50 төлөөлөл байгаа тохиолдолд хамгийн муу хуваагдал гэж та таамаглаж магадгүй юм. Энэ тохиолдолд "pk" утга нь 0.5, G нь мөн 0.5 байх болно.

Бүх өгөгдлийн цэгүүдийг навч болгон хувиргаж, ангилсны дараа хуваах процесс дуусна. Гэсэн хэдий ч та модны ургалтыг эрт зогсоохыг хүсч болно. Том нийлмэл моднууд нь хэт их тааралддаг боловч үүнтэй тэмцэхийн тулд хэд хэдэн өөр аргыг хэрэглэж болно. Хэт тохируулгыг багасгах нэг арга бол навч үүсгэхэд ашиглагдах өгөгдлийн цэгүүдийн хамгийн бага тоог зааж өгөх явдал юм. Хэт тохируулгатай тэмцэх өөр нэг арга бол модыг хамгийн их гүнд хязгаарлах явдал бөгөөд энэ нь үндэснээс навч хүртэлх зам хэр удаан үргэлжлэхийг хянадаг.

Шийдвэрийн модыг бий болгох өөр нэг үйл явц тайралт хийж байна. Тайрах нь загварт таамаглах чадвар багатай/загварт ач холбогдол багатай шинж чанаруудыг агуулсан мөчрүүдийг салгаснаар шийдвэрийн модны гүйцэтгэлийг нэмэгдүүлэхэд тусална. Ийм байдлаар модны нарийн төвөгтэй байдал багасч, хэт их таарах магадлал багасч, загварын урьдчилан таамаглах ашиг тус нэмэгддэг.

Тайрах үед модны орой эсвэл доод хэсгээс эхэлж болно. Гэсэн хэдий ч тайрах хамгийн хялбар арга бол навчнаас эхэлж, тэр навчны доторх хамгийн түгээмэл ангиллыг агуулсан зангилааг унагахыг оролдох явдал юм. Хэрэв үүнийг хийх үед загварын нарийвчлал буурахгүй бол өөрчлөлт хадгалагдана. Тайрахад ашигладаг бусад аргууд байдаг ч дээр дурдсан арга буюу алдааг багасгах арга нь мод тайрах хамгийн түгээмэл арга юм.

Шийдвэрийн модыг ашиглахад анхаарах зүйлс

Шийдвэр гаргах мод ихэвчлэн ашигтай байдаг ангилал хийх шаардлагатай боловч тооцоолох хугацаа нь гол хязгаарлалт болдог. Шийдвэрийн мод нь сонгосон өгөгдлийн багцын аль онцлог нь хамгийн их таамаглах хүчийг ашиглахыг тодорхой болгож чадна. Цаашилбал, өгөгдлийг ангилахад ашигладаг дүрмийг тайлбарлахад хэцүү байдаг олон машин сургалтын алгоритмуудаас ялгаатай нь шийдвэрийн мод нь тайлбарлах боломжтой дүрмийг гаргаж чаддаг. Шийдвэрийн моднууд нь ангилсан болон тасралтгүй хувьсагчдыг хоёуланг нь ашиглах боломжтой бөгөөд энэ нь зөвхөн эдгээр хувьсагчийн төрлүүдийн аль нэгийг нь зохицуулж чаддаг алгоритмуудтай харьцуулахад урьдчилсан боловсруулалт бага шаарддаг гэсэн үг юм.

Шийдвэрийн модыг тасралтгүй шинж чанаруудын утгыг тодорхойлоход ашиглахад тийм ч сайн ажиллахгүй байх хандлагатай байдаг. Шийдвэрийн модны өөр нэг хязгаарлалт нь ангилахдаа сургалтын жишээ цөөн боловч олон ангитай бол шийдвэрийн мод буруу байх хандлагатай байдаг.

Мэргэшсэн блоггер, программист Машины сургалт болон Гүн сурах сэдвүүд. Даниел бусад хүмүүст хиймэл оюун ухааны хүчийг нийгмийн сайн сайхны төлөө ашиглахад тусална гэж найдаж байна.