stub Гүнзгий суралцах гэж юу вэ? (2024) - Unite.AI
бидэнтэй хамт холбоно
AI мастер анги:

AI 101

Гүнзгий суралцах гэж юу вэ?

mm
шинэчлэгдсэн on

Гүнзгий суралцах нь хиймэл оюун ухааны хамгийн нөлөө бүхий бөгөөд хамгийн хурдацтай хөгжиж буй салбаруудын нэг юм. Гэсэн хэдий ч гүнзгий суралцах гэсэн нэр томьёо нь янз бүрийн алгоритм, арга техникийг хамардаг тул гүнзгий суралцах тухай зөн совингийн талаар ойлголттой болох нь хэцүү байдаг. Гүнзгий суралцах нь мөн ерөнхийдөө машин сургалтын дэд салбар учраас гүн гүнзгий суралцахыг ойлгохын тулд машин сургалт гэж юу болохыг ойлгох нь чухал юм.

Машин сурах гэж юу вэ?

Гүн сурах Энэ нь машин сургалтаас үүдэлтэй зарим ойлголтын өргөтгөл юм, тиймээс машин сургалт гэж юу болохыг тайлбарлая.

Энгийнээр хэлбэл, машин сургалт нь эдгээр даалгаврыг биелүүлэхэд ашигладаг алгоритмын мөр бүрийг тодорхой кодлохгүйгээр компьютерт тодорхой ажлуудыг гүйцэтгэх боломжийг олгодог арга юм. Маш олон төрлийн машин сургалтын алгоритмууд байдаг ч хамгийн түгээмэл хэрэглэгддэг алгоритмуудын нэг нь a олон давхар перцептрон. Олон давхаргат перцептроныг мэдрэлийн сүлжээ гэж нэрлэдэг бөгөөд энэ нь хоорондоо холбогдсон хэд хэдэн зангилаа/нейронуудаас бүрддэг. Олон давхаргат перцептрон нь оролтын давхарга, далд давхарга, гаралтын давхарга гэсэн гурван өөр давхаргатай.

Оролтын давхарга нь өгөгдлийг сүлжээнд оруулдаг бөгөөд дунд/далд давхарга дахь зангилаануудаар зохицуулагддаг. Далд давхарга дахь зангилаанууд нь оролтын давхаргаас ирж буй өгөгдлийг удирдах, оролтын өгөгдлөөс холбогдох хэв маягийг гаргаж авах боломжтой математик функцууд юм. Мэдрэлийн сүлжээ ингэж "суралцдаг" юм. Мэдрэлийн сүлжээ нь хүний ​​тархины бүтэц, үйл ажиллагаанаас санаа авсан учраас нэрээ авсан.

Сүлжээний зангилааны хоорондох холболтууд нь жин гэж нэрлэгддэг утгуудтай байдаг. Эдгээр утгууд нь үндсэндээ нэг давхарга дахь өгөгдөл нь дараагийн давхаргын өгөгдөлтэй хэрхэн холбогдож байгаа талаарх таамаглал юм. Сүлжээг сургах явцад жинг тохируулдаг бөгөөд зорилго нь өгөгдлийн жин/таамаглал нь эцэстээ өгөгдлийн доторх утга учиртай хэв маягийг үнэн зөв илэрхийлэх утгууд дээр нийлэх явдал юм.

Идэвхжүүлэх функцууд нь сүлжээний зангилаанд байдаг бөгөөд эдгээр идэвхжүүлэх функцууд нь өгөгдлийг шугаман бус хэлбэрээр хувиргаж, сүлжээнд өгөгдлийн цогц дүрслэлийг сурах боломжийг олгодог. Идэвхжүүлэх функцууд нь оролтын утгыг жингийн утгуудаар үржүүлж, хазайлтыг нэмдэг.

Гүнзгий суралцах гэж юу вэ?

Гүнзгий суралцах гэдэг нь олон давхаргат перцептронуудыг нэгтгэдэг машин сургалтын архитектурт өгсөн нэр томъёо бөгөөд ингэснээр зөвхөн нэг далд давхарга биш, харин олон далд давхарга байдаг. Мэдрэлийн сүлжээ нь гүн гүнзгий байх тусам сүлжээ нь илүү боловсронгуй хэв маягийг сурч чадна.

Нейроноос бүрдэх гүн давхаргын сүлжээг заримдаа бүрэн холбогдсон сүлжээ эсвэл бүрэн холбогдсон давхарга гэж нэрлэдэг бөгөөд энэ нь тухайн нейрон нь түүнийг тойрсон бүх мэдрэлийн эсүүдтэй холбоо тогтоодог болохыг харуулж байна. Бүрэн холбогдсон сүлжээг бусад машин сургалтын функцуудтай нэгтгэж, өөр өөр гүнзгий сургалтын архитектурыг бий болгож болно.

Гүнзгий сургалтын янз бүрийн хэлбэрүүд

Судлаачид, инженерүүдийн ашигладаг олон төрлийн гүнзгий сургалтын архитектурууд байдаг бөгөөд өөр өөр архитектур тус бүр өөрийн гэсэн тусгай хэрэглээний тохиолдолтой байдаг.

Эвдэрсэн мэдрэлийн сүлжээ

Хувиралт мэдрэлийн сүлжээ, эсвэл CNN нь компьютерийн харааны системийг бий болгоход түгээмэл хэрэглэгддэг мэдрэлийн сүлжээний архитектур юм. Эвлэлийн мэдрэлийн сүлжээнүүдийн бүтэц нь дүрсний өгөгдлийг тайлбарлаж, тэдгээрийг бүрэн холбогдсон сүлжээний тайлбарлах боломжтой тоо болгон хувиргах боломжийг олгодог. CNN нь дөрвөн үндсэн бүрэлдэхүүн хэсэгтэй:

  • Эргэлтийн давхаргууд
  • Дээж авах/нэвтүүлэх давхаргууд
  • Идэвхжүүлэх функцууд
  • Бүрэн холбогдсон давхаргууд

Хувиралт давхаргууд нь зургийг сүлжээнд оруулан авч, дүрсэнд дүн шинжилгээ хийж, пикселийн утгыг авдаг. Дэд дээж авах буюу нэгтгэх гэдэг нь зургийн дүрслэлийг хялбарчлах, зургийн шүүлтүүрүүдийн дуу чимээнд мэдрэмтгий байдлыг багасгахын тулд зургийн утгыг хөрвүүлэх/багасгах явдал юм. Идэвхжүүлэх функцууд нь өгөгдөл нэг давхаргаас дараагийн давхарга руу хэрхэн урсаж байгааг хянадаг бөгөөд бүрэн холбогдсон давхаргууд нь дүрсийг төлөөлж буй утгуудыг шинжилж, тэдгээр утгууд дахь хэв маягийг сурдаг.

RNN/LSTM

Давтан мэдрэлийн сүлжээ, эсвэл RNN нь өгөгдлийн дараалал чухал, сүлжээ нь өгөгдлийн дарааллын талаар суралцах ёстой ажлуудад түгээмэл байдаг. Өгүүлбэрийн утгыг тайлахад үгийн дараалал чухал байдаг тул RNN-ийг байгалийн хэлээр боловсруулах зэрэг асуудлуудад ихэвчлэн ашигладаг. Давтагдах мэдрэлийн сүлжээ гэдэг нэр томъёоны "давтагдах" хэсэг нь тухайн элементийн гаралт нь өмнөх болон одоогийн тооцоололоос хамааралтай дарааллаар гардаг. Гүн мэдрэлийн сүлжээнүүдийн бусад хэлбэрээс ялгаатай нь RNN нь "санах ойтой" бөгөөд дарааллын өөр өөр үе шаттайгаар тооцоолсон мэдээллийг эцсийн утгыг тооцоолоход ашигладаг.

Зүйлийн үнэ цэнийг тооцоолохдоо өмнөх зүйлүүдээс гадна дарааллын дарааллаар ирээдүйн зүйлсийг харгалзан үздэг хоёр чиглэлтэй RNN зэрэг олон төрлийн RNN байдаг. RNN-ийн өөр нэг төрөл нь a Урт богино хугацааны ой санамж буюу LSTM, сүлжээ. LSTM нь өгөгдлийн урт гинжийг зохицуулах чадвартай RNN-ийн төрөл юм. Тогтмол RNN нь "дэлбэрэх градиент асуудал" гэж нэрлэгддэг зүйлийн хохирогч болж магадгүй юм. Энэ асуудал нь оролтын өгөгдлийн гинжин хэлхээ маш урт болсон үед тохиолддог боловч LSTM-д энэ асуудалтай тэмцэх арга техник байдаг.

Автомат кодлогч

Одоогоор дурдагдсан гүнзгий сургалтын архитектурын ихэнх нь хяналтгүй сургалтын даалгавраас илүү хяналттай сургалтын асуудалд хэрэглэгддэг. Автомат кодлогч нь хяналтгүй өгөгдлийг хяналттай формат болгон хувиргаж, мэдрэлийн сүлжээг асуудалд ашиглах боломжийг олгодог.

Автомат кодлогч нь өгөгдлийн багц дахь гажиг илрүүлэхэд ихэвчлэн ашиглагддаг бөгөөд гажиг шинж чанар нь тодорхойгүй байдаг тул хяналтгүй суралцах жишээ юм. Аномали илрүүлэх ийм жишээнд санхүүгийн байгууллагуудын залилан мэхлэлт зэрэг орно. Энэ утгаараа автомат кодлогчийн зорилго нь өгөгдлийн ердийн хэв маягийн суурь шугамыг тодорхойлох, гажуудал эсвэл хэт давчуу байдлыг тодорхойлох явдал юм.

Автомат кодлогчийн бүтэц нь ихэвчлэн тэгш хэмтэй, далд давхаргууд нь сүлжээний гаралт нь оролттой төстэй байхаар байрлуулсан байдаг. Байнга ашигладаг дөрвөн төрлийн автомат кодлогч нь:

  • Энгийн/энгийн автомат кодлогч
  • Олон давхаргат кодлогч
  • Convolutional encoders
  • Тогтмол кодлогч

Тогтмол/энгийн автокодерууд нь нэг далд давхаргатай мэдрэлийн сүлжээ, харин олон давхаргат автомат кодлогч нь нэгээс олон далд давхарга бүхий гүн сүлжээнүүд юм. Convolutional autoencoder нь бүрэн холбогдсон давхаргуудын оронд эсвэл нэмэлтээр эвхэгддэг давхаргуудыг ашигладаг. Тогтмол автомат кодлогч нь мэдрэлийн сүлжээнд оролтыг гаралт руу хуулахаас өөр илүү төвөгтэй функцийг гүйцэтгэх тусгай төрлийн алдагдлын функцийг ашигладаг.

Үүсгэх сөрөг сүлжээнүүд

Өрсөлдөөнт сүлжээ (GANs) Эдгээр нь үнэндээ нэг сүлжээний оронд олон гүн мэдрэлийн сүлжээ юм. Гүн сургалтын хоёр загварыг нэгэн зэрэг бэлтгэж, тэдгээрийн гаралтыг нөгөө сүлжээнд нийлүүлдэг. Сүлжээнүүд хоорондоо өрсөлдөж, бие биенийхээ гаралтын өгөгдөлд ханддаг тул хоёулаа энэ өгөгдлөөс суралцаж, сайжирдаг. Хоёр сүлжээ нь үндсэндээ хуурамч, илрүүлэх тоглоомыг тоглож байгаа бөгөөд үүсгэгч загвар нь мөрдөгч загвар/ялгаварлагчийг хуурах шинэ тохиолдлуудыг бий болгохыг оролддог. GAN нь компьютерийн харааны салбарт алдартай болсон.

Гүнзгий сургалтын хураангуй

Гүнзгий суралцах нь мэдрэлийн сүлжээний зарчмуудыг өргөжүүлж, нарийн төвөгтэй хэв маягийг сурч, эдгээр хэв маягийг ирээдүйн өгөгдлийн багцад нэгтгэх боломжтой боловсронгуй загваруудыг бий болгодог. Convolutional neural network нь зургийг тайлбарлахад хэрэглэгддэг бол RNN/LSTM нь дараалсан өгөгдлийг тайлбарлахад ашиглагддаг. Автомат кодлогч нь хяналтгүй сургалтын даалгаврыг хяналттай сургалтын даалгавар болгон хувиргаж чадна. Эцэст нь, GAN нь бие биенийхээ эсрэг байрладаг олон сүлжээ бөгөөд компьютерийн харааны ажилд онцгой ач холбогдолтой юм.

Мэргэшсэн блоггер, программист Машины сургалт болон Гүн сурах сэдвүүд. Даниел бусад хүмүүст хиймэл оюун ухааны хүчийг нийгмийн сайн сайхны төлөө ашиглахад тусална гэж найдаж байна.