tunggul Naon Deep Learning? (2024) - Ngahiji.AI
Connect with kami

AI 101

Naon Deep Learning?

mm
diropéa on

Pangajaran jero mangrupikeun salah sahiji widang anu paling berpengaruh sareng paling gancang dina intelijen buatan. Nanging, kéngingkeun pamahaman intuitif ngeunaan diajar jero tiasa sesah sabab istilah diajar jero nyertakeun rupa-rupa algoritma sareng téknik anu béda. Pangajaran jero ogé mangrupikeun subdisiplin diajar mesin sacara umum, janten penting pikeun ngartos naon pembelajaran mesin supados ngartos diajar jero.

Naon Ari Pembelajaran Mesin?

Diajar jero mangrupa penyuluhan sababaraha konsép anu asalna tina pembelajaran mesin, ku sabab éta, hayu urang sakedap pikeun ngajelaskeun naon pembelajaran mesin.

Saderhana, pembelajaran mesin mangrupikeun metode anu ngamungkinkeun komputer ngalaksanakeun tugas khusus tanpa sacara eksplisit ngodekeun unggal baris algoritma anu dianggo pikeun ngalaksanakeun tugas éta. Aya seueur algoritma pembelajaran mesin anu béda, tapi salah sahiji algoritma anu paling sering dianggo nyaéta a perceptron multilayer. Perceptron multilayer disebut ogé jaringan saraf, sarta diwangun ku runtuyan titik / neuron numbu babarengan. Aya tilu lapisan béda dina perceptron multilayer: lapisan input, lapisan disumputkeun, sarta lapisan kaluaran.

Lapisan input nyandak data kana jaringan, dimana eta dimanipulasi ku titik di tengah / lapisan disumputkeun. Titik dina lapisan disumputkeun mangrupakeun fungsi matematik nu bisa ngamanipulasi data asalna ti lapisan input, extracting pola relevan tina data input. Ieu kumaha jaringan saraf "diajar". Jaringan saraf ngagaduhan namina tina kanyataan yén aranjeunna diideuan ku struktur sareng pungsi otak manusa.

Sambungan antara titik dina jaringan gaduh nilai anu disebut beurat. Nilai ieu dasarna asumsi ngeunaan kumaha data dina hiji lapisan patali jeung data dina lapisan salajengna. Nalika jaringan ngalatih beuratna disaluyukeun, sareng tujuanana nyaéta beurat / asumsi ngeunaan data antukna bakal konvergen kana nilai anu akurat ngagambarkeun pola anu bermakna dina data.

Fungsi aktivasina aya dina titik jaringan, sarta fungsi aktivasina ieu transformasi data dina fashion non-linier, sangkan jaringan pikeun neuleuman ngagambarkeun kompléks data. Fungsi aktivasina kalikeun nilai input ku nilai beurat tur nambahkeun istilah bias.

Naon Deep Learning?

Diajar jero nyaéta istilah anu dipasihkeun ka arsitéktur pembelajaran mesin anu ngahijikeun seueur perceptron multilayer babarengan, ku kituna henteu ngan ukur hiji lapisan disumputkeun tapi seueur lapisan disumputkeun. The "jero" yén jaringan neural jero téh, pola leuwih canggih jaringan bisa diajar.

Jaringan lapisan jero nu diwangun ku neuron sok disebut jaringan disambungkeun pinuh atawa lapisan disambungkeun pinuh, ngarujuk kanyataan yén neuron dibikeun ngajaga sambungan ka sakabéh neuron sabudeureun éta. Jaringan anu sapinuhna disambungkeun tiasa digabungkeun sareng fungsi pembelajaran mesin anu sanés pikeun nyiptakeun arsitéktur pembelajaran jero anu béda.

Rupa-rupa Pangajaran Jero

Aya rupa-rupa arsitéktur pembelajaran jero anu dianggo ku panalungtik sareng insinyur, sareng masing-masing arsitéktur anu béda-béda gaduh kasus panggunaan khusus sorangan.

Jaringan Neural Konvérsi

Jaringan saraf konvolusional, atawa CNNs, nyaéta arsitéktur jaringan saraf nu ilahar dipaké dina kreasi sistem visi komputer. Struktur jaringan neural convolutional ngamungkinkeun aranjeunna pikeun napsirkeun data gambar, ngarobahna kana angka nu jaringan disambungkeun pinuh bisa napsirkeun. A CNN boga opat komponén utama:

  • Lapisan convolutional
  • Lapisan subsampling / pooling
  • Fungsi aktivasina
  • Lapisan disambungkeun pinuh

Lapisan convolutional nyaéta anu nyandak gambar salaku input kana jaringan, nganalisa gambar sareng kéngingkeun nilai piksel. Subsampling atanapi pooling nyaéta dimana nilai gambar dirobih / diréduksi pikeun nyederhanakeun pawakilan gambar sareng ngirangan sensitipitas saringan gambar kana noise. Fungsi aktivasina ngadalikeun kumaha data ngalir ti hiji lapisan ka lapisan salajengna, sarta lapisan disambungkeun pinuh naon analisa nilai nu ngagambarkeun gambar jeung diajar pola dilaksanakeun dina nilai maranéhanana.

RNs/LSTMs

Jaringan saraf recurrent, atawa RNNs, populér pikeun tugas dimana urutan data penting, dimana jaringan kudu diajar ngeunaan runtuyan data. RNNs ilaharna dilarapkeun ka masalah kawas ngolah basa alam, sakumaha urutan kecap penting nalika decoding harti kalimah. Bagian "ulangan" tina istilah Recurrent Neural Network asalna tina kanyataan yén kaluaran pikeun unsur anu dipasihkeun dina sekuen gumantung kana komputasi saméméhna ogé komputasi ayeuna. Beda sareng bentuk jaringan saraf jero anu sanés, RNN gaduh "kenangan", sareng inpormasi anu diitung dina léngkah-léngkah waktos anu béda dina urutan dianggo pikeun ngitung nilai ahir.

Aya sababaraha jenis RNNs, kaasup RNNs bidirectional, nu nyokot item nu bakal datang dina urutan kana akun, sajaba ti item saméméhna, nalika ngitung nilai hiji item urang. tipe séjén RNN nyaéta a Mémori Jangka Pendek Panjang, atanapi LSTM, jaringan. LSTM mangrupikeun jinis RNN anu tiasa ngadamel ranté data anu panjang. RNN biasa tiasa janten korban tina hal anu disebut "masalah gradién ngabeledug". Masalah ieu kajantenan nalika ranté data input janten panjang pisan, tapi LSTM gaduh téknik pikeun merangan masalah ieu.

Autoencoders

Seuseueurna arsitéktur pembelajaran jero anu disebatkeun sajauh ieu dilarapkeun kana masalah diajar anu diawasi, tinimbang tugas diajar anu henteu diawasi. Autoencoders tiasa ngarobih data anu henteu diawaskeun kana format anu diawaskeun, ngamungkinkeun jaringan saraf dianggo dina masalah éta.

Autoencoders sering dianggo pikeun ngadeteksi anomali dina set data, conto pembelajaran anu teu diawasi sabab sifat anomali henteu dipikanyaho. Conto sapertos deteksi anomali kalebet deteksi panipuan pikeun lembaga keuangan. Dina kontéks ieu, tujuan autoencoder nyaéta pikeun nangtukeun dasar pola biasa dina data sareng ngaidentipikasi anomali atanapi outlier.

Struktur autoencoder sering simetris, kalayan lapisan disumputkeun disusun sahingga kaluaran jaringan nyarupaan input. Opat jinis autoencoders anu sering dianggo nyaéta:

  • Autoencoders biasa / polos
  • Encoders multilayer
  • Encoders convolutional
  • Encoders biasa

Autoencoders biasa / polos ngan ukur jaringan saraf sareng lapisan disumputkeun tunggal, sedengkeun autoencoders multilayer mangrupikeun jaringan jero sareng langkung ti hiji lapisan disumputkeun. Autoencoders convolutional ngagunakeun lapisan convolutional tinimbang, atawa salian ti, lapisan disambungkeun pinuh. Autoencoders anu teratur ngagunakeun jinis fungsi leungitna khusus anu ngamungkinkeun jaringan saraf ngalaksanakeun fungsi anu langkung kompleks, fungsi sanés ngan ukur nyalin input kana kaluaran.

Jaringan Adversarial Generatif

Generative Adversarial Networks (GAN) sabenerna sababaraha jaringan neural jero tinimbang ngan hiji jaringan. Dua modél pangajaran jero dilatih dina waktos anu sami, sareng kaluaranna dikirimkeun ka jaringan anu sanés. Jaringan éta bersaing saling, sareng saprak aranjeunna nampi aksés kana data kaluaran masing-masing, aranjeunna duanana diajar tina data ieu sareng ningkatkeun. Dua jaringan ieu dasarna maén kaulinan tiruan jeung deteksi, dimana model generative nyoba nyieun instansi anyar nu bakal fool model detektif / discriminator. GAN geus jadi populér dina widang visi komputer.

Jero Learning Ringkesan

Pangajaran jero ngalegaan prinsip jaringan saraf pikeun nyiptakeun modél canggih anu tiasa diajar pola kompleks sareng ngageneralisasi pola éta kana set data anu bakal datang. Jaringan saraf convolutional dipaké pikeun napsirkeun gambar, sedengkeun RNNs / LSTMs dipaké pikeun napsirkeun data sequential. Autoencoders tiasa ngarobih tugas diajar anu henteu diawasi janten tugas diajar anu diawasi. Tungtungna, GAN mangrupikeun sababaraha jaringan anu diadu saling anu hususna kapaké pikeun tugas visi komputer.

Blogger sareng programer kalayan spesialisasi dina mesin Learning jeung jero Learning jejer. Daniel ngaharepkeun ngabantosan batur ngagunakeun kakawasaan AI pikeun kasaéan sosial.