tunggul Naon ari Transfer Learning? - Ngahiji.AI
Connect with kami

AI 101

Naon ari Transfer Learning?

mm
diropéa on

Naon ari Transfer Learning?

Nalika ngalaksanakeun pembelajaran mesin, ngalatih modél tiasa lami. Nyiptakeun arsitéktur modél ti mimiti, ngalatih modél, teras ngarobih modél mangrupikeun waktos sareng usaha anu ageung. Cara anu langkung éfisién pikeun ngalatih modél pembelajaran mesin nyaéta ngagunakeun arsitéktur anu parantos didefinisikeun, berpotensi sareng beurat anu parantos diitung. Ieu gagasan utama balik mindahkeun diajar, nyandak model nu geus dipaké sarta repurposing eta pikeun tugas anyar.

Sateuacan ngalenyepan sababaraha cara anu tiasa dianggo transfer learning, hayu urang sakedap ngartos naha transfer learning mangrupikeun téknik anu kuat sareng mangpaat.

Ngarengsekeun Masalah Pembelajaran Jero

Nalika anjeun nyobian ngabéréskeun masalah diajar anu jero, sapertos ngawangun klasifikasi gambar, anjeun kedah nyiptakeun arsitéktur modél teras ngalatih modél dina data anjeun. Ngalatih klasifikasi modél ngalibatkeun nyaluyukeun beurat jaringan, prosés anu tiasa nyandak jam atanapi bahkan dinten gumantung kana pajeulitna modél sareng set data. Waktu latihan bakal skala luyu jeung ukuran dataset jeung pajeulitna arsitektur model.

Lamun model teu ngahontal jenis akurasi diperlukeun pikeun tugas, tweaking model sigana bakal perlu dipigawé lajeng model bakal perlu dilatih deui. Ieu hartosna langkung seueur jam latihan dugi ka arsitéktur optimal, panjang latihan, sareng partisi set data tiasa dipendakan. Nalika anjeun nganggap sabaraha variabel anu kedah saluyu sareng anu sanés pikeun klasifikasi janten mangpaat, éta masuk akal yén insinyur mesin diajar sok milarian cara anu langkung gampang, langkung éfisién pikeun ngalatih sareng nerapkeun modél. Ku sabab kitu, téknik transfer learning dijieun.

Saatos ngarancang sareng nguji modél, upami modél éta kabuktian mangpaat, éta tiasa disimpen sareng dianggo deui engké pikeun masalah anu sami.

Jinis Diajar Transfer

Sacara umum, aya dua béda rupa-rupa transfer learning: ngembangkeun model ti scratch tur ngagunakeun modél pre-dilatih.

Nalika anjeun ngembangkeun modél ti mimiti, anjeun kedah nyiptakeun arsitéktur modél anu tiasa napsirkeun data latihan anjeun sareng nimba pola ti dinya. Saatos model dilatih pikeun kahiji kalina, Anjeun meureun bakal kudu nyieun parobahan dina urutan pikeun meunangkeun kinerja optimal kaluar model. Anjeun teras tiasa nyimpen arsitéktur modél sareng dianggo salaku titik awal pikeun modél anu bakal dianggo dina tugas anu sami.

Dina kaayaan kadua - ngagunakeun modél anu tos dilatih - anjeun ngan ukur kedah milih modél anu tos dilatih pikeun dianggo. Seueur paguron luhur sareng tim panaliti bakal ngajantenkeun spésifikasi modélna sayogi pikeun panggunaan umum. Arsitéktur modél tiasa diunduh sareng beuratna.

Nalika ngalaksanakeun transfer learning, sakabéh arsitéktur model jeung beurat bisa dipaké pikeun tugas di leungeun, atawa ngan porsi / lapisan tangtu model bisa dipaké. Ngan ngagunakeun sababaraha modél anu tos dilatih sareng ngalatih sésa modél ieu disebut salaku fine-tuning.

Finetuning a Jaringan

Finetuning jaringan ngajelaskeun prosés latihan ngan sababaraha lapisan dina jaringan. Upami set data latihan énggal sami sareng set data anu dianggo pikeun ngalatih modél aslina, seueur beurat anu sami tiasa dianggo.

Jumlah lapisan dina jaringan nu kudu unfrozen na retrained kudu skala luyu jeung ukuran tina susunan data anyar. Lamun dataset nu keur dilatih dina leutik, éta prakték hadé pikeun nahan mayoritas lapisan sakumaha aranjeunna sarta ngalatih ngan sababaraha lapisan final. Ieu pikeun nyegah jaringan tina overfitting. Alternatipna, lapisan ahir jaringan tos dilatih bisa dihapus sarta lapisan anyar ditambahkeun, nu lajeng dilatih. Kontras, lamun dataset mangrupa dataset badag, berpotensi leuwih badag batan dataset aslina, sakabéh jaringan kudu retrained. Pikeun ngagunakeun jaringan salaku a extractor fitur tetep, mayoritas jaringan bisa dipaké pikeun nimba fitur bari ngan lapisan ahir jaringan bisa unfrozen tur dilatih.

Sawaktos Anjeun keur finetuning jaringan, ngan inget yen lapisan saméméhna tina ConvNet nu ngandung émbaran ngalambangkeun fitur leuwih umum tina gambar. Ieu mangrupikeun fitur sapertos tepi sareng warna. Sabalikna, lapisan ConvNet engké nahan detil anu langkung spésifik pikeun kelas individu anu diayakeun dina set data anu modél mimiti dilatih. Upami anjeun ngalatih modél dina set data anu rada béda ti set data asli, anjeun panginten hoyong nganggo lapisan awal modél pikeun ngekstrak fitur sareng ngan ukur ngalatih deui sesa modél.

Conto Diajar Transfer

Aplikasi anu paling umum pikeun transfer learning sigana anu ngagunakeun data gambar salaku input. Ieu sering tugas prediksi / klasifikasi. Jalanna Jaringan Neural Konvérsi nafsirkeun data gambar lends sorangan ka reusing aspék model, sabab lapisan convolutional mindeng ngabedakeun fitur pisan sarupa. Salah sahiji conto masalah diajar transfer anu umum nyaéta tugas ImageNet 1000, kumpulan data masif anu pinuh ku 1000 kelas objék anu béda. Pausahaan anu ngembangkeun model anu ngahontal kinerja luhur dina susunan data ieu mindeng ngarilis model maranéhanana dina lisensi nu ngidinan batur make deui. Sababaraha model anu dihasilkeun tina prosés ieu diantarana Modél Microsoft ResNet, Modél Inception Google, jeung Oxford VGG Modél grup.

Blogger sareng programer kalayan spesialisasi dina mesin Learning jeung jero Learning jejer. Daniel ngaharepkeun ngabantosan batur ngagunakeun kakawasaan AI pikeun kasaéan sosial.