tunggul Diawasan vs Unsupervised Learning - Unite.AI
Connect with kami

AI 101

Diawasan vs Unsupervised Learning

mm
diropéa on

Dina pembelajaran mesin, sabagéan ageung tugas tiasa gampang digolongkeun kana salah sahiji tina dua kelas anu béda: masalah diajar anu diawasi atanapi masalah diajar anu henteu diawasi. Dina pangajaran supervised, data mibanda labél atawa kelas ditambahkeun kana eta, sedengkeun dina kasus unsupervised learning datana unlabelled. Hayu urang tingali naha bédana ieu penting sareng tingali sababaraha algoritma anu aya hubunganana sareng unggal jinis pangajaran.

Diawasan vs Unsupervised Learning

Kaseueuran tugas diajar mesin aya dina domain pangajaran diawasan. Dina algoritma pembelajaran diawasan, instansi individu / titik data dina susunan data boga kelas atawa labél ditugaskeun ka aranjeunna. Ieu ngandung harti yén modél pembelajaran mesin tiasa diajar ngabédakeun fitur mana anu dihubungkeun sareng kelas anu tangtu sareng insinyur pembelajaran mesin tiasa mariksa kinerja modél ku ningali sabaraha instansi anu leres diklasifikasikeun. Algoritma klasifikasi tiasa dianggo pikeun ngabédakeun seueur pola anu kompleks, salami data dilabélan ku kelas anu leres. Salaku conto, algoritma pembelajaran mesin tiasa diajar ngabédakeun sato anu béda-béda dumasar kana ciri sapertos "kumis", "buntut", "cakar", jsb.

Béda jeung diajar diawasan, pangajaran unsupervised ngalibatkeun nyieun model anu bisa nimba pola tina data unlabelled. Dina basa sejen, komputer nganalisa fitur input sarta nangtukeun sorangan naon fitur sarta pola pangpentingna. Pangajaran anu teu diawasi nyobian mendakan kamiripan anu aya antara instansi anu béda. Lamun algoritma pembelajaran diawasan boga tujuan pikeun nempatkeun titik data kana kelas dipikawanoh, algoritma learning unsupervised bakal nalungtik fitur umum pikeun instansi objék jeung nempatkeun kana grup dumasar kana fitur ieu, dasarna nyieun kelas sorangan.

Conto algoritma pembelajaran anu diawaskeun nyaéta Regresi Linier, Regresi Logistik, Tatangga K-pangcaketna, Tangkal Kaputusan, sareng Mesin Véktor Pendukung.

Samentara éta, sababaraha conto algoritma pembelajaran anu henteu diawaskeun nyaéta Analisis Komponen Principal sareng K-Means Clustering.

Algoritma Pembelajaran Diawasan

liniér Regression mangrupa algoritma nu nyokot dua fitur sarta plot kaluar hubungan antara aranjeunna. Regresi Linier dipaké pikeun ngaduga nilai numeris dina hubungan jeung variabel numeris séjén. Regresi Linier mibanda persamaan Y = a +bX, dimana b nyaéta kemiringan garis jeung a nyaéta tempat y meuntas sumbu X.

Logistik Regresi mangrupa algoritma klasifikasi binér. Algoritma examines hubungan antara fitur numeris sarta manggihan probabiliti yén instance bisa digolongkeun kana salah sahiji dua kelas béda. Nilai probabiliti "squeezed" nuju boh 0 atawa 1. Dina basa sejen, probabiliti kuat bakal ngadeukeutan 0.99 bari probabiliti lemah bakal ngadeukeutan 0.

K-tatangga pangdeukeutna napelkeun kelas ka titik data anyar dumasar kana kelas ditugaskeun sababaraha jumlah dipilih tatanggana di set latihan. Jumlah tatanggana dianggap ku algoritma penting, sarta saeutik teuing atawa loba teuing tatanggana bisa misclassify titik.

Tangkal Kaputusan mangrupikeun jinis algoritma klasifikasi sareng régrési. Tangkal kaputusan beroperasi ku ngabagi set data kana bagian-bagian anu langkung alit sareng langkung alit dugi ka subset henteu tiasa dibeulah deui sareng naon hasilna nyaéta tangkal anu gaduh titik sareng daun. Titik dimana kaputusan ngeunaan titik data dilakukeun nganggo kriteria panyaring anu béda, sedengkeun daun mangrupikeun conto anu ditugaskeun sababaraha labél (titik data anu parantos digolongkeun). Algoritma tangkal kaputusan sanggup nanganan data numeris sareng kategori. Splits dijieun dina tangkal on variabel husus / fitur.

Mesin Véktor Pangrojong nyaéta algoritma klasifikasi anu beroperasi ku ngagambar hyperplanes, atawa garis pamisahan, antara titik data. Titik data dipisahkeun kana kelas dumasar kana sisi mana hyperplane aranjeunna aya. Sababaraha hyperplanes bisa digambar sakuliah pesawat, diving dataset kana sababaraha kelas. Classifier bakal nyoba maksimalkeun pungsi jarak antara hyperplane diving jeung titik dina dua sisi pesawat, jeung gede jarak antara garis jeung titik, beuki yakin classifier nyaeta.

Algoritma Pembelajaran Unsupervised

Analisis Komponén Pokok Téhnik anu digunakeun pikeun réduksi diménsi, hartina diménsi atawa pajeulitna data digambarkeun ku cara anu leuwih basajan. Algoritma Analisis Komponen Principal mendakan diménsi anyar pikeun data anu ortogonal. Bari diménsi data diréduksi, varian antara data kudu dilestarikan saloba mungkin. Naon ieu hartina dina istilah praktis nya éta nyokot fitur dina dataset jeung distills aranjeunna handap kana fitur pangsaeutikna nu ngagambarkeun lolobana data.

K-Means Clustering mangrupa algoritma anu otomatis ngagolongkeun titik data kana klaster dumasar kana fitur sarupa. Pola-pola dina set data dianalisis sareng titik-titik data dibagi kana grup dumasar kana pola ieu. Intina, K-means nyiptakeun kelas sorangan tina data anu teu dilabélan. Algoritma K-Means beroperasi ku nangtukeun puseur ka klaster, atawa centroids, sarta mindahkeun centroids nepi ka posisi optimal pikeun centroids kapanggih. Posisi anu optimal nyaéta dimana jarak antara centroids ka titik data sakurilingna dina kelas diminimalkeun. The "K" dina K-hartina clustering nujul kana sabaraha centroids geus dipilih.

singgetan

Pikeun nutup, hayu urang gancang balik leuwih béda konci antara pangajaran diawasan jeung unsupervised.

Sakumaha anu parantos dibahas, dina tugas diajar anu diawaskeun data input dilabélan sareng jumlah kelas dipikanyaho. Samentara éta, data input henteu dilabélan sareng jumlah kelas henteu dipikanyaho dina kasus diajar anu henteu diawasi. Pangajaran anu henteu diawasi condong kurang kompleks sacara komputasi, sedengkeun pangajaran anu diawasi condong langkung kompleks sacara komputasi. Sedengkeun hasil pangajaran anu diawasi condong akurat pisan, hasil diajar anu henteu diawasi condong kurang akurat/sedeng akurat.

Blogger sareng programer kalayan spesialisasi dina mesin Learning jeung jero Learning jejer. Daniel ngaharepkeun ngabantosan batur ngagunakeun kakawasaan AI pikeun kasaéan sosial.