tunggul Naon Regression Linier? - Ngahiji.AI
Connect with kami

AI 101

Naon Regression Linier?

mm
diropéa on

Naon Regression Linier?

Régrési liniér nyaéta algoritma anu digunakeun pikeun ngaduga, atanapi ngabayangkeun, a hubungan antara dua fitur béda / variabel. Dina tugas régrési linier, aya dua rupa variabel anu ditalungtik: variabel terikat jeung variabel bebas. Variabel bébas nya éta variabel anu nangtung sorangan, henteu dipangaruhan ku variabel séjén. Nalika variabel bébas disaluyukeun, tingkat variabel terikat bakal turun naek. Variabel terikat nyaéta variabel anu ditalungtik, sareng éta anu direngsekeun ku modél régrési / usaha pikeun ngaduga. Dina pancén régrési linier, unggal observasi/instance diwangun ku nilai variabel terikat jeung nilai variabel bebas.

Éta mangrupikeun katerangan gancang ngeunaan régrési liniér, tapi hayu urang pastikeun yén urang ngartos kana régrési liniér anu langkung saé ku ningali conto éta sareng marios rumus anu dianggo.

Ngartos Regresi Linier

Anggap urang boga dataset ngawengku ukuran hard-drive jeung biaya hard drive maranéhanana.

Anggap yén set data anu urang gaduh diwangun ku dua fitur anu béda: jumlah mémori sareng biaya. Beuki memori urang dibeuli pikeun komputer, beuki biaya beuli naek. Upami urang ngarencanakeun titik data individu dina plot paburencay, urang tiasa nampi grafik anu katingali sapertos kieu:

Rasio mémori-ka-biaya anu pasti tiasa bénten-béda antara produsén sareng modél hard drive, tapi sacara umum, tren data nyaéta salah sahiji anu dimimitian di kénca handap (dimana hard drive langkung mirah sareng gaduh kapasitas anu langkung alit) sareng pindah ka katuhu luhur (dimana drive nu leuwih mahal jeung kapasitas luhur).

Upami urang ngagaduhan jumlah mémori dina sumbu-X sareng biaya dina sumbu-Y, baris ngarebut hubungan antara variabel X sareng Y bakal ngamimitian di belah kénca juru handap sareng ngajalankeun ka katuhu luhur.

Fungsi modél régrési nyaéta pikeun nangtukeun fungsi liniér antara variabel X jeung Y anu paling ngagambarkeun hubungan antara dua variabel. Dina régrési liniér, éta dianggap Y bisa diitung tina sababaraha kombinasi variabel input. Hubungan antara variabel input (X) jeung variabel target (Y) bisa digambarkeun ku cara ngagambar garis ngaliwatan titik dina grafik. Garis ngagambarkeun fungsi anu pangalusna ngajelaskeun hubungan antara X jeung Y (contona, pikeun unggal waktos X naek 3, Y naek 2). Tujuanana pikeun manggihan hiji optimal "garis regression", atawa garis / fungsi nu pangalusna fits data.

Garis ilaharna digambarkeun ku persamaan: Y = m*X + b. X ngarujuk kana variabel terikat sedengkeun Y nyaéta variabel bébas. Samentara éta, m nyaéta lamping garis, sakumaha didefinisikeun ku "naékna" ngaliwatan "ngajalankeun". Praktisi pembelajaran mesin ngagambarkeun persamaan garis lamping anu kasohor rada béda, nganggo persamaan ieu:

y(x) = w0 + w1 * x

Dina persamaan di luhur, y nyaéta variabel udagan sedengkeun "w" nyaéta parameter modél sareng inputna nyaéta "x". Jadi persamaan dibaca salaku: "Fungsi anu masihan Y, gumantung kana X, sarua jeung parameter model dikali fitur". Parameter modél disaluyukeun nalika latihan pikeun kéngingkeun garis régrési anu paling pas.

Sababaraha régrési linier

Poto: Cbaf via Wikimedia Commons, Domain Publik (https://commons.wikimedia.org/wiki/File:2d_multiple_linear_regression.gif)

Prosés ditétélakeun di luhur lumaku pikeun régrési liniér basajan, atawa régrési dina susunan data nu ngan aya hiji fitur tunggal / variabel bebas. Nanging, régrési ogé tiasa dilakukeun ku sababaraha fitur. Upami kitu "régrési liniér sababaraha”, persamaan dilegaan ku jumlah variabel anu aya dina set data. Dina basa sejen, sedengkeun persamaan pikeun régrési liniér biasa nyaéta y(x) = w0 + w1 * x, persamaan pikeun régrési liniér ganda bakal jadi y(x) = w0 + w1x1 ditambah beurat jeung input pikeun rupa-rupa fitur. Lamun urang ngagambarkeun jumlah total beurat jeung fitur salaku w(n)x(n), mangka urang bisa ngagambarkeun rumus kawas kieu:

y(x) = w0 + w1x1 + w2x2 + … + w(n)x(n)

Saatos netepkeun rumus pikeun régrési linier, modél pembelajaran mesin bakal ngagunakeun nilai anu béda pikeun beurat, ngagambar garis anu cocog. Inget yen tujuanana nyaéta pikeun manggihan garis nu pangalusna fits data dina urutan pikeun nangtukeun mana tina kombinasi beurat mungkin (jeung kituna nu mungkin garis) pangalusna fits data sarta ngajelaskeun hubungan antara variabel.

Fungsi biaya digunakeun pikeun ngukur sabaraha deukeut nilai Y anu dianggap kana nilai Y sabenerna lamun dibéré nilai beurat nu tangtu. Fungsi ongkos pikeun régrési linier hartina kasalahan kuadrat, nu ngan nyokot rata (kuadrat) kasalahan antara nilai diprediksi jeung nilai sabenerna pikeun sakabéh rupa titik data dina dataset nu. Fungsi biaya dianggo pikeun ngitung biaya, anu ngarebut bédana antara nilai target anu diprediksi sareng nilai target anu leres. Upami garis pas jauh tina titik data, biayana bakal langkung luhur, sedengkeun biayana bakal langkung alit, langkung caket garisna pikeun nyandak hubungan anu leres antara variabel. Beurat modél teras disaluyukeun dugi konfigurasi beurat anu ngahasilkeun jumlah kasalahan pangleutikna kapanggih.

Blogger sareng programer kalayan spesialisasi dina mesin Learning jeung jero Learning jejer. Daniel ngaharepkeun ngabantosan batur ngagunakeun kakawasaan AI pikeun kasaéan sosial.