Connect with us

AI 101

Vad är Linjär Regression?

mm

Vad är Linjär Regression?

Linjär regression är en algoritm som används för att förutsäga eller visualisera en relation mellan två olika funktioner/variabler. I linjära regressionsuppgifter finns det två typer av variabler som undersöks: den beroende variabeln och den oberoende variabeln. Den oberoende variabeln är den variabel som står för sig själv, utan att påverkas av den andra variabeln. När den oberoende variabeln justeras, kommer nivåerna på den beroende variabeln att fluktuera. Den beroende variabeln är den variabel som studeras, och det är vad regressionsmodellen löser eller försöker förutsäga. I linjära regressionsuppgifter består varje observation/instans av både den beroende variabelns värde och den oberoende variabelns värde.

Det var en snabb förklaring av linjär regression, men låt oss se till att vi får en bättre förståelse för linjär regression genom att titta på ett exempel och undersöka formeln som den använder.

Att Förstå Linjär Regression

Anta att vi har en dataset som täcker hårddiskstorlekar och kostnaden för dessa hårddiskar.

Låt oss anta att dataseten består av två olika funktioner: mängden minne och kostnad. Ju mer minne vi köper för en dator, desto mer ökar kostnaden för köpet. Om vi plottade ut de individuella datapunkterna på en spridningsplot, kanske vi får en graf som ser ut så här:

Den exakta minnes-till-kostnads-förhållandet kan variera mellan tillverkare och modeller av hårddisk, men i allmänhet är trenden i data en som börjar i nedre vänstra hörnet (där hårddiskar är både billigare och har mindre kapacitet) och rör sig till övre högra hörnet (där enheterna är dyrare och har högre kapacitet).

Om vi hade mängden minne på X-axeln och kostnaden på Y-axeln, skulle en linje som fångar relationen mellan X- och Y-variablerna börja i nedre vänstra hörnet och löpa till övre högra hörnet.

Funktionen hos en regressionsmodell är att bestämma en linjär funktion mellan X- och Y-variablerna som bäst beskriver relationen mellan de två variablerna. I linjär regression antas det att Y kan beräknas från någon kombination av ingångsvariablerna. Relationen mellan ingångsvariablerna (X) och målvariablerna (Y) kan porträtteras genom att rita en linje genom punkterna i grafen. Linjen representerar den funktion som bäst beskriver relationen mellan X och Y (t.ex. för varje gång X ökar med 3, ökar Y med 2). Målet är att hitta en optimal “regressionslinje”, eller linjen/funktionen som bäst passar data.

Blogger och programmerare med specialområden inom Machine Learning och Deep Learning ämnen. Daniel hoppas på att hjälpa andra att använda kraften från AI för socialt väl.