Lineaarinen regressio saattaa kuulostaa monimutkaiselta termiltä, mutta pohjimmiltaan se on kätevä työkalu, joka auttaa meitä ymmärtämään ja ennustamaan kahden muuttujan välisiä suhteita.
Mikä on lineaarisen regression ongelma?
Lineaarisen regression ytimessä on löytää viiva, joka sopii parhaiten kaavion pisteisiin. Tämä rivi auttaa meitä ennustamaan. Kuvittele piirtävän pisteitä kaavioon – me selvitämme trendin.
Maaginen yhtälö:
Jokaista riviä edustaa lineaarinen funktio: Y = mX + b. Missä:
-
Y: Mitä yritämme ennustaa (kuten painosi).
-
X: Mitä käytämme ennusteen tekemiseen (kuten pituutesi).
-
m: Viivan kaltevuus.
-
b: Viivan aloituspiste.
Kuinka se toimii?
Ajattele asiaa näin: Jos tiedät joukon ihmisiä pituuden ja niitä vastaavat painot, lineaarinen regressio vetää viivan näiden pisteiden läpi. Tämä viiva auttaa meitä arvaamaan jonkun uuden painon pelkästään tietämällä hänen pituutensa.
Esimerkkejä tosielämästä:
-
Jäätelön myynti ja lämpötila: kuuma päivä (X), enemmän jäätelöä myyty (Y)
-
Opiskelutunnit ja koepisteet: Enemmän opiskelutunteja (X), korkeammat tenttipisteet (Y).
Prosessi:
-
Kerää tietoja: Hanki tietoa opiskeluistasi, kuten pituudesta ja painosta.
-
Piirrä viiva: Viiva yhdistää kaavion pisteet. Tämä voi olla joko iteratiivinen prosessi tai käyttää tarkkoja ratkaisuja.
-
Tee ennusteita: Käytä viivaa ennustaaksesi yhden asian toisen perusteella.
Miksi sillä on väliä?
Ennusteet! Se auttaa meitä arvaamaan tuloksia olemassa olevien mallien perusteella.
Se on perusta edistyneemmälle datamagialle.
Varoitus:
Se toimii parhaiten, kun suhde on jokseenkin suora. Jos se on kaikkialla, asiat voivat mennä hankalaksi.