Linjär regressionsanalys

Regression används för att visa ett kausalt samband mllan två variabler. Man vill veta hur y beror på x, där x är orsaken för y, dvs. y beror på x. Till exempel: Den som har en stor pappa har  en större chans att   blir stor jämfört med en som har en liten pappa. I motsats till korrelationen finns det ett kausalsamband i regressionen som inte går att vända om. Matematiskt uttryckt är alltså y en function av x. Man skriver: y=f(x).

I det enklaste fallet f(x) en linjär function: f(x)=a+bx

Antar att du mäter följande värden i ett experiment:

x

y

-1

-1

2

2.5

6

3.5

8

6

Nu vill du testa om y beror linjärt på x. Det gäller då att anpassa functionen så till dina mätvärden att avståndet mellan functionens värde och de uppmätta y-värden blir så lite som möjligt. Som nästan alltid i statistiken använder man sig av kvadrater eftersom vi är intresserade av de absoluta värden - plus och minustecken är ju inte intressanta i detta sammanhang. Kvadratsumman av avstånden mellan mätvärden och functionen skall alltså minimeras.

Lösningen av detta minsta kvadrat-problem kan beräknas allmänt genom att sätta de partiella derivatorna av kvadratsumman med hänseende till parametrarna a och b lika med noll. Man får då:

och

där balken över x och y betyder medelvärdet över alla x respective y.

Härledningen visas inte här. Den finns i de flesta statistikböckerna.

Uppgift:

Beräkna värdet för parametrarna a och b i exemplet oven:

Lösning:

`x = (-1 + 2 + 6 + 8)/4 = 3.75

`y = (-1 + 2.5 + 3.5 + 6)/4 = 2.75

 

Regressionsequationen blit alltså: y = 0.155 + 0.692 x

Tillbaka


Copyright © 1999 [Växten & Marken]. All rights reserved.
Information in this document is subject to change without notice.
Other products and companies referred to herein are trademarks or registered trademarks of their respective companies or mark holders.