maandag 23 december 2013

2.8 Meervoudige lineaire regressie analyse uitvoeren met R

Meervoudige Regressieanalyse


In het vorige hoofdstuk is besproken hoe u een eenvoudige lineaire regressie met R kunt maken. Hierbij wordt er een afhankelijke variabele voorspeld met één verklarende variabele. Echter kunt u ook een afhankelijke variabele voorpellen met meerdere verklarende variabelen. Dit wordt een meervoudige regressie genoemd.


Code

Bij R is er weinig verschil in code tussen een enkelvoudige regressie en een meervoudige regressie.
Een meervoudige regressie kunt u uitvoeren met de volgende code:
(*naam van de regressie*)<-lm(*Afhankelijke variabele*~*Verklarende variabele 1*+*Verklarende variabele 2*+*Verklarende variabele x*, *Variabele van de dataset*). U kunt zo veel verklarende variabelen gebruiken als u wilt, zolang u ze maar met een + in de code blijft toevoegen.
Op dezelfde manier als bij een enkelvoudige regressie kunt u het geschatte model en de gegevens van de regressie tevoorschijn halen. Respectievelijk met de codes: *naam van de regressie*, en summary(*naam van de regressie*).

Interpretatie van de regressie

In tegenstelling tot de enkelvoudige regressie, staan er in het resultaat van de meervoudige regressie meerdere rijen van variabelen. Het principe is hetzelfde, aan de hand van de sterren achter de rij worden de significanties van de variabelen laten zien.

Afbeelding 26 Een meervoudige regressieanalyse uitvoeren met R.
Afbeelding 26 Een meervoudige regressieanalyse uitvoeren met R.


In afbeelding 26 wordt er de volgende regressieanalyse gedaan:
De winst voorspellen aan de hand van personeelskosten, materiaalkosten en de tevredenheid van de klant. Hiervoor wordt de volgende code gebruikt.
Regressie<-lm(Winst~Personeelskosten+Materiaalkosten+TevredenheidKlant, Projecten). Door de naam van de regressie Regressie in te toetsen, verschijnt het geschatte model: Winst = 8845.8805 + (-0.2964)X1 + (-1.9292)X2 + (-1338.5787)X3. Waarbij X1 staat voor de personeelskosten, X2 voor de materiaalkosten en X3 voor de tevredenheid van de klant.
Met de code summary(Regressie) komt in het voorbeeld de regressieanalyse tevoorschijn. Valt het u op dat alle rijen van variabelen significant zijn? De een is echter minder significant dan de ander, maar toch zijn alle variabelen significant genoeg om in het model toe te passen.
In het voorbeeld is de Adjusted R-squared slechts 0.2529. De drie verklarende variabelen zijn dus slechte variabelen om de winst mee te voorspellen.
U hebt kunnen zien dat een meervoudige regressie op dezelfde manier werkt als een enkelvoudige regressie.

Let op! Het begrip voorspellen moet u interpreteren als voorspellen in uw eigen dataset. Uw dataset is een afspiegeling van uw eigen situatie, niet hoe het er in alle situaties op elk moment in de wereld aan toe gaat. Het blijven namelijk maar statistische functies die verbanden in uw data analyseren. U bent met de regressieanalyse dus beperkt uitspraken te doen over voorspellingen in uw eigen situatie.

Naar de volgende stap: 2.9 Een enkelvoudige of eenvoudige regressie analyse met categorische variabelen uitvoeren in R

Geen opmerkingen:

Een reactie posten