Meervoudige Regressieanalyse
In het vorige hoofdstuk
is besproken hoe u een eenvoudige lineaire regressie met R kunt maken. Hierbij
wordt er een afhankelijke variabele voorspeld met één verklarende variabele.
Echter kunt u ook een afhankelijke variabele voorpellen met meerdere
verklarende variabelen. Dit wordt een meervoudige regressie genoemd.
Code
Bij R is er weinig verschil in code tussen een enkelvoudige regressie en een meervoudige regressie.Een meervoudige regressie kunt u uitvoeren met de volgende code:
(*naam van de regressie*)<-lm(*Afhankelijke variabele*~*Verklarende variabele 1*+*Verklarende variabele 2*+*Verklarende variabele x*, *Variabele van de dataset*). U kunt zo veel verklarende variabelen gebruiken als u wilt, zolang u ze maar met een + in de code blijft toevoegen.
Op dezelfde manier als bij een enkelvoudige regressie kunt u
het geschatte model en de gegevens van de regressie tevoorschijn halen.
Respectievelijk met de codes: *naam van de
regressie*, en summary(*naam van de regressie*).
Interpretatie van de regressie
In tegenstelling tot de enkelvoudige regressie, staan er in het resultaat van de meervoudige regressie meerdere rijen van variabelen. Het principe is hetzelfde, aan de hand van de sterren achter de rij worden de significanties van de variabelen laten zien.
Afbeelding 26 Een meervoudige regressieanalyse
uitvoeren met R.
|
In afbeelding 26
wordt er de volgende regressieanalyse gedaan:
De winst voorspellen aan de hand van personeelskosten, materiaalkosten en de tevredenheid van de klant. Hiervoor wordt de volgende code gebruikt.
Regressie<-lm(Winst~Personeelskosten+Materiaalkosten+TevredenheidKlant, Projecten). Door de naam van de regressie Regressie in te toetsen, verschijnt het geschatte model: Winst = 8845.8805 + (-0.2964)X1 + (-1.9292)X2 + (-1338.5787)X3. Waarbij X1 staat voor de personeelskosten, X2 voor de materiaalkosten en X3 voor de tevredenheid van de klant.
De winst voorspellen aan de hand van personeelskosten, materiaalkosten en de tevredenheid van de klant. Hiervoor wordt de volgende code gebruikt.
Regressie<-lm(Winst~Personeelskosten+Materiaalkosten+TevredenheidKlant, Projecten). Door de naam van de regressie Regressie in te toetsen, verschijnt het geschatte model: Winst = 8845.8805 + (-0.2964)X1 + (-1.9292)X2 + (-1338.5787)X3. Waarbij X1 staat voor de personeelskosten, X2 voor de materiaalkosten en X3 voor de tevredenheid van de klant.
Met de code summary(Regressie) komt in het voorbeeld
de regressieanalyse tevoorschijn. Valt het u op dat alle rijen van variabelen
significant zijn? De een is echter minder significant dan de ander, maar toch
zijn alle variabelen significant genoeg om in het model toe te passen.
In het voorbeeld is de Adjusted R-squared slechts 0.2529. De drie verklarende variabelen zijn dus slechte variabelen om de winst mee te voorspellen.
In het voorbeeld is de Adjusted R-squared slechts 0.2529. De drie verklarende variabelen zijn dus slechte variabelen om de winst mee te voorspellen.
U hebt kunnen zien dat een meervoudige regressie op dezelfde
manier werkt als een enkelvoudige regressie.
Let op! Het begrip voorspellen moet u interpreteren als
voorspellen in uw eigen dataset. Uw dataset is een afspiegeling van uw eigen
situatie, niet hoe het er in alle situaties op elk moment in de wereld aan toe
gaat. Het blijven namelijk maar statistische functies die verbanden in uw data
analyseren. U bent met de regressieanalyse dus beperkt uitspraken te doen over
voorspellingen in uw eigen situatie.
Naar de volgende stap: 2.9 Een enkelvoudige of eenvoudige regressie analyse met categorische variabelen uitvoeren in R
Naar de volgende stap: 2.9 Een enkelvoudige of eenvoudige regressie analyse met categorische variabelen uitvoeren in R
Geen opmerkingen:
Een reactie posten