maandag 23 december 2013

1.3 Data importeren in de R console

Data importeren naar de R Console


Controleer of de juiste Working Directory ingesteld is. Controleer ook of de databestanden in deze map zijn geplaatst [1]. Als deze twee handelingen in orde zijn bent u klaar om databestanden te importeren in de R console.

Csv-bestanden importeren in R

U kunt zelf selecteren welk bestand u wilt importeren in de R console. Dit doet u als volgt:
  1. Het databestand importeren:
    Voer de code read.csv(*naam van uw bestand*) in. Bij het voorbeeld in afbeelding 4 wordt het bestand Bloemenverkoop.csv geïmporteerd. Hiervoor wordt de code read.csv(‘Bloemenverkoop.csv’) ingevoerd. Na het indrukken van Enter verschijnt de informatie uit het databestand in de R console. 


Let op! De code die in R wordt ingevoerd is hoofdlettergevoelig, ‘bloemenverkoop.csv’ wordt door R niet gevonden. Let hierbij ook op dat de naam van het bestand tussen ‘aanhalingstekens’ is geplaatst.
2.      Een variabele aanmaken voor het bestand:

De volgende stap is variabele aanmaken voor het databestand. In de Inleiding wordt uitgelegd dat met R variabelen aangemaakt kunnen worden met de <- code. Voor het databestand Bloemenverkoop.csv wordt nu een variabele gemaakt. Dit gaat aan de hand van de volgende code:

Bloemenverkoop<-read.csv(‘Bloemenverkoop.csv’) [2] . Het bestand Bloemenverkoop.csv wordt door R nu niet langer meer gezien als een extern bestand, maar als een variabele in deze sessie. 
Het nut van een variabele aanmaken voor het bestand is dat nu niet meer de steeds de code read.csv(‘Bloemenverkoop.csv’) ingevoerd moet worden als u dit bestand wilt gebruiken. Nu er een variabele is aangemaakt voor het bestand, hoeft u alleen maar Bloemenverkoop in te voeren om informatie te weergeven over het bestand.

3.      Een matrix maken van het databestand:

Door een matrix te maken van de zojuist aangemaakte variabele, kan de R Console op een betere manier de data van de variabele lezen. Dit gaat eenvoudig met de volgende code: attach(*Naam van de variabele van het databestand*). In afbeelding 4 wordt de code attach(Bloemenverkoop) gebruikt.
U kunt nu de categorieën van de variabelen op een eenvoudige manier weergeven met R. Als u bijvoorbeeld informatie wilt over de categorie Tulpen wilt weergeven, voert u simpelweg de code Tulpen in. U zult in het volgende hoofdstuk zien dat er vóór de code Tulpen verschillende functies geplaatst kunnen worden om de categorie tulpen te analyseren.



Afbeelding 4 Het importeren van een databestand, het aanmaken van een variabele van het databestand en een matrix maken van het databestand.
Afbeelding 4 Het importeren van een databestand, het aanmaken van een variabele van het databestand en een matrix maken van het databestand.

Naar de volgende stap: 1.4 De basisfuncties van R voor het analyseren van data



[1] Zoals in hoofdstuk 1.1 over de Working Directory wordt uitgelegd: De Working Directory is de map waar R zoekt naar de databestanden om te lezen. De databestanden moeten dus in deze map worden geplaatst om door R gevonden te worden.
[2] Het is niet noodzakelijk om de variabele Bloemenverkoop te noemen. Met de <- code herkent R het databestand voor welke naam u het ook geeft. Bloemetjes <- read.csv(‘Bloemenverkoop.csv’) kan bijvoorbeeld ook. De variabele heet dan in het vervolg Bloemetjes. 

Geen opmerkingen:

Een reactie posten