Data importeren naar de R Console
Controleer of de juiste Working Directory ingesteld is. Controleer ook of de databestanden
in deze map zijn geplaatst [1]. Als deze twee handelingen
in orde zijn bent u klaar om databestanden te importeren in de R console.
Csv-bestanden importeren in R
U kunt zelf selecteren welk bestand u wilt importeren
in de R console. Dit doet u als volgt:
- Het databestand importeren:Voer de code read.csv(‘*naam van uw bestand*’) in. Bij het voorbeeld in afbeelding 4 wordt het bestand Bloemenverkoop.csv geïmporteerd. Hiervoor wordt de code read.csv(‘Bloemenverkoop.csv’) ingevoerd. Na het indrukken van Enter verschijnt de informatie uit het databestand in de R console.
Let op! De code die in R wordt ingevoerd is
hoofdlettergevoelig, ‘bloemenverkoop.csv’ wordt door R niet gevonden. Let
hierbij ook op dat de naam van het bestand tussen ‘aanhalingstekens’ is geplaatst.
2.
Een
variabele aanmaken voor het bestand:
De volgende stap is variabele aanmaken voor het databestand. In de Inleiding
wordt uitgelegd dat met R variabelen aangemaakt kunnen worden met de <- code.
Voor het databestand Bloemenverkoop.csv
wordt nu een variabele gemaakt. Dit gaat aan de hand van de volgende code:
Bloemenverkoop<-read.csv(‘Bloemenverkoop.csv’) [2] .
Het bestand Bloemenverkoop.csv wordt
door R nu niet langer meer gezien als een extern bestand, maar als een
variabele in deze sessie.
Het nut van een variabele aanmaken voor het bestand is dat nu niet meer de
steeds de code read.csv(‘Bloemenverkoop.csv’) ingevoerd moet
worden als u dit bestand wilt gebruiken. Nu er een variabele is aangemaakt voor
het bestand, hoeft u alleen maar Bloemenverkoop in te voeren om informatie
te weergeven over het bestand.
3.
Een
matrix maken van het databestand:
Door een matrix te maken van de zojuist aangemaakte variabele, kan de R
Console op een betere manier de data van de variabele lezen. Dit gaat eenvoudig
met de volgende code: attach(*Naam
van de variabele van het databestand*). In afbeelding 4 wordt de code attach(Bloemenverkoop)
gebruikt.
U kunt nu de categorieën van de variabelen op een eenvoudige manier weergeven
met R. Als u bijvoorbeeld informatie wilt over de categorie Tulpen wilt weergeven, voert u simpelweg
de code Tulpen in. U zult in het volgende hoofdstuk zien dat er vóór
de code Tulpen verschillende functies geplaatst kunnen worden om de
categorie tulpen te analyseren.
Afbeelding 4 Het importeren van een databestand, het aanmaken
van een variabele van het databestand en een matrix maken van het databestand.
|
Naar de volgende stap: 1.4 De basisfuncties van R voor het analyseren van data
[1]
Zoals in hoofdstuk 1.1 over de Working Directory wordt uitgelegd: De Working Directory is de map waar R zoekt
naar de databestanden om te lezen. De databestanden moeten dus in deze map
worden geplaatst om door R gevonden te worden.
[2] Het is niet noodzakelijk om de
variabele Bloemenverkoop te noemen.
Met de <- code
herkent R het databestand voor welke naam u het ook geeft. Bloemetjes <-
read.csv(‘Bloemenverkoop.csv’) kan bijvoorbeeld ook. De variabele heet dan in
het vervolg Bloemetjes.
Geen opmerkingen:
Een reactie posten