heute trage ich im R-Bite mal zusammen, wie ihr in R Spalten eines data.frames auswählen könnt. Es gibt nämlich eine ganze Menge davon. Eigentlich ist die Vielfalt ja toll und man hat selbst sowieso eine Lieblingsmethode. Auf der anderen Seite macht es das Lesen von R-Code von anderen manchmal ganz schön schwer. Aber schaut selbst:
Inhalt
Indizes
#erste Spalte iris[,1] #erste bis dritte Spalte iris[,1:3] #erste und fünfte Spalte iris[,c(1,5)]
Spaltennamen
colnames(iris) #die Spalte Sepal.Length. Praktisch, weil Ergänzung mit TAB iris$Sepal.Length #das gleiche iris[,"Sepal.Length"] #zwei Spalten per Name auswählen iris[,c("Sepal.Length","Sepal.Width")]
Bedingungen
iris[,grepl("Sepal",colnames(iris))]
Subset
subset(iris,select=c(Sepal.Length))
Dplyr: select
Die Syntax aus dem Tidyverse
library(dplyr) select(iris, Sepal.Length,Sepal.Width) #oder mit pipe-Schreibweise iris %>% select(Sepal.Length,Sepal.Width)
Data.Table
Das Package Data.Table ist ziemlich schnell, wenn es um größere Datenmengen geht.
library(data.table) #in data.table konvertieren dt <- as.data.table(iris) dt[ , .(Sepal.Length,Sepal.Width)]
Viel Spaß beim Coden!
LERNE DATA SCIENCE mit R
Ein Data Science Experte ist in der heutigen datengetriebenen Welt viel gefragt. Mit der entsprechenden Erfahrung kann man sich den gutbezahlten, interessanten Job aussuchen. In meinem Onlinekurs Data Science mit R lernst Du die Grundlagen.