median(x) gibt den Median zurück, also den Wert, der an mittlerer Position steht, wenn man die Zahlen der Größe nach ordnet. Bei einer geraden Anzahl wird der Mittelwert der beiden mittleren Zahlen.

Wie auch bei den anderen einfachen Statistik- und Aggregationsfunktionen wie sum, mean, var können mit dem Parameter na.rm=TRUE die fehlenden Werte ignoriert werden. Andernfalls geben diese Funktionen NA zurück, wenn nur einer der Werte NA ist.

Der Median ist ziemlich robust gegenüber Ausreißern (siehe Beispiel) und ist daher in Datensätzen mit Ausreißern zu bevorzugen. Wer mehr wissen will, schaut mal in den Wikipedia-Artikel zum Median.

Mathematisch ist der Median auch definiert für nicht-numerische ordinale Variablen, also für Variablen, die zwar geordnet werden können, aber eben keine Zahlen sind. Unklar ist aber, welcher Wert bei einer geraden Anzahl an Werten der Median ist, es kann ja kein arithmetisches Mittel gebildet werden. Es wird dann je nach Definition der Ober- oder Untermedian verwendet. Das ist aber in Standard-R nicht umgesetzt, dafür benötigt ihr das Package DescTools. Achtung: In dem Package ist die Funktion Median() großgeschrieben. Im Beispiel-Code seht ihr die Anwendung.

 

Beispiel-Code für median