11.3.2 Robuste Maßzahlen
Die in diesem Abschnitt vorgestellten Maßzahlen sind robust gegenüber Ausreißern, d.h. starke Änderungen einzelner Datenwerte verändern diese Maßzahlen nicht oder nur wenig.
Vorgegeben sei eine Urliste
zu einer Stichprobe vom Umfang . Die Daten seien Merkmalswerte eines quantitativen Merkmals .
Info 11.3.7
Die durch aufsteigende Sortierung
der Urliste gewonnene Liste heißt die geordnete Liste oder auch geordnete Stichprobe (zur Urliste ). Der -te Eintrag in der geordneten Liste ist der -te kleinste Wert in der Urliste.
Beispiel 11.3.8
Betrachtet man wieder die Urliste zu der Stichprobe vom Umfang aus den vorangehenden Beispielen, so ergibt Sortieren die geordnete Stichprobe zu
Info 11.3.9
Der (empirische) Median , auch Zentralwert genannt, von Daten ist durch
definiert.
Im Gegensatz zum arithmetischen Mittel ist der (empirische) Median unempfindlich gegenüber Ausreißerdaten. Es kann z.B. der größte Wert in der Urliste beliebig vergrößert werden, ohne dass sich der Median ändert.
Beispiel 11.3.10
Im obigen Beispiel ist der Stichprobenumfang gerade, damit ergibt sich für den Median
Etwa die Hälfte der Daten in der Urliste sind kleinergleich und etwa die Hälfte der Daten in der Urliste sind größergleich als der Median . Dieses Prinzip kann man verallgemeinern, um Quantile zu definieren. Vorgegeben sei dazu eine Urliste zu einer Stichprobe vom Umfang eines quantitativen Merkmals .
Info 11.3.11
Es sei
die zugehörige geordnete Stichprobe und
Dann heißt
das Stichproben--Quantil oder einfach das -Quantil von .
Das -Quantil nennt man auch das untere Quartil. Es trennt in etwa das untere Viertel der Datenwerte ab. Das -Quantil nennt man entsprechend das obere Quartil. Für ergibt sich der Median, also . Ist , so wird die Datenreihe so aufgeteilt, dass etwa der Daten kleinergleich und etwa der Daten größergleich sind.
Beispiel 11.3.12
Vorgelegt sei wieder die Urliste zu der Stichprobe vom Umfang aus den vorangehenden Beispielen mit der zugehörigen geordneten Stichprobe
Für ist das -Quantil bestimmt durch , also ergibt sich für das untere Quartil
Für das obere Quartil setzen wir dagegen ein und erhalten , folglich
Vorgegeben sei wieder eine Stichprobe vom Umfang zu einem quantitativen Merkmal mit zugehöriger geordneter Stichprobe
und
Info 11.3.13
Das -getrimmte (oder auch -gestutzte) Stichprobenmittel ist definiert durch
Das -getrimmte Mittel ist ein arithmetischer Mittelwert, welcher die größten und die kleinsten Daten nicht in die Rechnung mit einbezieht. Es stellt somit ein flexibles Instrument zum Schutz gegenüber Ausreißern an den Rändern des Datenbereichs dar. Bei der Verwendung ist aber zu bedenken, dass nicht mehr alle ermittelten Daten in die Rechnung einfließen.
Beispiel 11.3.14
In dem schon mehrfach betrachteten Datensatz ist die geordnete Stichprobe gegeben durch
und für sowie erhalten wir das -getrimmte Mittel der Stichprobe zu
Es liegt niedriger als das arithmetische Mittel da zum Beispiel der Ausreißer ignoriert wurde.