11.3.3 Streuungsmaße
Mittelwerte und Quantile sind Lagemaße, d.h. sie sagen etwas über die absolute Lage der qualitativen Werte aus. Addiert man zu jedem eine Konstante , so erhöhen sich auch die Lagemaße um . Streuungsmaße sind dagegen Maßzahlen, die etwas über die Streuung oder relative Verteilung der Datenwerte aussagen, unabhängig von ihrer absoluten Lage. Vorgegeben sei eine Stichprobe vom Umfang zu einem quantitativen Merkmal . Die Urliste sei .
Info 11.3.15
Die Stichprobenvarianz zur Urliste ist
Die Stichprobenstandardabweichung ist definiert durch .
Die Stichprobenvarianz ist ein Streuungsmaß, welches die Variabilität einer Beobachtungsreihe beschreibt. Je kleiner die Varianz, desto „näher" sind die Datenwerte beieinander. die Varianz ist nur möglich, wenn alle Datenwerte gleich sind. Sie steigt mit zunehmendem typischerweise stark an, die Standardabweichung ist ein besserer Maßstab um die „Weite" der Verteilung der Datenwerte einzuschätzen. Die beiden Formeln haben ein paar Tücken:
- Um die Varianz ausrechnen zu können, muss der Mittelwert schon bekannt sein.
- Die Tatsache, dass in der Definition von durch und nicht durch das zunächst naheliegende dividiert wird, hat tieferliegende mathematische Gründe, die erst in den Statistikvorlesungen behandelt werden können.
- Die Schreibweise ist ein wenig irreführend, man darf das Quadrat nicht mit der Wurzel kürzen, denn tatsächlich muss man erst ausrechnen (und dieser Wert ist nicht als Einzelquadrat definiert), um bestimmen zu können.
- Vorsicht ist bei der Benutzung eines Taschenrechners mit Statistikfunktionen geboten: Die Stichprobenvarianz erhält man mit der Taste , die Taste liefert dagegen die Summe mit Nenner statt , das ist nicht die Stichprobenvarianz.
Beispiel 11.3.16
Die Datenreihe besitzt den Mittelwert und die Stichprobenvarianz
Hinzufügen von weiteren Nullen zur Datenreihe verändert das Lagemaß nicht, sehr wohl aber das Streuungsmaß , da dann mehr Datenwerte in der Mitte konzentriert sind. Dagegen verändert das Verschieben aller Datenwerte um eine Konstante die Varianz nicht, beispielsweise besitzt auch die Datenreihe die Varianz .
Aufgabe 11.3.17
Eine Datenreihe (mit einer unbekannten Anzahl von Werten habe die Maßzahlen , und den Median . Angenommen eine zweite Datenreihe erfüllt die Gleichung für jedes , wie lauten dann ihre Maßzahlen?
Antwort: Die Maßzahlen sind , und .
Hinweis: Untersuchen Sie in den Definitionen des Mittelwerts, der Stichprobenvarianz und des Medians, wie sich die Multiplikation aller -Werte mit auf den gesamten Term auswirkt.