If you're seeing this message, it means we're having trouble loading external resources on our website.

Wenn du hinter einem Webfilter bist, stelle sicher, dass die Domänen *. kastatic.org und *. kasandbox.org nicht blockiert sind.

Hauptinhalt

Streuungsmaße: Spannweite, Varianz & Standardabweichung

Sal bespricht die drei geläufigsten Streuungsmaße! Erstellt von Sal Khan

Willst du an der Diskussion teilnehmen?

  • male robot hal style-Avatar für Benutzer David Berg
    Muss man die zahlen von den Quadraten mal 2 rechnen.
    (1 Bewertung)
    Default Khan Academy avatar-Avatar für Benutzer
Verstehst du Englisch? Klick hier, um weitere Diskussionen auf der englischen Khan Academy Seite zu sehen.

Video-Transkript

ok also ihr wisst ja jetzt es gibt so was wie die lager maß also arithmetisches mittel haben wir gelernt medien haben wir kennen gelernt damit versuchen wir irgendwie die mitte eines datensatzes zu erfassen jetzt ist aber so dass auch wenn zwei datensätze die gleiche mitte haben dann können sie immer noch sehr unterschiedlich sein und dafür schauen uns erst mal ein beispiel an denen jetzt mal fünf zahlen hier und der erste datensatz der hat die -10 dann die null die 10 20 und 30 und der zweite datensatz den nehmen wir mal hier in pink der hat die acht die ihnen 9 die zehn die elf und die 12 und jetzt habe ich am anfang überhaupt sich dass das arithmetische mittel bei beiden gleich ist das können wir mal ganz kurz nach rechnen das geht ja recht schnell dafür müssen wir die werte aufsummieren also müssen rechnet - 10 + 0 + 10 + 20 + 30 und das müssen wir da durch die anzahl der werte teilen das sind fünf werte und was kriegen wir hier raus - 10 und 10 kürzen sich weg kann man nur haben wir 20 bis 30 das sind 50 geteilt durch fünf sind 10 und ich zeige dass man vielleicht hier in grün 10 und bei dem anderen haben wir das gleiche verfahren wir müssen also rechnen 8 + 9 + 10 + 11 + 12 geteilt durch 35 8 und 12 ergibt zusammen 20 9 und 11 vergeben auch 20 also habe ich schon zwei mal zwanzig und vierzig dann auf +10 das sind 50 und wir haben wieder ihr 50 durch fünf das sind also auch 10 in diesem fall und wir sehen okay dass auch mädchen mittel ist tatsächlich gleich das gibt uns keine informationen darüber dass diese beiden verteilung eigentlich ganz unterschiedlich sind und was wir jetzt vielleicht mal machen können ist wir können die beiden erstmal ein zeichnen wir können vielleicht mal so ein bisschen grafisch darstellen dafür machen wir so ein kleines punkt diagramm in dem jesus achse die hoffentlich recht gerade ist - 10 muss die anfangen dann geht auf -5 0 5 10 15 20 25 und ich habe die aktie wieder wie immer viel zu groß gezeichnet egal vielleicht kann man hier ein bisschen wegradieren und jetzt zeichnen wir einfach mal beide beide daten setzt hier ein pdf steht bei der -10 den ersten punkt dann hatte einen punkt bei der 0 bei der 10 und das geht dann immer gleichmäßig gerade hoch in dem beispiel zumindest und der die zweiten punkte die haben hier in pink die liegen bei 8 das ist recht nah hier ich zeichne das mal ja ich zeigen sie mal auf die gleiche höhe das nicht zu verwirrungen kommt wir haben einen punkt bei acht ein punkt bei 9 dann einen punkt bei 10 einen punkt bei 11 und 1 bei 12 und spätestens jetzt merken wir diesen sehr sehr unterschiedlich diese verteilung und was ist denn daran unterschiedlich einfach mal darüber nachdenkt naja diese blauen punkte die scheinen viel weiter auseinander zu liegen die scheint viel weiter zu streuen sozusagen als die pinken punkte weil die echt eng beieinander sind und ich zeig mal kurz rein das mittel ist genau bei der 10 gut was können wir jetzt machen wenn wir so eine art streuung berechnen wollen also wie weit ist auseinander streut sage ich mal mit betonung auf weidmann könnte man auf die idee kommen dass man sich mal die spannweite anguckt die sogenannte spannweite das heißt wie weit sind diese punkte voneinander entfernen kleinsten und die größten punkte wie weit liegen die auseinander und die machen wir mal am schicken gelb es ist die spannweite und die berechnet sich wie ich gerade schon was ganz einfach wir nehmen den größten punkt 30 und ziehen davon jetzt hier die - 10 ab und schreibt man eine klammer dahin weil das ist ja - und - das heißt wir rechnen eigentlich nur den abstand aus zwischen dem größe und den kleinsten und 30 - - zählen das sind 30 plus 10 das sind in dem falle ihr 40 und das ganze können wir es mal bei dem anderen datensatz versuchen da haben wir als größte zahl die 12 wir haben jetzt 12 und müssen die kleinste zahl acht abzielt dass die zwölf -8 das sind dann in dem falle 4 und jetzt sehen wir schon jetzt langsam kriegt man hier einen unterschied raus jetzt ist nicht mehr alles leicht ist nicht mehr alles hier beides zehn sondern wir haben hier 40 und wir haben hier vier das ist das zehnfache davon okay das war s täuschend einfach zu berechnen und ja das ist auch nicht die beste variante weil stellen wir uns mal vor werden noch einen ganz großen wert dabei irgendwie 400 oder so dann würde dieses ganze konstrukt auseinanderbrechen wird die den größten wird hier von den 400 - 10 - - 10 hätten wir eine unglaublich großen wert weil das ganze halt nur auf diesen beiden werten hier beruht egal wie viele wörter zwischen liegen deswegen meist ganz schnell weg und deswegen gucken wir uns ein viel besseres maß an nämlich die varianz und falls ihr schon ein bisschen weiter der statistik seit dann dann werde ich jetzt mal dazu anmerken wir berechnen jetzt hier die population varianz also die von der grundgesamtheit nicht die von der stichprobe falls ihr noch nicht so weit in der statistik dann ignoriert das einfach wie berichtet jetzt die varianz ihr von und was ist mit der population der stichprobe auf mit sich zu tun hat das werdet ihr noch später lernen und was ist die idee von der varianz na ja wir haben gerade bei der spannweite festgestellt das ist so ein bisschen blöd ist nur den untersten und den obersten welt zu berücksichtigen deswegen versuchen wir jetzt was ganz ähnlich wie im europäischen mittel auch einfach alle werte zu berücksichtigen und gleich zu gewichten ich meine stellt euch mal so ein pendel vor oder eine feder und die schwingt hier rum dann ist sie diese streuung vom mittelwert viel größer als bei diesen daten das heißt wir werden es von dem mittelwert die quadraten distanzen zu den einzelnen punkten nehmen okay das klingt jetzt vielleicht ein bisschen ein bisschen ins bookeen bisschen aufwendig wir machen das einfach mal recht mal kurz aus okay wir wollen den quadraten abstand von minus zehn zu zählen das heißt wir nehmen - 10 - und jetzt mache ich noch hier das wieder in blau in grün das mädchen mittel - diese 10 und das wollen wir quartieren und jetzt machen wir weiter den nächsten punkt null - und jetzt wieder die 10 das auch wieder quittieren und der nächste punkt den wir haben ist hier die zehn das heißt wir hätten hier die 10 - die zehn quadrat dann haben wir die 20 dass wir dann jetzt hier 20 - 10 quadrat und wir haben die 30 das ist dann hier die obst es ist die falsche habe die 30 - die c-quadrat ok und das ganze teilen wir jetzt wieder wie bei dem arithmetischen mittel auch durch die anzahl der punkte so dass wir jetzt so eine art durchschnitt von den quadraten abständen bekommen gut warum quartieren wir das überhaupt das hat einen ganz einfachen grund wenn wir das nicht verlieren würden dann würden sich die sachen ja alle weg kürzen hatten wir hier minus 10 - zählen das wäre - 20 und hier oben 30 minus 20 und plus 20 und 40 weg kürzen da würde immer null rauskommen würde egal was ihr macht das 4 0 raus kommen deswegen vertrieben wird als hier im endeffekt einfach nur um es positiv zu bekommen okay aber klug von der rede rechnen wir einfach mal aus sie passiert wir hätten dann jetzt hier das ist gleich - 10 - 10 das sind minus 20 quadrat sind 400 plus und ich konnte mein bisschen runter da vielleicht ein bisschen platz brauchen werden 0 - zähne sind - 10 quadrat sind 100 + 10 - zählen sind 00 quadrat bleibt 0 + 20 10 das sind 10 und das quadrat sind wieder 100 + 30 - 10 sind 20 und 20 parat sind 400 und wenn wir das jetzt in fünf teilen dann bekommen wir aus das sind 400 + 100 das sind 500 fünfhundert das sind 1000 insgesamt 1000 durch fünf sind 200 und das symbol dafür das ist ein signal das ist ja so ein kleiner griechische buchstabe sondern so ein preis mit einem kleinen strich nach oben dran und das nehmen wir noch ein quadrat dahinter und warum nehmen wir das quadrat na ja weil ich ja auch die ganze quadrate geschrieben haben das ist nur das symbol lasst euch davon nicht verwirren und dass sie an diesem symbol noch im quadrat dran steht das hat gleich noch einen sinn dass wir gleich noch sehen aber zuerst müssen wir noch von dem anderen datensatz die die varianz berechnen und ich würde mal sagen ich gehe jetzt mal nicht nach oben und das nicht die ganze zeit hier so hin und her zu machen wir rechnen dass einfach so aus wir haben hier noch die werte stehen im endeffekt das sind einmal die acht - die c-quadrat plus die neun - die c quadrat und ich nehme jetzt die zehn die hier raus gekommen ist zufällig war es das gleiche die auch hier raus gekommen ist er nimmt als einfach nur den mittelwert von den daten + der nächste wert ist dann hier die die daten 10 sozusagen die daten 10 - die mittel werz 10 quadrat plus die elf haben wir noch - die c-quadrat plus die zwölf ist der letzte wert - die c-quadrat ok und was kommt dann hier raus 8 -10 das sind acht geteilt durch fünf ganz vergessen fünf weil wir hier fünf werte am 1 2 3 4 5 und was kommt dann daraus 8 -10 das sind minus 2 -2 quadrat sind vier plus 9 -10 das sind minus 1 und minus 1 grad wird dann zu 1 dann haben wir 10 - 10 das sind wieder 00 parat bleibt 0 dann haben wir hier wieder 11 - 10 sind 11 quadrat wissen wir schon ist eins und wir haben hier die 12 -17 das sind wieder zwei und 2 grad bleibt 4 und ich hoffe dass ich noch ein stückchen halt darunter wir teilen das ganze durch fünf dann haben wir stehen vier +1 das sind 5 da haben wir nochmal fünf das sind 10 insgesamt inzeller zehn geteilt durch fünf sind zwei und diese zwei sind dann wieder die varianz vom 22 datensatz das haben wir noch eine etwas unschöne sache dabei nämlich diese zahlen wir haben ja auch alle die haben auch alle eigentlich maße also zum beispiel kann man sagen das sind meter und das sind zum beispiel die distanzen die man bei einem die man mit einem ball werfen kann und der erste hat - 10 meter geworfen also in die falsche richtung geworfen dann hat einer 0 meter geworfen hat ihn gar nicht hochgekriegt den ball gab es zehn meter 20 meter und 30 meter sagen wir das sind meter zahlen und was passiert dann hier unten in der varianz naja wie wir gerade schon an diesem symbol gemerkt haben dass wird alles quadrat wir haben hier - 10 meter - 10 m ² also ist auch die einheit bleibt auch meter quadrat oder anders gesagt das sind quadratmeter wir haben eine varianz von 200 quadratmetern bei einheiten die in meter gegeben sind das ist ja das darf man keine vorstellung was es bedeutet wenn ich sage ja ich habe heute durchschnittlich zehn meter weit geworfen mit einer varianz von 100 quadratmetern oder so dann wird jeder direkt fragen hast du irgendwie so grundstück jetzt hier gekauft das 100 quadratmeter hat oder was das macht keinen sinn und eine ganz einfache art und weise die auch sehr verbreitet ist ist die standardabweichung auszurechnen standardabweichung und die ist unglaublich einfach zu berechnen wenn man die varianz hat weil sie ist einfach nur die wurzel aus der varianz die wurzel aus der varianz oder wenn wir das mal hier als als symbole aufschreiben die varianz haben wir als sie im quadrat bezeichnen jetzt sieht man quadrat dann könnt ihr euch schon vorstellen was das symbol der standardabweichung sein wird naja wurzel aus quadrath das ist dann einfach sigma so wird dann die standardabweichung bezeichnet das ist ganz praktisch dass es auch dann hierzu passt gut jetzt berechnen einfach mal die streichung der beiden datensätze bei dem ersten datensatz ergibt sich hier die wurzel aus und jetzt müssen wir die varianz einsetzen das waren 200 wurzel aus 200 gut ich will das kind ist kann ich jetzt auch nicht sagen das sind aber kann man sich ein bisschen vereinfachen das kann ihn schreiben als wurzel aus 2 x 100 und das sind dann wurzel aus 2 x 10 ich mache hier den haken runter wenn man das besser sieht wusste was zweimal 10 das sind dann genau das ist sigma und nur zwei sagt datensatz haben wir dann hier zwei das heißt wir hätten hier die wurzel aus und dann die 2 das wäre dann gleich sigma oder anders gesagt wir sind direkt fertig ok und die beiden werte die beiden werte nehmen wir jetzt mal mit nach oben die schreibe ich jetzt mal wieder oben darunter um zu zeigen dass es wirklich sinn macht dieses maß zu verwenden wir hatten hier oben einer standardabweichung bei dem ersten datensatz von zehn mal wurzel 2-sieg mal gleich zehnmal wurzel zwei und hinten hatten wir ein signal von wurzel zwei okay und man merkt schon zehnmal wurzel 2 ist offensichtlich das zehnfache von wurzel 2 also das hier ist das zehnfache von dem hier und warum macht das sinn naja aus einem ganz einfachen grund wir haben ja gesagt wir wollen dass diese abstände von dem mittelwert angucken damit haben wir angefangen bei der varianz und die abstände vom mittelwert gucken wie die uns doch einfach mal an denn die beiden datensätzen das wäre hier die - zählen das von 18-20 weit entfernt und hier ist die 810 zwei weit entfernt dass es genau das zehnfache und die haben wir die null die null ist von der 10.10 weit entfernt die 19 12 10 fährt der abstand ist hier also das kann man jetzt auch weiter rechnen immer das zehnfache hiervon und das spiegelt sich dann auch wieder an durchschnittlichen abstand die dabei wenn alle abstände das von in dieser datenreihe das zehnfache sind von den abständen in dieser datenreihe naja dann sollte auch in einem sinnvollen betreuungs master zu sagen diese streuung maße sich verzehnfachen und genau das passiert hier und das macht er irgendwie sind da ist der durchschnittliche abstand sich verzehnfacht wenn jeder einzelne abstand sich verzehnfacht und mit diesem mit diesen worten hier möchte ich euch dann entlassen was ihr euch mal vielleicht ein bisschen drüber nachdenkt oder ein paar aufgaben löst weil das ist wirklich ein ein maß was auf den ersten blick vielleicht ein bisschen schwierig scheint hier die ganzen quadrat zahlen auszurechnen und dann noch so eine große wurzel daraus zu ziehen um anhalt hier das sigma zu bekommen aber es macht wirklich sinn und es wird auch oft angewendet es gibt eigentlich also jeder der eine streuung ausrechnen und da gibt es ja erst siekmann und danach überlegt dass ich vielleicht doch noch eine spannweite so einbaut das ist wirklich sehr verbreitet und deswegen ist es auch wichtig dass man versteht wie das halt zustande kommt