If you're seeing this message, it means we're having trouble loading external resources on our website.

Wenn du hinter einem Webfilter bist, stelle sicher, dass die Domänen *. kastatic.org und *. kasandbox.org nicht blockiert sind.

Hauptinhalt

Quadratische Fehler der Regressionsgeraden

Einführung in die Idee, dass man eine Linie finden kann, die die quadrierten Abstände zu den Punkten minimiert. Erstellt von Sal Khan

Willst du an der Diskussion teilnehmen?

Noch keine Beiträge.
Verstehst du Englisch? Klick hier, um weitere Diskussionen auf der englischen Khan Academy Seite zu sehen.

Video-Transkript

In den nächsten Videos werde ich mich auf eine Reise begeben, In den nächsten Videos werde ich mich auf eine Reise begeben, die in einer Formel enden wird, die recht einfach anwendbar ist. Und in den meisten Statistik Vorlesungen wird man euch nur das Endprodukt zeigen Aber ich möchte euch zeigen, wie ihr dahin kommt. Aber ich muss euch warnen. Es wird eine Menge fiese Mathematik, vor allem fiese Algebra geben. Und am Ende geht es auch noch in die Analysis. Wir müssen ein paar partielle Ableitungen machen. Falls irgendetwas davon beängstigend klingt oder dich entmutigt, dann musst du das Video nicht ansehen. Du kannst einfach ans Ende springen und dort die Formel sehen, die wir uns herleiten. Für mich ist es aber immer spannend, die Formel tatsächlich herzuleiten. Los geht's: Sagen wir, wir haben n Punkte in einem Koordinatensystem. Sie müssen nicht alle im ersten Quadranten liegen. Aber um es uns einfach zu machen, zeichen ich alle in den ersten Quadranten. Sagen wir ich habe diesen Punkt hier. Ich mache sie in unterschiedlichen Farben. Sagen wir ich habe diesen Punkt hier. Und die Koordinate ist (x1, y1). Dann habe ich einen anderen Punkt hier. Dann habe ich einen anderen Punkt hier. Und die Koordinate ist (x2, y2). Und so kann ich weitere Punkte hinzufügen. Und noch mehr Punkte. Wir haben jede Menge Punkte. Hier und hier und hier. Ganz viele Punkte bis hin zum n-ten Punkt. Ganz viele Punkte bis hin zum n-ten Punkt. Vielleicht liegt er hier. Und wir nennen ihn einfach (xn, yn). Wir haben also n Punkte. Ich habe sie nicht alle gezeichnet, aber ich möchte jetzt eine Linie finden, die die quadrierte Entfernungen zu diesen Punkten minimiert. die die quadrierte Entfernungen zu diesen Punkten minimiert. Lasst uns diese Linie visualisieren. Lasst uns diese Linie visualisieren. Ich versuche, eine Linie zu zeichnen, die sich unseren Punkten annähert. So könnte die Linie aussehen. So könnte die Linie aussehen. Ich geb mein Bestes. So könnte es aussehen. Wobei... ich werde es etwas anders zeichnen. Vielleicht eher so. Ich weiß selbst nicht, wie es aussehen muss. Was wir jetzt machen, ist die quadrierte Entfernung von jedem dieser Punkte zur Linie zu minimieren. von jedem dieser Punkte zur Linie zu minimieren. Also, die Gleichung meiner Linie hier ist y = mx + b. Das kennt ihr aus Algebra 1. Hier ist die Steigung der Geraden, und das hier ist der Schnittpunkt mit der Y-Achse. Genauer gesagt ist das der Punkt 0, b hier vorn. Was ich jetzt machen möchte, ist genau das m und das b zu finden. m und b, die die Gerade definieren.... ...so, dass der quadrierte Fehler minimiert wird. Was meine ich mit "quadriertem Fehler"? Für jeden dieser Punkte besteht der Fehler in der vertikalen Distanz zwischen Punkt und Geraden. vertikalen Distanz zwischen Punkt und Geraden. Das hier nennen wir "Fehler 1". Das hier nennen wir "Fehler 1". Das hier wäre dann "Fehler 2". Es wäre die vertikale Distanz zwischen dem Punkt und der Geraden. Oder ihr könnt es euch vorstellen als der y Wert von diesem Punkt und der y Wert von der Geraden. Und so geht's weiter bis zum Ende zwischen dem y Wert von diesem Punkt und dem y Wert der Geraden. Also der Fehler hier, Fehler 1, entspricht genau diesem y Wert hier, diesem y1 minus diesem y Wert hier. Und wie nennen wir diesen y Wert? Hier haben wir x, das x1 entspricht. Und dieser Punkt auf der Geraden ist m x1 + b. Wenn ihr x1 in die Gleichung der Gerade einfügt bekommt ihr diesen Punkt hier. Es ist also gleich m x1 + b. Unser "Fehler 1" ist also: y1 - (mx1 + b). Und so können wir mit allen Punkten weitermachen. Der Fehler hier ist daher: y2 - (mx2 + b). Der Fehler hier ist daher: y2 - (mx2 + b). Dieser Punkt hier ist mx2 + b, also... ...einfach der Wert, wenn man x2 auf der Geraden abträgt. So so machen wir weiter bis zum n-ten Punkt. Unser "Fehler N" ist: yn - (mxn + b). Was wir jetzt machen könnten, wäre diese Fehler einfach zu addieren. Aber wir wollen ja den quadrierten Abstand von allen n Punkten zu der Linie minimieren. zu der Linie minimieren. Wir können den quadrierten Fehler der Linie definieren als gleich der Summe aller einzelnen quadrierten Fehler. Also unser "Fehler 1" hier y1 - (m x1 + b) Das werden wir jetzt quadrieren: Das werden wir jetzt quadrieren: (y1 - (m x1 + b))^2. Und jetzt quadrieren wir "Fehler 2". Fehler 2 ist: y2 - (m x2 + b). Fehler 2 quadriert: (y1 - (m x1 + b))^2. Und so weiter bis zu unserem n-ten Fehler. Und so weiter bis zu unserem n-ten Fehler. Und so weiter bis zu unserem n-ten Fehler. Der n-te Fehler ist: yn - (m xn + b) Und jetzt quadrieren wir das. Und jetzt quadrieren wir das. Der quadrierte n-te Fehler ist: (yn - (m xn +b))^2 Und in den nächsten Videos will ich nach genau dem m und b suchen, dass den quadrierten Fehler der Geraden minimiert. Nehmen wir es als Metrik dafür, wie gut die Linie zu den Punkten passt. Wir versuchen, die am besten passende Gerade zu finden, die am nächsten an allen Punkten liegt. Ich mache im nächsten Video weiter. Ich finde nämlich, dass es bei diesen fiesen Mathe-Aufgaben besser ist, ein Konzept nach dem anderen zu vermitteln. Das minimiert auch für mich die Wahrscheinlichkeit, dass ich Fehler mache. die Wahrscheinlichkeit, dass ich Fehler mache.