If you're seeing this message, it means we're having trouble loading external resources on our website.

Wenn du hinter einem Webfilter bist, stelle sicher, dass die Domänen *. kastatic.org und *. kasandbox.org nicht blockiert sind.

Hauptinhalt

Beweis (Teil 3) Minimieren des quadratischen Fehlers der Regressionsgeraden

Beweis (Teil 3) Minimieren des quadratischen Fehlers der Regressionsgeraden. Erstellt von Sal Khan

Willst du an der Diskussion teilnehmen?

Verstehst du Englisch? Klick hier, um weitere Diskussionen auf der englischen Khan Academy Seite zu sehen.

Video-Transkript

Also, wo wir aufgehört hatten, wir hatten unseren vereinfachten algebraischen Ausdruck für den quadratischen Fehler der Linieder n Datenpunkte. Wir haben es visualisiert. Dieser Ausdruck hier würde eine Oberfläche sein, denke ich. Du könntest es als Oberfäche in drei dimensionen sehen, wo für ein beliebiges m und b ein Punkt auf dieser Oberfläche ist repräsentiert den Quardrat-fehler dieser Linie. Unser Ziel ist es, die m finden und die b, die eine Definition würde aktuelle Zeile, dass minimieren der quadratische Fehler. Die Art und Weise, die wir tun, ist, dass wir finden Sie eine Stelle, an der die teilweise Ableitung des quadratischen Fehlers in Bezug auf m 0, und die partielle Ableitung in bezug auf B ist auch gleich 0. So ist es flach mit in Bezug auf m. Das heißt also, daß die Steigung in diese Richtung wird flach. Lass es mich tun in der gleichen Farbe. Also die Neigung in diese Richtung, das ist der Teil- Ableitung m, wird flach. Es wird sich nicht ändern in dieser Richtung. Die partielle Ableitung nach b wird flach. So wird es eine flache Punkt sein gleich dort drüben. Die Steigung an diesem Punkt, dass Richtung wird auch 0 sein können, und das ist unser Minimalpunkt. Also lassen Sie uns herausfinden, die m und b ist, die uns diese zu geben. Also, wenn ich die teilweise zu übernehmen Derivat dieser Ausdruck in Bezug auf m. Gut, das erste Glied hat keine m Begriffe in ihm. Also ist es eine Konstante aus der Sicht des m. Zur Erinnerung, Teil Derivate, es ist wie nehmen eine regelmäßige Derivat. Du bist nur davon aus, dass alles, aber die variable daß du tust, die teilweise Ableitung, Sie tun alles, was unter der Annahme, sonst ist eine Konstante. Also in diesem Ausdruck die ganze x ist, die y ist, die b zu, die n ist, das sind alles konstant. Die einzige Variable, wenn wir die partielle Ableitung in Bezug auf m, dass matters ist der m. Das ist also eine Konstante. Es gibt keinen m hier. Dieser Begriff rechts über hier, wir nehmen in Bezug auf m. So der Ableitung dies mit in Bezug auf m, es ist die Art von Koeffizienten auf der m. So negativ 2 mal n mal die bedeutet der xy ist, das ist, die teilweise von diesen in Bezug auf m. Dann ist dieser Begriff oder rechts hier hat keine Ms darin. So ist es konstant ist in Bezug auf m. So seine partielle Ableitung in Bezug auf m 0 ist. Dann ist dieser Begriff hier aus haben Sie n mal der Mittelwert der x Quadrat mal m im Quadrat. Also das wird be-- wir sind sprechen von einem Teil Ableitung nach M-- so, es wird 2 mal n mal dem Mittelwert der x [? squareds?] mal m. Das Derivat der m im Quadrat ist 2m, und dann müssen Sie nur noch dieser Koeffizient auch dort. Nun ist diese Sicht auch eine m drüben. Also mal sehen, alles, was andere ist nur eine Art von Koeffizienten auf dieser m. So ist die Ableitung m ist 2 Milliarden Male der Mittelwert der x. Wenn ich nahm das Derivat von 3m, das Derivat ist nur 3. Es ist nur der Koeffizient auf sie. Schließlich ist dies eine konstante in Bezug auf m. Wir wissen also nicht sehen. Das ist also der Teil- Ableitung bezüglich m. Das ist richtig da drüben. Wir wollen diesen Satz gleich 0. Nun wollen wir das gleiche tun in Bezug auf b. Dieser Begriff ist, erneut eine Konstante der Perspektive b. Es gibt kein b hier. Es gibt kein b hier. So der partiellen Ableitungen besteht, dass dies mit in Bezug auf b 0. Dann über hier haben Sie einen Negativ 2n mal der Mittelwert y ist als Koeffizient auf einem b. Also die partielle Ableitung in Bezug auf b sein wird minus 2n, oder negative 2n-mal der Mittelwert der y-Werte. Dann gibt es keine b hier. Dann haben wir ein b hier. So ist es zzgl 2mn Zeiten der Mittelwert der x. Dies ist im wesentlichen der Koeffizient auf der b hier. Es wurde in einer gemischten Reihenfolge geschrieben, aber alle von diesen sind Konstanten von dem Punkt Blickwinkel b. Sie sind die Koeffizient vor dem b. Die partielle Ableitung daß in Bezug auf b ist nur werde der Koeffizient ist. Dann schließlich die Teil Derivat dieser mit in Bezug auf b wird 2nb zu sein, Oder zur ersten 2Nb Sie könnte sogar sagen. Wir wollen diesen Satz gleich 0. So sieht es sehr kompliziert. Aber denken Sie daran, wir versuchen nur, um für die m zu lösen und b 's. Wir haben zwei Gleichungen mit zwei Unbekannten hier. Wir haben die m und dann wir haben die Bs. Um dies zu vereinfachen, beides Gleichungen, eigentlich das obere und die untere einen sind beide Seiten teilbar durch 2n. Ich meine, 0 teilbar ist durch nichts. Es wird nur 0 sein. Also lassen Sie teilen den oberen Gleichung und von 2n und sehen, was wir bekommen. Wenn wir den Top-Gleichung durch 2n, dies werde nur 1 zu werden. Das geht weg, und dann diejenigen weg. Sie würden nur mit gelassen werden negativen fache der mittleren, die negativer Mittelwert der XY-plus m-mal der Mittelwert der x squareds, plus b-fache der mittleren der x gleich 0 ist. Das ist diese erste Ausdruck wenn Sie beide Seiten aufteilen, indem negativen 2n. Der zweite Ausdruck wird werden, wird diese verschwinden. Dies ist, wenn Sie teilen durch 2n. Ich will nicht sagen, negativen 2n. Wenn Sie dies unterteilen durch 2n, das wird verschwinden, die gehen wird entfernt, und dann diejenigen, gehen weg. Sie sind nur mit der linken negativer Mittelwert der y plus m-fache der mittleren der x plus b gleich 0 ist. Also, wenn wir die m und b Werte, die das System zu befriedigen von Gleichungen, die wir minimiert haben der quadratische Fehler. Wir konnten einfach lösen in traditioneller Weise. Aber ich möchte diese umzuschreiben, weil ich denke, es ist irgendwie ist interessant zu sehen, was diese wirklich repräsentiert. So fügen wir diese Mittel der xy ist, um sowohl Seiten dieser Gleichung oben. Was haben wir bekommen? Wir bekommen das m-fache des Mittelwertes die x [? squareds?] plus b mal dem Mittelwert der x ist gleich, das sind gehen zu heben, ist gleich dem Mittelwert der Xy. Das ist, dass Top-Gleichung. Diese untere Gleichung, rechts Hier fügen wir den Mittelwert von y zu beiden Seiten der diese Gleichung. Ich das tun, damit, dass aufhebt. Und dann sind wir mit M-- links Ich werde das in die blaue Farbe zu tun Sie die gleiche equation-- um zu zeigen, wir m-mal die bedeutet der x plus b gleich dem Mittelwert der y-Werte. Nun, ich wirklich wollen, erhalten diese beiden in mx plus b Form. Dies ist tatsächlich schon da. Eigentlich können Sie sehen, dass, wenn unsere besten passende Linie wird sein y gleich MX plus b-- wir müssen noch die zu finden m und die b-- aber wir sehen auf , dass am besten passende Linie, weil der m und B, dass erfüllen beides Gleichungen sein werden das m und b auf, dass am besten passende Linie. So dass am besten passende Linie tatsächlich enthält den Punkt, und wir diese erhalten von der zweiten Gleichung hier richtig. Es enthält den Punkt. Ich sollte es auf diese Weise zu schreiben. Das Koordinaten Mittelwert von x Mittelwert y liegt auf der Linie. Und Sie können es sehen konnte, Recht hier. Legt man den Mittelwert von x in diesem für die optimale m und b, Sie gehen zu bekommen der Mittelwert der y. Also das ist interessant. Diese optimale Linie. Vergessen wir nie, was wir sind selbst zu tun versuchen. Diese optimale Leitung an gehen enthalten einige Punkt auf es-- lassen mir zu tun, dass in einem neuen Farbe-- es geht um einige enthalten verweisen darauf, dass hier ist der Mittelwert aller x Werte und der Mittelwert alle y-Werte. Das ist einfach interessant. Es Art von Sinn macht. Es Art von macht intuitive Sinn. Nun ist diese andere Sache, nur um Art bekommen es in der gleichen Sicht. Dann wird es tatsächlich zu einem Art einen einfacheren Weg zu lösen das System. Sie könnten diese eine Million zu lösen verschiedene Wege. Aber nur um uns eine Intuition geben von dem, was noch ist denn hier ist was ein anderes Punkt, der auf der Linie ist? Denn wenn Sie zwei Punkte auf der Linie, wissen Sie, was die Gleichung der Geraden es wird. Nun, die andere Punkt wollen wir dies im mx plus b Form. Lassen Sie uns also Dividieren Sie beide Seiten diese Gleichung durch diesen Begriff genau hier, durch die Mittel der x 's. Wenn wir das tun, m-mal so erhalten wir der Mittelwert der x [? squareds?] geteilt durch den Mittelwert der x plus b gleich dem Mittelwert ist, die xy hat durch die geteilte bedeutet der x. Also, wenn Sie es in diesem Schreiben Form, das ist der gleiche Gleichung, dass ich einfach geteilt beide Seiten durch die mittlere der x, ein anderer erhalten Sie Interessant, dass Will auf dieser optimale Pass liegen Leitung, zumindest von dem Punkt, Sicht des quadrierten Distanzen. Also ein weiterer Punkt, der liegen wird darauf auf dieser optimale Linie, der x-Wert sein wird, Damit der Mittelwert der x [? squareds?] dividiert durch die mittlere der x. Dann wird der y-Wert auf geht ist der Mittelwert der Xy dividiert durch die mittlere der x. Ich werde dich zu denken lassen , dass ein wenig mehr. Aber schon, das ist eigentlich die zwei Punkte, die auf der Lüge Linie, so dass diese beiden auf die am besten passende Linie auf, wie wir messen eine gute Passform, das ist der quadratische Abstand. Diese sind auf der Linie dass zu minimieren dass quadratischen Abstand. Was werde ich in der nächsten tun Video und diese dreht in wie ein sechs oder sieben Video Saga auf den Versuch, die beweisen, am besten passende Linie oder der Suche nach Die Formel für die am besten passende Linie. Aber es ist interessant. Es gibt alle möglichen Arten von nette kleine mathematische Dinge hier nachzudenken. Aber im nächsten Video, können wir tatsächlich verwenden diese Informationen. Wir konnten einfach gelöst haben das System gerade nach oben. Aber wir können tatsächlich nutzen diese Informationen hier zu Lösung für unsere m und b ist. Vielleicht werden wir es in beide Richtungen zu tun abhängig von meiner Stimmung ab.