Hauptinhalt
Statistik und Wahrscheinlichkeitsrechnung
Kurs: Statistik und Wahrscheinlichkeitsrechnung > Lerneinheit 5
Lektion 5: Mehr zur RegressionBeweis (Teil 3) Minimieren des quadratischen Fehlers der Regressionsgeraden
Beweis (Teil 3) Minimieren des quadratischen Fehlers der Regressionsgeraden. Erstellt von Sal Khan
Willst du an der Diskussion teilnehmen?
- Where is video No.2?(1 Bewertung)
Video-Transkript
Also, wo wir aufgehört hatten, wir hatten unseren vereinfachten algebraischen Ausdruck für den
quadratischen Fehler der Linieder n Datenpunkte. Wir haben es visualisiert. Dieser Ausdruck hier würde
eine Oberfläche sein, denke ich. Du könntest es als Oberfäche in drei dimensionen sehen, wo für ein beliebiges m und b ein
Punkt auf dieser Oberfläche ist repräsentiert den Quardrat-fehler dieser Linie. Unser Ziel ist es, die m finden und
die b, die eine Definition würde aktuelle Zeile, dass minimieren
der quadratische Fehler. Die Art und Weise, die wir tun, ist, dass wir
finden Sie eine Stelle, an der die teilweise Ableitung des quadratischen Fehlers
in Bezug auf m 0, und die partielle Ableitung
in bezug auf B ist auch gleich 0. So ist es flach mit
in Bezug auf m. Das heißt also, daß die Steigung
in diese Richtung wird flach. Lass es mich tun in der
gleichen Farbe. Also die Neigung in diese Richtung,
das ist der Teil- Ableitung
m, wird flach. Es wird sich nicht ändern
in dieser Richtung. Die partielle Ableitung
nach b wird flach. So wird es eine flache Punkt sein
gleich dort drüben. Die Steigung an diesem Punkt, dass
Richtung wird auch 0 sein können, und das ist unser Minimalpunkt. Also lassen Sie uns herausfinden, die m und
b ist, die uns diese zu geben. Also, wenn ich die teilweise zu übernehmen
Derivat dieser Ausdruck in Bezug auf m. Gut, das erste Glied hat
keine m Begriffe in ihm. Also ist es eine Konstante aus der
Sicht des m. Zur Erinnerung, Teil
Derivate, es ist wie nehmen eine regelmäßige Derivat. Du bist nur davon aus, dass
alles, aber die variable daß du tust, die teilweise
Ableitung, Sie tun alles, was unter der Annahme,
sonst ist eine Konstante. Also in diesem Ausdruck die ganze
x ist, die y ist, die b zu, die n ist, das sind alles konstant. Die einzige Variable, wenn wir
die partielle Ableitung in Bezug auf m, dass
matters ist der m. Das ist also eine Konstante. Es gibt keinen m hier. Dieser Begriff rechts über
hier, wir nehmen in Bezug auf m. So der Ableitung dies mit
in Bezug auf m, es ist die Art von Koeffizienten auf der m. So negativ 2 mal n mal die
bedeutet der xy ist, das ist, die teilweise von diesen
in Bezug auf m. Dann ist dieser Begriff oder rechts
hier hat keine Ms darin. So ist es konstant ist
in Bezug auf m. So seine partielle Ableitung
in Bezug auf m 0 ist. Dann ist dieser Begriff hier aus haben Sie
n mal der Mittelwert der x Quadrat mal m im Quadrat. Also das wird be-- wir sind
sprechen von einem Teil Ableitung nach M--
so, es wird 2 mal n mal dem Mittelwert der
x [? squareds?] mal m. Das Derivat der m im Quadrat ist
2m, und dann müssen Sie nur noch dieser Koeffizient
auch dort. Nun ist diese Sicht auch
eine m drüben. Also mal sehen, alles, was
andere ist nur eine Art von Koeffizienten auf dieser m. So ist die Ableitung
m ist 2 Milliarden Male der Mittelwert der x. Wenn ich nahm das Derivat von 3m,
das Derivat ist nur 3. Es ist nur der Koeffizient
auf sie. Schließlich ist dies eine konstante
in Bezug auf m. Wir wissen also nicht sehen. Das ist also der Teil-
Ableitung bezüglich m. Das ist richtig da drüben. Wir wollen diesen Satz
gleich 0. Nun wollen wir das gleiche tun
in Bezug auf b. Dieser Begriff ist, erneut
eine Konstante der Perspektive b. Es gibt kein b hier. Es gibt kein b hier. So der partiellen Ableitungen
besteht, dass dies mit in Bezug auf b 0. Dann über hier haben Sie einen
Negativ 2n mal der Mittelwert y ist als Koeffizient auf einem b. Also die partielle Ableitung
in Bezug auf b sein wird minus 2n, oder negative 2n-mal
der Mittelwert der y-Werte. Dann gibt es keine b hier. Dann haben wir ein b hier. So ist es zzgl 2mn Zeiten
der Mittelwert der x. Dies ist im wesentlichen
der Koeffizient auf der b hier. Es wurde in einer gemischten Reihenfolge geschrieben,
aber alle von diesen sind Konstanten von dem Punkt
Blickwinkel b. Sie sind die Koeffizient
vor dem b. Die partielle Ableitung daß
in Bezug auf b ist nur werde der Koeffizient ist. Dann schließlich die Teil
Derivat dieser mit in Bezug auf b wird 2nb zu sein,
Oder zur ersten 2Nb Sie könnte sogar sagen. Wir wollen diesen Satz
gleich 0. So sieht es sehr kompliziert. Aber denken Sie daran, wir versuchen nur,
um für die m zu lösen und b 's. Wir haben zwei Gleichungen mit
zwei Unbekannten hier. Wir haben die m und dann
wir haben die Bs. Um dies zu vereinfachen, beides
Gleichungen, eigentlich das obere und die untere
einen sind beide Seiten teilbar durch 2n. Ich meine, 0 teilbar ist
durch nichts. Es wird nur 0 sein. Also lassen Sie teilen den oberen Gleichung
und von 2n und sehen, was wir bekommen. Wenn wir den Top-Gleichung durch
2n, dies werde nur 1 zu werden. Das geht weg, und dann
diejenigen weg. Sie würden nur mit gelassen werden
negativen fache der mittleren, die negativer Mittelwert der XY-plus
m-mal der Mittelwert der x squareds, plus b-fache der mittleren
der x gleich 0 ist. Das ist diese erste Ausdruck
wenn Sie beide Seiten aufteilen, indem negativen 2n. Der zweite Ausdruck wird
werden, wird diese verschwinden. Dies ist, wenn Sie teilen
durch 2n. Ich will nicht sagen,
negativen 2n. Wenn Sie dies unterteilen durch 2n,
das wird verschwinden, die gehen wird entfernt, und dann diejenigen,
gehen weg. Sie sind nur mit der linken
negativer Mittelwert der y plus m-fache der mittleren der x
plus b gleich 0 ist. Also, wenn wir die m und b
Werte, die das System zu befriedigen von Gleichungen, die wir minimiert haben
der quadratische Fehler. Wir konnten einfach lösen
in traditioneller Weise. Aber ich möchte diese umzuschreiben,
weil ich denke, es ist irgendwie ist interessant zu sehen, was diese
wirklich repräsentiert. So fügen wir diese Mittel
der xy ist, um sowohl Seiten dieser Gleichung oben. Was haben wir bekommen? Wir bekommen das m-fache des Mittelwertes
die x [? squareds?] plus b mal dem Mittelwert der
x ist gleich, das sind gehen zu heben, ist gleich
dem Mittelwert der Xy. Das ist, dass Top-Gleichung. Diese untere Gleichung, rechts
Hier fügen wir den Mittelwert von y zu beiden Seiten der
diese Gleichung. Ich das tun, damit, dass
aufhebt. Und dann sind wir mit M-- links
Ich werde das in die blaue Farbe zu tun Sie die gleiche equation-- um zu zeigen,
wir m-mal die bedeutet der x plus b gleich
dem Mittelwert der y-Werte. Nun, ich wirklich wollen,
erhalten diese beiden in mx plus b Form. Dies ist tatsächlich
schon da. Eigentlich können Sie sehen, dass, wenn
unsere besten passende Linie wird sein y gleich MX plus b--
wir müssen noch die zu finden m und die b-- aber wir sehen auf
, dass am besten passende Linie, weil der m und B, dass
erfüllen beides Gleichungen sein werden
das m und b auf, dass am besten passende Linie. So dass am besten passende Linie
tatsächlich enthält den Punkt, und wir diese erhalten von der zweiten
Gleichung hier richtig. Es enthält den Punkt. Ich sollte es auf diese Weise zu schreiben. Das Koordinaten Mittelwert von x Mittelwert
y liegt auf der Linie. Und Sie können es sehen konnte,
Recht hier. Legt man den Mittelwert von x in diesem
für die optimale m und b, Sie gehen zu bekommen
der Mittelwert der y. Also das ist interessant. Diese optimale Linie. Vergessen wir nie, was wir sind
selbst zu tun versuchen. Diese optimale Leitung an gehen
enthalten einige Punkt auf es-- lassen mir zu tun, dass in einem neuen Farbe--
es geht um einige enthalten verweisen darauf, dass hier ist
der Mittelwert aller x Werte und der Mittelwert
alle y-Werte. Das ist einfach interessant. Es Art von Sinn macht. Es Art von macht intuitive
Sinn. Nun ist diese andere Sache, nur um
Art bekommen es in der gleichen Sicht. Dann wird es tatsächlich zu einem
Art einen einfacheren Weg zu lösen das System. Sie könnten diese eine Million zu lösen
verschiedene Wege. Aber nur um uns eine Intuition geben
von dem, was noch ist denn hier ist was ein anderes
Punkt, der auf der Linie ist? Denn wenn Sie zwei Punkte
auf der Linie, wissen Sie, was die Gleichung der Geraden
es wird. Nun, die andere Punkt wollen wir
dies im mx plus b Form. Lassen Sie uns also Dividieren Sie beide Seiten
diese Gleichung durch diesen Begriff genau hier, durch die
Mittel der x 's. Wenn wir das tun, m-mal so erhalten wir
der Mittelwert der x [? squareds?] geteilt durch den Mittelwert der x
plus b gleich dem Mittelwert ist, die xy hat durch die geteilte
bedeutet der x. Also, wenn Sie es in diesem Schreiben
Form, das ist der gleiche Gleichung, dass ich einfach geteilt
beide Seiten durch die mittlere der x, ein anderer erhalten Sie
Interessant, dass Will auf dieser optimale Pass liegen
Leitung, zumindest von dem Punkt, Sicht des quadrierten
Distanzen. Also ein weiterer Punkt, der liegen wird
darauf auf dieser optimale Linie, der x-Wert sein wird,
Damit der Mittelwert der x [? squareds?] dividiert durch die mittlere
der x. Dann wird der y-Wert auf geht
ist der Mittelwert der Xy dividiert durch die mittlere
der x. Ich werde dich zu denken lassen
, dass ein wenig mehr. Aber schon, das ist eigentlich
die zwei Punkte, die auf der Lüge Linie, so dass diese beiden auf die
am besten passende Linie auf, wie wir messen eine gute Passform,
das ist der quadratische Abstand. Diese sind auf der Linie
dass zu minimieren dass quadratischen Abstand. Was werde ich in der nächsten tun
Video und diese dreht in wie ein sechs oder sieben Video
Saga auf den Versuch, die beweisen, am besten passende Linie oder der Suche nach
Die Formel für die am besten passende Linie. Aber es ist interessant. Es gibt alle möglichen Arten von
nette kleine mathematische Dinge hier nachzudenken. Aber im nächsten Video, können wir
tatsächlich verwenden diese Informationen. Wir konnten einfach gelöst haben
das System gerade nach oben. Aber wir können tatsächlich nutzen diese
Informationen hier zu Lösung für unsere m und b ist. Vielleicht werden wir es in beide Richtungen zu tun
abhängig von meiner Stimmung ab.