If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Démonstration (1re partie) de la méthode des moindres carrés

Démonstration (1re partie) de la méthode des moindres carrés. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

alors dans la vidéo précédente on avait imaginé un nuage de prix un nuage de points au hasard quelconque et on avait essayé de le remplacer par une droite d'équations y égale mx plus près on avait ensuite exprimé la somme des carrés des erreurs de cette manière là donc c'était la somme des carrés des distances enfin de ses erreurs quand on remplace par le poids sur la droite voilà est donc le problème qu'on se pose c'est est je le rappelle c'est de trouver les valeurs de m et b qui vont rendre cette somme des carrés des erreurs minimale alors bon pour faire ça il va falloir qu'on utilise un peu de calcul différentiel donc qu'on fasse des dérivées partielles mais pour faire sa ba on va commencer par manipuler cette expression essayer de la transformer pour la rendre un peu plus un peu plus praticable donc là c'est ce qu'on va faire dans cette vidéo on va manipuler cette expression à faire que ça on va essayer de la transformer le plus possible on n'aura probablement pas fini dans cette vidéo là mais bon on va commencer alors la première chose qu'on peut faire quand on voit cette somme des carrés des erreurs qui est ici c'est la réécrire en développant ce qu'il ya dans les skis est élevée au carré un tous les termes qui sont élevées au carré donc je vais le faire ici alors j'ai d'abord ce premier terme cette première erreur l'a élevée au carré que je peux développer donc quand je la développe ça me donnait y au carré donc c'est exactement là je vais utiliser une identité remarquable à moimbé au carré donc ça fait y au carré - 2 x y un fois mx1 + b + le produit n x1 plus bu au carré voilà ça c'est la première la première parenthèse que j'ai juste développer alors maintenant je vais faire la même chose avec la deuxième en fait je vais pour que ce soit un peu plus simple que ça prenne moins de place et qu'ensuite on voit mieux les termes semblables je vais l'écrire en dessous donc ça va me faire ici c'est exactement la même chose utilise la même identité remarquable en fait je vais avoir exactement la même expression sauf que à la place de y un je vais avoir y de et à la place de lixin je vais avoir x2 mais si on développe tout bêtement cette expression là on obtient sa y 2 o car est moins deux fois y 2 fois mx2 + b + mx2 plus b élevée au carré voilà et puis je fais ça avec tous les termes qui sont ici que j'ai pas noté mais bon avec le terme l'erreur 3 l'erreur 4 et ainsi de suite donc je vais noter comme ça jusqu'à l'erreur n élevée au carré qui est là donc celle là je vais la faire par ce sera la dernière donc c'est exactement le même terme mais avec à la place de y de j'aurais y est né à la place de x2 je vais avoir hippiques scène enfin si on développe cette expression là on va obtenir exactement y n o car est moins deux y n facteur de mxn + b + mxn plus b le tout est élevée au carré voilà alors bon là c'est un premier pas ce qu'on peut faire maintenant c'est continuer à développer donc ici il ya des choses qu'on peut distribuer ici on peut développer ces termes qui sont élevées au carré donc on va le faire je remonte encore un petit peu pour passe perdre je vais notées çà c'est la somme des carrés des erreurs par rapport à la droite d'équations y égale mx puce b alors je vais maintenant écrire en gardant les couleurs je vais développer complètement ce premier terme donc j'ai d'abord y ait au carré ensuite là je vais développer ça ça fait moins 2 y un fois m x x 1 - 2 y un mx1 ensuite je développe ici avec ce terme là - de y un b et puis je vais maintenant développer cette parenthèse alors ça c'est une identité remarquable aussi ça me donne m 2 x 1 au carré +2 mx1 b + b au carré voilà alors je vais faire la même chose avec le terme que j'ai écrit en rouge c'est l'erreur 2 je vais juste la développer encore plus alors ici je vais avoir exactement la même chose mais avec y de la place de grecs 1 et x2 à la place de x16 on si on le développe comme on a fait tout à l'heure on retrouvera exactement ça c'est à dire y 2 o car est pardon - 2 y 2 mx2 ça c'est cette partie là ce - 2 y 2 fois mx 2 - 2 y 2 x b ensuite plus m au carré x x 2 au carré plus 2m x x 2 b + b au carré voilà alors je continue à faire ça pour tous les autres termes qui sont là donc pour le terme l'erreur 3 1 que je développe j'obtiendrai le même terme que ça mais avec y 3 à la place de y 2 et x3 la place de x2 et ainsi de suite je fais ça pour tous les termes donc je vais le matérialiser comme d'habitude avec des petits points jusqu'au dernier qui est celui ci le terme l'erreur haine que je vais être développée donc je vais avoir y n o car est moins deux y n fois m x x n moins de six grecs n x b + m au carré fois xn vos carrés plus 2m x x n b + b au carré voilà ça c'est exactement cette ce terme si anvers que j'ai re développer complètement voilà alors je veux remonte pour faire un peu de place et comme d'habitude je vais renault tessa pour pas qu'on se perde voilà donc ça c'est toujours la somme des carrés des erreurs je la note en colonne parce que tu vas voir pourquoi maintenant je vais continuer en fait ce que je vais faire c'est que là je vais regrouper les termes semblables donc je vais en fait additionner faire cette addition là mais en colonne donc je vais commencer par additionner cette partie ces termes là alors je vais te rentrer entre parenthèses donc j'ai d'abord y un au carré plus y 2 o car est plus mon y aurait ici grecs 3 au carré et plus y 4/4 et puisse ainsi de suite jusqu'à y n y n au carré voilà ça c'est ce terme que j'ai encadré en orange c'est cette somme de termes là alors je vais faire maintenant la même chose pour les termes qui suivent alors je vais prendre cette couleur blanche si je vais maintenant regroupé ces termes là alors ce que je peux voir c'est que là il ya moins deux fois n x y 1 x x 1 là aussi j'ai moins deux fois m x y deux fois x2 et puis en fait dans chaque terme j'ai le facteur moins deux fois m piètre qui apparaît donc je vais pouvoir le mettre en facteur donc ça me donnait moins de zen facteur de alors le premier terme qui va rester ici c'est 6 factories - 2 mg il me reste plus y un x y x x 1 donc j'ai ici y 1 x x un plus pour le second terme j'ai factoriser - 2ème donc il me reste aussi y deux fois x2 et puis ainsi de suite jusqu'au 1e terme à chaque fois je peux factoriser - 2 m donc il me reste ici me resterait y deux plus fois y x x 3 pardon ensuite y 4 x x 4 et ainsi de suite jusqu'au dernier où il me reste y n x x n voilà ça c'est donc cette somme là ici ce terme là c'est donc la somme de ces termes là que j'ai en tout entouré en blanc alors je vais continuer avec les termes qui sont ici je fais rien d'autre que réorganiser ces sommes là on procède en colonnes par colonne et puis en factories ans que je peux factoriser ici là je peux j'ai moins 2 y un fois bel âge et -2 ixe deux fois b ici j'aurais moins deux y 3 x b et ainsi de suite jusqu'à -2 y n x b donc moins 2 b c'est un facteur commun à tous ces termes là donc je vais le mettre en facteurs ça va me donner moins de bep en par an entre parenthèses je vais avoir ici y 1 je vais respecter les couleurs donc ici y un plus là il va me rester dans ce terme là j'ai factoriser moins de b donc il me reste y de plus ici me resterait y-3 plus y 4 et ainsi de suite jusqu'au dernier donc plus y n voilà pas pris la bonne couleur y n voilà donc ce terme là c'est celui que j'ai encadré ici en violet alors je continue je pas se décourager c'est un peu fastidieux mais bon c'est assez mécanique elle quand même donc c'est pas trop trop difficile là je vais m occuper maintenant de ces termes là ces termes là si donc la gmf car fox11 au carré ici gm haut careï x x 2 au carré là j'aurais mot car fo x3o car et ainsi de suite jusqu'au dernier où gm au carré x x n o car est donc m o car est un facteur donc je peux factoriser m au carré voilà il me reste pour le premier me reste icsa au carré x1 au carré pour le deuxième qui est celui là il reste 6 2 au carré donc j'ajoute x2 au carré pour le troisième et me resterait x3 au carré donc la joue très x3 au carré et ainsi de suite jusqu'au dernier où il me reste x n o car donc je vais faire comme ça + x men au carré voilà alors comme d'habitude je me suis trompé de couleur c'est ça donc ce terme là en rose c'est celui que j'ai encadré ici alors maintenant je vais me débrouiller avec ces termes qui sont là plus c'est toute cette colonne là alors ici j'ai 2 mx 1 fois bel âge et 2 x 2 x b ici j'aurais 2m x 3 x b et ainsi de suite jusque là où j'ai deux mxn x b alors je peux mettre 2 ème fois béant facteurs donc je vais le faire ici + 2 mbj acteurs de alors il va me rester ici x1 seulement x1 plus le deuxième reste x 2 plus le troisième ça serait x3 et ainsi de suite jusqu'au dernier ce terme s'ils restent x n voilà quand je re développe je trouve bien cette colonne l'a donc ce terme si c'est bien le terme que j'ai encadré ici alors ensuite il me reste plus que le dernier alors le dernier c'est un peu plus facile parce que ici gb au carré plus bo carey plus bo carré puce dockers fait la g n ligne puisqu'il ya une terme on voit bien avec une ligne 2 ligne 3 ligne 4 ligne ainsi de suite jusqu'à cette ligne là qu'est la énième donc ici j'ai bien une ligne donc en fait ce que je fais c'est ajouter bo carré n fois de suite donc finalement ce que j'obtiens c'est plus n x b au carré ça c'est cette somme qui est là alors voilà j'ai uniquement manipuler l'expression que j'avais au départ qui était celle là celle ci ici j'ai tout développé le plus possible et puis j'ai fait des regroupements pour avoir cette expression là de la somme des carrés des erreurs alors bon tu vas dire que t'as pas l'air tellement plus simple qu'avant à faire un peu plus compliqué même peut-être mais bon on va s'arrêter là pour cette fois ci mais tu vas voir dans la prochaine vidéo va continuer à manipuler cette expression pour pouvoir s'en servir pour arriver à notre notre but c'est à dire à minimiser cette somme des carrés des erreurs