If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Démonstration (3e partie) de la méthode des moindres carrés

Démonstration (3e partie) de la méthode des moindres carrés. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

alors on reprend là où on en était resté donc on avait réussi à exprimer cette somme des carrés des erreurs de cette manière là de manière un peu plus simple en fonction des paramètres m et b qui sont les coordonnées de la droite qu'on cherche à déterminer alors montez rappelle le prince et le problème c'est qu'on doit minimiser de cette somme des carrés des erreurs alors on avait réussi à visualiser sa la dernière dans l'autre vidéo j'avais expliqué un petit peu ça on s'était dit que finalement on pouvait représenter cette cette somme des carrés des erreurs comme une surface à chaque fois que surface dans un espace à trois dimensions à chaque fois qu'on prend une droite donc on fixe des valeurs de m et de b parce que ça c'est important à chaque fois qu'on prend une valeur de m et de b en fait on fixe on prend une droite une droite comme celle ci donc c'est d'équations y égaler n'excuse b donc quand on m'a alors je reviens en bas donc prendre une valeur de 2 m et 2 b ça revient à choisir une droite et à chaque fois qu'on a pris ses valeurs on peut calculer la somme des carrés des erreurs qui est qui est ici donc en fonction de m et de b alors quand on fait ça pour toutes les valeurs de m et deux b on obtient 7 sur une surface qu'il ya une forme peu de ce genre là voilà est donc le problème ça va être de trouver le minimum de cette surface c'est à dire qu'on va essayer de déterminer les valeurs de m et de baies pour lesquels la somme des carrés des erreurs est minimale alors j'avais expliqué que pour ça il fallait trouver les valeurs de m et de béquilles annuler les deux dérivées partielles dérivées partielles de la somme des carrés des erreurs par rapport à n doit être nul et la dérivées partielles des de la somme des carrés des erreurs doit par rapport à b peut être nul aussi 1 alors si je prends on dira que c'est ce point ici qui est le minimum donc dire que en ce point si la dérive et partielle de la somme des carrés des erreurs par rapport à m et nul ça veut dire que la tangente en se pointent dans la direction de m elle est horizontale et puis si je m'occupe de cette partie là de dérivées partielles de la somme des carrés des erreurs par rapport à ben et demandé qu'elle soit nul ça veut dire que la dent ce point si la tangente dans la direction de bva être horizontale aussi donc finalement en ce point ci qui est le minimum de la surface on va avoir un pain implantant gens qui sera horizontale en parallèle au plan mb voilà bon maintenant on va se lancer dans les calculs alors je te rappelle j'en avais je l'avais déjà un petit peu dit dans la vidéo précédente quand on dérive une expression de plusieurs variables ici il ya deux variables m et b et bien quand on dérive une expression de plusieurs variables par rapport à une variable ici n par exemple eh bien en fait ça il faut qu'on considère tous les autres termes comme étant constant donc tous les termes où n'apparaît pas à la variable par rapport à laquelle on dérive et vont être considérée constant donc on va le faire ici alors je vais d'abord calculé la dérive et partielle de la somme des carrés des erreurs par rapport à m alors ça ça me donne ici le d'abord dérivés c'est comme d'habitude un jeu dérive là je fais la somme des dérivés un donc je vais d'abord dérivés ce terme là ce terme là ne contient pas la variable n donc il faut le considérer comme constant d'ailleurs de toute façon il contient pas la variable mais non plus donc celui ci est vraiment une constante c'est une donnée du problème donc sa dérivée nuls dérivés par rapport à m nuls ici par contre on a moins 2 ème fois n fois la moyenne des produits grecs alors ça 1 - 2 l oms et le dérivé par rapport à m ça va être moins deux et puis en fait ce terme qui est là ce terme qui est la haine fois la moyenne des produits xy et bien il ne contient pas la variable n donc on va le considérer comme constant donc en fait ça va être un coefficient il faut le considérer comme un coefficient de mi6 donc quand on dérive tout ça on obtient moins de la dérive et de -2 mc - deux fois le coefficient ici n x x y barre voilà ensuite on a de celui qui est ici alors là on a moins 2 b n y barre ça c'est un terme constant puisqu'il contient pas à la variable n donc quand on va dériver par rapport à m ça va donner 0 donc je le note pas ensuite on a celui ci et mocquard et fois n fois la moyenne des x au carré alors ce terme là en violet et bien on va le considérer comme constant puisqu'il contient pas la variable donc en fait il faut le considérer comme un coefficient 2 ème au carré alors quand on dérive m au carré par rapport à m et bien on obtient de zen qu'il faut ensuite x ce coefficient là donc ça me donne plus 2 zem fois n fois la moyenne des x au carré voilà ensuite on a ce terme si + 2 mb fois n fois la moyenne des x alors deuxième on scelle dérivés quand on dérive par par rapport à m ça fait deux et puis ce terme l'abbé fois n fois la moyenne des x est un terme qu'on doit considérer comme constant donc on doit le considérer comme un coefficient 2 ème aussi donc finalement la dérive et de ce terme là c2b nxp art et puis enfin le dernier terme une fois bo car elle ne contient pas la variable m donc quand on va le dérivé par n ça va donner 0 donc ça je ne note pas donc voilà ça c'est la dérive est l'expression de la dérivée de la somme des carrés des erreurs par rapport à m et on veut que ça se soit nul donc là on a déjà une première équation en d'inconnus n -b alors on va faire maintenant la même chose avec la dérivées partielles par rapport à b donc on va dériver la somme des carrés des erreurs par rapport à b alors je fais exactement comme tout à l'heure le premier terme ici ne contient pas la variable b donc ça dérivés par rapport à b et nul ici dans ce terme si la variable b n'apparaît pas non plus donc ça dérivés par rapport à b va être nul ici par contre on a moins deux baies donc quand on dérive - 2b par rapport à b nous reste moins deux et puis ce terme la haine fois la moyenne d y bien c'est un terme qu'on doit considérer constant comme un coefficient en fait donc il nous reste ici - de zen y barre voilà ensuite ce terme là ne contient pas la variable b donc sa dérive et par rapport à b va être nul ici on a par contre 2 mb fois n x x barre alors 2ème il faut le considérer comme constant n x x barre il faut qu'on continue de considérer comme constant ici donc on a en fait un coefficient qui est deux m x nx bar x b donc quand on dérive par rapport à b il nous reste 2 m nxp barre voilà et puis enfin le dernier terme alors le dernier terme c'est on va dériver par rapport à b quand on est né constant donc content dérive bo carré par rapport à b on obtient deux baies donc ici on va avoir plus de b&n voilà ça c'est la dernier partiel de la somme des carrés des erreurs par rapport à b et on veut que ça se soit nul donc là on a réussi à obtenir deux équations en n&b toutes les deux donc un système de deux équations à 2,5 à deux inconnues qu'on va pouvoir résoudre parler mais par deux tables méthodes différentes d'ailleurs dans tout cas des méthodes assez classique donc je vais réécrire ce système là de manière classique alors voilà donc je vais écrire la première équation mais quand même remarquer que tous les termes ici sont divisibles par deux n celui là il est divisé par deux en suis là aussi puisque et de haine et celui là aussi donc je vais tout divisé par 2 n alors ça me donne moins x y bar plus la moyenne bx au carré fois m + b fois la moyenne des x b x barre et ça c'est égal à zéro puisque quand on divise par 0 par deux n on obtient 0 alors je vais maintenant réécrire la deuxième équations et en remarquant là aussi que je peux divisé tous les termes par deux n donc je vais tout divisé par 2 n aussi ça me donne moins y bach y bar plus alors ici va me rester m x x bar plus m x x bar plus p et ça ça doit être égale à zéro voilà donc j'ai un peu simplifié le système je vais faire un peu de place alors on peut le résoudre comme je disais tout à l'heure de plusieurs façons différentes par des techniques classiques d'algèbre maintenant ce n'est pas inintéressant de s'arrêter un petit peu sur ce système est de regarder ce qu'on a on alors je vais de réécrire pour qu'on voit un peu plus clair mais je vais le réécrire en en faisant en transformant encore un petit peu ici je peux faire passer ceux - xy barre de l'autre côté c'est à dire qu'en fait j'ajoute xy bar aux deux membres de cette équation l'a donc ici quand je fais plus xy bar - xy baril va me rester 0 enfin ça va ça nul et donc ensuite il me restera x au carré bar fois m + b x x barre donc je vais l'écrire x au carré barre alors m xo carré bar plus b x x barre et ça ça va être égal à zéro + xy bas puisque j'ai ajouté xy barre des 2 côtés donc en fait ça va être égal à x y barre voilà maintenant je vais faire la même chose avec ce terme là je vais ajouter ici y je vais je vais faire passer ce mois y barre de l'autre côté en ajoutant y barre des 2 côtés un don qui va me rester ici m x x bar plus b égale y barre alors là on peut remarquer quelque chose de très intéressant c'est cette deuxième équation alors si on revient un petit peu en haut notre équation l'équation de la droite dont on essaie de déterminer l'équation les valeurs m et les paramètres m et b eh bien c'était y égalem x + b hélas qu'on a là ce qu'on a ici c'est y bat régal mx bar plus b ça veut dire que alors c'est cette équation là qui va nous permettre de dire que le point g alors je l'appelle g c'est moi qui l'appelle comme ça qui a coordonné x barre et y barre donc les moyennes des deux séries de données x et y et bien ce point g il appartient à la droite il appartient à la droite d'ajustement voilà alors ça c'est intéressant je vais remonter encore là haut ça c'est intéressant parce que ça veut dire que cette droite qui va ajuster au mieux le nuage de deux points eh bien elle va passer par le point moyen c'est-à-dire le point je vais le noter ici en violet ce point là j'ai c'est le point qui a coordonné x par la moyenne des x et y barça devient un petit peu difficile à lire mais bon voilà donc ce point moyen est un point de la droite quand on cherche l'équation alors ça c'est intéressant nous ce même assez intuitif 1 que de se dire que la droite qui va ajuster au mieux le nuage de points eh bien elle va passer par le point moyen donc le point dont les coordonnées sont les deux moyennes c'est ça se comprend quand même alors je redescend donc ça c'était une première je remarque intéressante aux sages répète il suffit de le voir ainsi je prends l'équation la droite d'équations y égale mx plus b et bien quand je remplace x par exemple j'obtiens y bas rhin c'est ce que nous dit cette équation là donc ça c'était une chose intéressante alors bon j'ai dit droite d'ajustement en fait cette droite là puisque on essaie de minimiser la somme des carrés des erreurs en fait cette droite là on va l'appeler plus tôt là je vais je vais effacer ça on va l'appeler la droite des moindres carrés c'est le nom qu'on lui donne et alors je vais l'écrire c'est la droite des moindres carrés puisque c'est la droite qui minimisent la somme des carrés des erreurs alors voilà on a obtenu un point de cette droite des moindres carrés maintenant on peut en obtenir un deuxième avec avec la deuxième équation alors ça une fois qu'on aura deux points on aura en fait vous pourra déterminer facilement l'équation de la droite je répète on aurait pu prendre ce système et le résoudre par des manières que manière classique sans se préoccuper de trouver des points mais c'est intéressant l'a27 ça donne ça donne une idée un peu plus intuitive de ce que c'est que cette droit des moindres carrés quand on arrive à déterminer des points alors ici pour trouver un autre point à partir de cette équation là en fait il faudrait arriver à écrire avec avoir ici 2 côté là quelque chose du style est une fois quelque chose plus b donc pour faire ça en fait on va diviser par ce terme là par la moyenne des x on va / ça donc ça va me donner alors c'est cette équation là qui me donne n jeudi visait tout paris x barre donc gm x x au carré bar / x bar plus du coup b x x bar / x pardon qu'il reste cb égal à x y bar / x barre voilà et l'âge obtient un deuxième point qui appartient à la droite des moindres carrés c'est donc le point je veux tu peux l'appeler moi je vais pas lui donner de nom à celui là le point moyen on l'appelle est très souvent le point g mail à celui ci c'est un point qui a des cas coordonnées alors son apsys c'est quoi ces x carré bar / x barre et puis sont ordonnées c'est cette expression là donc c'est x y bar sur x barre voilà donc ce point là il appartient aussi à la droite des moindres carrés voilà donc on n'a finalement pas encore déterminé l'équation de la droite des moindres car est donc on n'a pas encore déterminé les valeurs de m et b qui minimisent la somme des carrés des erreurs mais on a quand même déjà trouvé deux points qui appartiennent à cette droite donc c'est déjà un gros pas alors dans les prochaines vidéos c'est qu'on va continuer le travail en fait on pourrait le faire de deux manières on verra peut-être qu'on fera les deux manières une manière qui consisterait à réduire résoudre ce système j'ai déjà dit et à trouver les valeurs de m est une expression des valeurs de m et de baies et une deuxième méthode qui serait de trouver l'équation de la droite qui passe par ces deux points là voilà donc ça c'est le programme de la prochaine vidéo