If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Démonstration (2e partie) de la méthode des moindres carrés

Démonstration (2e partie) de la méthode des moindres carrés. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

alors on va reprendre ce qu'on avait commencé à faire dans les deux précédentes vidéos alors je rappelle un petit peu ce qui s'était passé on avait pris un nuage de points et puis on avait essayé de la proximité de leurs en place de le modéliser plutôt par une droite donc on avait essayé de trouver une droite qui ajustait bien les données alors cette droite on lui avait donné une équation y égaler m'excuse p et puis on avait calculé la somme des carrés des erreurs inquiéter ici est en fait dans la vidéo précédente donc ça c'est la somme des carrés des erreurs quand on qu'on fait quand on remplace un point par le même le point sur la droite par le point de même abscisse qui est située sur la droite voilà alors ce qu'on avait fait dans la vidéo précédentes s'étaient transformées c'était quoi cette expression là de la somme des carrés des erreurs on l'avait fait petit à petit ça c'était tout le travail qu'on avait fait et on était arrivé à 7 à cette expression là de la somme des carrés des erreurs effectivement c'est pas une expression tellement plus simple mais tu vas voir que là on va continuer ce travail et qu'on va finalement arriver à quelque chose de quand même beaucoup plus facile à appréhender alors bon on va continuer à faire un petit peu comme avant c'est à dire qu'on va prendre les termes semblables séparément alors déjà si on regarde ce premier terme là c'est la somme des carrés d y des données y alors si on veut calculer la moyenne en fait de ces carrés des données y comment est ce qu'on ferait eh bien on écrirait que la moyenne d y au carré on peut la notte comme ça c'est la moyenne des carrés d y est bien ça serait y ait au carré plus y 2 o car est plus ainsi de suite jusqu'à y n au carré voilà / n alors ça sert exactement là ce qu'on appelle la moyenne des cars et des grecs c'est exactement ça on calcule tout la somme de tous les grecs au carré et on divise par haine non vraiment ça alors maintenant ce qu'on peut remarquer c'est que si on multiplie tout cette expression par n on va voir ça on va avoir que n fois la moyenne d y au carré et bien c'est y un au carré plus y 2 o car est plus ainsi de suite jusqu'à y n au carré voilà alors ça veut dire que finalement cette expression lacs étangs part entre parenthèses et bien je peux la remplacer par alors je vais le faire par sa toute cette partie là cn fois y deux fois la moyenne soit la moyenne des carrés des y donc ça c'était quelque chose qui va être un peu plus simple au fait je vais pouvoir faire ça pour pratiquement tous les autres termes ici quand j'écris y un an je vais le faire un petit à petit quand j'écris je vais prendre cette parenthèse là aussi j'écris y un x1 plus y 2 x 2 plus ainsi de suite jusqu'à y n x n y n x n est que je divise sa part n par le nombre de données en fait qu'est-ce que je vais obtenir je vais obtenir alors ici j'ai la somme des produits des x y quand je divise parraine j'obtiens la moyenne de la des produits d xy donc j'obtiens exactement ce que je peux appeler comme ça x y barcella moyenne des produits des x y voilà alors maintenant comme tout à l'heure quand je multiplie c'était cette identité là par n je vais avoir que n fois la moyenne des produits des x y et bien c'est tout simplement la somme des produits t x y donc c'est y un x x 1 + x y un y deux pardon x x 2 plus ainsi de suite jusqu'à y n + y n x x n donc là encore cette expression qui est ici l'expression qui est dans cette parenthèse et bien en fait je peux l'écrire beaucoup plus il simplement en disant que ces haines fois la moyenne des produits des x y voilà alors là exactement de la même manière on peut on reconnaît que ça c'est la somme des y la somme des données y donc c'est une fois la moyenne d y donc ça je peux le décrire indirectement cette parenthèse la cn fois la moyenne d y que je note comme ça alors on peut continuer et on peut remarquer que ici ce qu'on a exactement la même manière que tout à l'heure là on a mixé au carré +62 au carré +63 au carré ainsi de suite jusqu'à +6 n o car est en fait on à la moyenne des carrés des grecs dx pardon on à la moyenne des carrés des x 10 x n puisque si je prends la moyenne des carrés des x je vais avoir cette somme lagon hickson carey +62 au carré +1 jusqu'à x n o car est / n donc là comme j'ai pas / n ça c'est exactement n fois la moyenne des x 2 au carré voilà alors là je peux continuer ça c'est ce qu'il ya dans cette parenthèse là on voit assez facilement ça c'est une fois la moyenne des x donc cm x x barre voilà hélas ce terme la cnb au carré alors maintenant on va régresser un peu plus proprement d'après ce qu'on vient de voir la somme des carrés des erreurs par rapport à la droite d'équations y égaler mix plus b eh bien ça va être ce terme là que j'ai simplifié en écrivant que cpn fois la moyenne des grecs au carré - 2ème c'est ce produit-là x lettre la parenthèse qui est là que j'avais simplifiée en disant que c'était n fois la moyenne des produits x y voilà et puis ensuite - 2b fois cette parenthèse là qui est la haine fois la moyenne des y ensuite j'ai ce terme là alors ce terme là c'est plus m au carré fois cette parenthèse qui en fait on avait vu que c'était une fois la moyenne des xo carré n fois la moyenne dxo carré voilà et puis j'essaie deux termes là qui reste alors j'ai ensuite +2 mbl type lié par cette parenthèse là et on avait vu que cette parenthèse là c'était n x x bar là qu'est la moyenne des x et enfin je dois ajouter le terme qui reste donc c'est plus n x b au carré voilà alors là on a quand même une expression qui est beaucoup plus simple c'est celle là qu'on va utiliser maintenant en fait on a terminé la partie quel travail algébrique sur l'expression de la somme des carrés des erreurs on va utiliser ça maintenant dans la prochaine vidéo pour terminer le travail c'est à dire maintenant ce qu'on doit faire c'est optimiser enfin plus exactement minimiser cette cette somme des carrés des erreurs donc trouver les valeurs de m et b qui vont faire en sorte que cette somme des carrés des erreurs soient minimales donc ça 7 cette expression là c'est l'expression la plus simple de la somme des carrés des erreurs qu'on va utiliser ensuite pour chercher les deux valeurs de 2m et b qui vomit qui vont la minimiser alors il ya une erreur qui est très fréquentes l'erreur qu'on fait très fréquemment c'est que ici on a employé des lettres x et y est que habituellement en algèbre les lettres xy ça dénote les variables hors ici c'est pas du tout le cas elle élevait les lettres x et y sont des données se sont pas des variables en fait on connaît la valeur de cette moyenne là on connaît la valeur de cette moyenne la la valeur de cette moyenne là on connaît tous les termes qui sont en xy on les connaît on connaît aussi le terme en n est du coup en fait il faut vraiment faire attention à bien voir cette expression la commune une expression de vade var et des deux variables n et b ce sont sa nos deux variables et en fait cette expression là elle va représenter une surface dans un espace en trois dimensions donc je vais je vais essayer de le représenter c'est pas évident je vais essayer de le faire alors je vais tracé des axes déjà donc je peux par exemple tracé comme ça l' axe qui va porter la valeur m la variable m ici je vais tracé lac ce qui va porter la valeur b voilà et puis je vais faire un troisième axe alors celui là je vais faire en jaune ça va être la laque ce qui porte la hausse verticale qui va porter la somme des carrés des erreurs justement alors bon évidemment il faudrait prolonger les axes donc ça alors ça c'est lac ce qui porte la valeur m saks et lac ce qui porte la valeur b et ça ça va être lac ce qui porte la somme des carrés des erreurs ici je peux évidemment prolonger cet axe là un jeu ferme pro tiller pour que soient un peu plus clair voilà et de même celui ci se prolonge en dessous de ce premier quartier voilà alors en fait à chaque fois que je prends une valeur de m et de b quand je prends une valeur de m et deux b par exemple si je prends cette valeur là de m et cette valeur là de b je vais avoir un point un point ici sur le plan mb et avec ces deux valeurs là on va avoir une valeur de la somme des carrés des heures donc finalement on va avoir ici alors je vais le faire peut-être en rose comme ça on va avoir un point un point ici qui représentera la somme des carrés des erreurs pour ses valeurs la 2ème et de paix alors si on fait ça pour toutes les valeurs de m et de b eh bien on va avoir une surface en fait alors je vais essayer de la trace et c'est pas très très facile à faire en fait ça va être une surface qui va avoir une forme un peu comme comme un bol un petit peu je vais essayer de la tracé alors je vais prendre une couleur un peu visible donc ça va être une surface qui va être à peu près comme ça voilà et e voilà dix ans que c'est comme ça ici cette partie là là que je vais assurer sa c'est ça c'est l'extérieur convoi de l'ex qu'on la partie qu'on voit de l'extérieur et puisque je vais assurer alors je vais prendre du orange ce que j'assure ici c'est la partie intérieure donc voit l'intérieur de la surface comme ça il faut l'imaginer qui se prolonge puisque on prend toutes les valeurs de m et de b donc c'est une forme qui n'a pas de fin en fait donc ce qu'on va essayer de faire dans la prochaine vidéo c'est de trouver en fait les valeurs de m et b qui nous donne le point le point le plus faible la valeur minimale de la surface donc la valeur minimale de la somme des carrés des erreurs alors si tu connais si tu as déjà fait du calcul en plusieurs variables tu as tu vas se facilement comprendre ce qu'on doit faire ici on voit prendre l'expression de la somme des carrés des erreurs et puis trouver les dérivées partielles d'abord par rapport à m et ensuite par rapport à b donc on va calculer la seule à dire la dérive et partielle de la somme des carrés des erreurs par rapport à m et puis là dérivées partielles de la somme des carrés des erreurs par rapport à b et ensuite on va demander que ces deux quantité ces deux dérivées partielles soit nul on va chercher les points qui annule ses deux dérivées partielles alors ça c'est ce qu'on fera dans la prochaine vidéo bomb site une n'est pas familier avec le calcul en plusieurs variables que quelques différentiel en plusieurs variables c'est pas très grave ce qu'il faut comprendre c'est que quand on dérive par rapport à une variable en fait on considère l'autre comme étant constante donc par exemple ici quand on va dériver par rapport à m on va supposer que b dans cette expression là est constant donc on dérive exactement comme habituellement en considérant que la seule variable cn est donc en quelque sorte en serait en se réduit à une fonction d'une seule variable et on sait que le minimum il est atteint enfin extrême homme est atteint quand la dérive et s'annule exactement ce qu'on obtiendra en faisant ça et puis on fait la même chose avec l'autre variable donc en supposant quand on va dériver par rapport à b on va supposer que m et constant donc on dérive cette expression là etc ac te ment comme on l'aurait fait si cette expression là n'avaient que la variable b et à ce moment là on sait que la valeur minimale s'obtient quand cette dérive est nul voila enfin bon ça c'était assez rapidement dit on ne fera dans la prochaine vidéo un peu plus dans le détail là je vais je vais m'arrêter pour aujourd'hui