Contenu principal
5e année secondaire - 4h
Cours : 5e année secondaire - 4h > Chapitre 1
Leçon 5: Évaluer l'adéquation de la droite des moindres carrés- Calculer et interpréter les résidus
- Approche intuitive du coefficient de détermination R²
- R-carré ou le coefficient de détermination
- Calcul du coefficient de détermination R carré
- Interprétation des résultats de la régression effectuée sur ordinateur
- Représentation graphique des résidus
- Effets des valeurs influentes
Calcul du coefficient de détermination R carré
Calcul du R carré pour juger du bon ajustement aux données de la droite de régression . Créé par Sal Khan.
Vous souhaitez rejoindre la discussion ?
Pas encore de posts.
Transcription de la vidéo
alors dans une vidéo précédentes on avait calculé la droite des mois des moindres carrés de ce nuage de points qui est ici là on avait ce nuage de 4 points et on avait trouvé la pente hélas hélas l'ordonné à l'origine de la droite des moindres carrés alors la pente c'était 41 sur 42 et la droite dès lors donné à l'origine c'était moins 5 sur 21 donc je vais l'écrire cette douce est cette équation de droite donc la droite des moindres carrés de ce nuage que du traceur rouge c'est y égale 41 sur 42 x x plus fin moins 5 sur 21 - 5 sur 21 voilà alors ce qu'on va faire maintenant dans cette vidéo s'est essayé de calculer le coefficient de détermination de cette droite pour essayer de mesurer la qualité de notre ajustements alors je vais le faire avec un tableur puisque avec la calculatrice on peut le faire mais avec le tableur c'est quand même plus pratique donc je vais le faire ici alors je vais commencer par saisir les données dans les colonnes donc déjà j'aimais donné 2 x mais données de y ici donc ça ça va être la psy c'est leur donner de chaque point ici je vais mettre la valeur l'ordonné du point qui appartient la droite des moindres carey cap 6 x donc je veux c'est là je vais l'appeler traditionnellement direct chapeau mais je ne sais pas comment faire des chapeaux ici donc c'est y jeu l'appeler comme ça y est toile donc ça c'est le point de la droite qui à absys x droite des moindres carrés ensuite ici je vais mettre le carré de l'erreur alors je vais l'écrire comme ça on a pleuré j'ai un peu le carré de l'erreur par rapport à la droite des moindres carrés j'ai un petit peu ça en fait je mesure l'erreur au carré que je fais quand je remplace le nuage de poids par par la droite donc là ici je vais m par contre le carré de l'erreur de y par rapport à la moyenne par rapport à la moyenne d y voilà alors donc je vais commencer par remplir donc ça c'est lénine en tête de ces met en tête de colonne je vais mettre ça sent très bon milieu voilà alors ici je vais rentrer les valeurs des abscisses de mes points donc le premier point c'est celui ci c'est moins 2 le deuxième son app cissé - 1 le troisième son app 6 1 et puis le dernier sont six et quatre voilà ensuite je fais la même chose avec les ordonner donc le premier point il faut faire attention juste à prendre les coordonnées dans le mode dans le bon ordre c'est à dire que là je suis toujours considéré que ça c'est mon premier point sont ordonnés c'est moins 3 le deuxième sont ordonnés c'est moins ensuite alors celui là sont ordonnés ces deux et puis le dernier sans ordonner c3 voilà alors maintenant je vais est calculée ici alors ça c'est le point qui happe 6 - 2 mais qui est située sur la droite donc en fait pour calculer son ordonné il faut que j'utilise l'équation de droite qui est ici en remplaçant x par le parent l'abscisse du point donc je vais avoir 41 41 / 42 x l'abscisse alors l'abscisse c'est celle là c'est ce qu'il ya dans cette cellule a donc je vais mettre x à 2 et ensuite je vais enlever moins 5 / 21 oui c'est ça - 5 / 21 donc là j'ai vraiment ce que j'ai écris ici c'est 41 x 40 / quarante deux fois moins 2 - 5 sur 21 donc ça va être exactement l'ordonné du point de la droite qui a pour abscisse -2 voilà je peux le calcul et ça fait moins de moins 2,19 0,48 alors maintenant je vais faire je vais calculé ici le carré de l'erreur par rapport à la droite alors l'erreur par rapport à la droite on a dit que c'était pour ce point 6 et c'est cette distance là en fait donc celle ordonnée de notre point donc ça va être ordonnée du point c'est moins 3 - sa valeur estimée par la droite des moindres carrés donc - non je vais faire comme ça c'est comme ça qu'ils c'est ça qui est intéressant avec excel je vais faire cette valeur la moins cette valeur là voilà et puis ça je vais les cheveux au carré j'ai oublié de le faire donc je vais faire ça élevée au carré donc c'est vraiment la valeur l'ordonné de y - la valeur estimée de y parle pas par la droite des moindres carrés et j'élève 7 cette différence au carré voilà ici alors élargir cette colonne ici c'est le carré de l'erreur de y par rapport à la moyenne des grecs alors la moyenne des grecs on avait calculé regardez c'est un car on va calculer ici alors je vais mettre égale joue la parenthèse de calculer la différence entre l'ordonné du point et la moyenne donc leur donner du point c'est cette valeur la b2 moins un quart puisque ça c'est la moyenne c'est à dire 0,25 et s'achever l'élever au carré aussi voilà et j'obtiens cette valeur là 10,56 25 alors maintenant ce qui est bien avec un tableur sais que je vais prendre je vais sélectionner cc3c trois cases la c3 c'est lui là et je vais les tirer vers le bas et en fait ça va copier la formule voilà donc je peux vérifier que ici ici je jeu calculé la différence entre ces deux cellules l'a élevée au carré est là quand je vais regarder ici j'obtiens exactement la différence de ces deux de ces deux cellules l'a1 detroit - c3 donc c'est la différence de ces deux cellules que j'élève au carré si je regarde ici j'obtiens la différence de ces deux cellules que gérer vos carrés il a quand je regarde ici donc j'avais cette cellule la moins 0.25 élevée au carré et puis ici j'avais cette cellule à détroit - 0.25 élevée au carré donc en fait le tableur copie lui même les formes une en remplaçant en parler par les valeurs qu'il faut donc ça c'est vraiment une fonctionnalité vraiment pratique du tableur alors maintenant ce que je vais faire je vais calculer la somme des carrés des erreurs par rapport à la droite donc là je vais tout simplement écrire sommes j'ouvre la parenthèse ensuite je sélectionne ces données là je ferme la parenthèse voilà et j'obtiens 2,73 8,6 de suite ça là je vais écrire que ce sont les sommes alors maintenant je vais faire la même chose ici pour la somme des carrés des erreurs de y par rapport à la moyenne donc c'est la variation des y par rapport à la moyenne or j'ai oublié d'écrire sommes donc ces sommes de ses valeurs la ferme la parenthèse voilà et j'obtiens 22,75 alors on va reprendre un petit peu graphique pour voir ce qui se passe on a calculé la somme des carrés des erreurs par rapport à la droite des on a trouvé que c'était 2,73 8 donc disons 2,74 ça c'est la somme des carrés de ses distances larmes c'est ce que c'est l'erreur qu'on fait élevée au carré à chaque fois quand on remplace par la droite donc c'est la somme j'ai fait cette distance-là élevée au carré plus cette distance la levée au carré plus cette distance-là élevée au carré plus cette distance-là élevée au carré et j'ai obtenu 2,74 et ensuite j'ai fait j'ai calculé la somme des carrés des écarts par rapport à la moyenne la moyenne c'est un bien car 0.25 donc on va pouvoir l'a représenté ici aussi 0.25 c'est là ici c'est un donc ça c'est un demi un car c'est là donc je vais pouvoir tracer la droite à peu près qui représente la moyenne voilà ça c'est cette valeur ici c'est y bar là donc ça c'est la droite d'équations y égale y bat alors ce qu'on a fait quand on a calculé dans le tableur on a calculé ça la somme des carrés des erreurs par rapport à la valeur moyenne des y c'est en fait on a calculé cette distance-là la distance de ce point à la moyenne donc c'est cette distance-là élevée au carré plus cette distance-là élevée au carré plus cette distance là élevée au carré plus cette distance-là élevée au carré 1 ça c'est la somme des carrés des erreurs par rapport à la moyenne c'est exactement ce qu'on a fait on a calculé tout ses distances qu'on a élevée au carré on en a fait la somme et on a trouvé 22,75 22 22,75 voilà alors bon ce qu'on va faire maintenant c'est calculé essayer de mesurer la qualité de cet ajustement qu'on a fait en prenant en essayant de calculer le coefficient de détermination qu'on avait vu dans la vie et dans la vidéo précédente alors je rappelle cette somme des carrés des erreurs par rapport à la droite c'est la variation total les erreurs qu'on fait totale quand on remplace le nuage de poids par cette droite des moindres carrés et donc en fait c'est la somme des carrés total qui n'est pas expliquée par le modèle de par l'abe l'ajustement linéaire et puis cette somme là des écarts par rapport à la moyenne des grecs en fait ça c'est la variation totale d y part par rapport à leur moyenne du coup quand on veut calculer la proportion de ces de ces erreurs qui ne sont pas expliqués par la droite et bien tout simplement on doit faire le rapport c'est ce qu'on avait fait dans la vidéo précédente on va faire le rapport s alors regardez les mêmes couleurs sc la somme des carrés des erreurs par rapport à la droite divisée par la somme des carrés des erreurs par rapport à leur moyenne donc ça on peut le faire ça va représenter la variation des grecs qui n'est pas expliquée par le modèle de régression linéaire alors je vais prendre le tableur qu de tout à l'heure alors ici on va calculer du coup le coefficient de détermination détermination alors pour faire ça je vais tout simplement dire que c'est alors la somme des carrés des erreurs par rapport à la droite cette somme-là / la somme des carrés d erreur totale de y par rapport à leur moyenne donc ça va être cette case la diviser cette cellule a divisé par sept cellules voilà et je trouve 0,12 033 enfin on va arrondir sa à 0.12 0,12 donc ça ça veut dire qu'il ya environ 12 % des variations de y qui ne sont pas expliquer qu'ils ne sont pas expliqués par le modèle qu'ils ne sont pas un ça qui est important par le modèle 12% qui ne sont pas expliqués par le modèle du coup est ce qu'on peut en déduire c'est que le coefficient détermination qu'on avait appelé r2 est bien celui ci c'est 1 - 0 12 ou alors 100 % -12 % c'est-à-dire finalement 88% à d'ailleurs j'ai fait une erreur ici dans le tableur ici c'est pas le coefficient de détermination que j'ai calculé en fait c'est la proportion des variations qui n'est pas expliquée par le modèle donc ici en fait si je veux calculé le coefficient de détermination que je peux le faire directement en faisant 1 - le rapport de ces deux valeurs là de ces deux sommes déclarées voilà donc ça me donne effectivement 88% bon c'est tout à fait ce qu'on a ce qu'on aurait trouvé voilà alors on avait vu que quand on avait une valeur de r2 qui était proche de 100% enfin qui était élevé eh bien on avait un ajustement linéaire qui était plutôt de bonne qualité donc là on a 80 près de près de 90% des variations des grecs qui sont expliquées par le modèle c'est quand même assez élevé et effectivement quand on regarde le dessin notre droite qu'on avait tracé la le dessin à peu près correctement fait et un quadrillage et tout et on voit bien que en fait notre droite elle passe effectivement assez près de tous les points est en tout cas les les toutes les données sont beaucoup plus proches de la droite des moindres carrés que de leur moyenne que de leur valeur moyenne donc effectivement là ce coefficient de cette valeur du coefficient de détermination nous permet de dire que le la droite des moindres carrés qu'on avait trouvé constitue un bon ajustement de ce nuage de données qui est ici voilà