If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal
Heure actuelle :0:00Durée totale :9:45

Calcul du coefficient de détermination R carré

Transcription de la vidéo

alors dans une vie deux précédentes on avait calculé la droite des moindres des moindres carrés de ce nuage de points qui est ici dans ma vie ce nuage de quatre points on avait trouvé la pente hélas delahaie leur donner à l'origine de la droite des moindres car la pente c'était 41 sur 42 et elle la droite devait leur donner à l'origine c'était moins 5 sur 21 donc je vais écrire un second set cette équation de droite donc la droite des moindres carrés de ce nuage que le tracé rouge ces grecs légale 41 sur 42 poite x plus fin moins 521 5 cyr 21 alors ce qu'on va faire maintenant dans cette vidéo c'est un essai de calculer le coefficient de détermination de de de cette droite pour essayer de mesurer la qualité de notre ajustements alors je vais le faire avec un tableur un peu ce que les cas quelques frissons peu fermé avec le tableur c'est quand même plus pratique donc de le faire ici alors j'ai commencé par hasard saisir les données dans les colonnes d'un ton piégeage et mes données de 8x aimé donner de l'éclat caire ici donc ça ça va être la psyché leurs données de chaque point ici je vais mettre l'âme de la valeur leurs données du poids qui appartient à droite des moindres carrés kiaxi sic c'est un manque de sel à je vais l'appeler traditionnellement on dirait que chapeau mais je sais pas comment faire des chapeaux ici donc sévir et je vais l'appeler comme ça y est t'es toi donc ça fait le point de la droite qui artistique 5 loin des moindres carrés ensuite ici je vais mettre le carré de l'erreur je veux écrire comme ça on a peur et j'ai un peu le carré de l'erreur par rapport à la droite des moindres carrés j'ai un petit peu ça en fait j'ai mesuré l'erreur au carré ce que je fais quand je remplace % même le nuage de points par an par la droite donc m là ici je vais mettre par contre le carré de l'erreur dès qu'il y par rapport à la moyenne par rapport à la moyenne des galactiques alors quand même donc je vais commencer par empire donc ça ça c'est le boulot en tête se met en tête de colonne où je vais mettre ça son entrée le milieu olympien alors qu'ici je vais rentrer les valeurs des actifs de mai prend donc le premier procès celui-ci 6-2 le deuxième son match 6 et -5 le troisième son accessit 1 et puis le dernier sondage c4 ensuite j'ai fait la même chose avec les ordonner donc le premier point il faut faire attention juste apprendre les coordonnées dans le mode dans le bonheur pour moi c'est à dire que l'âge je veux c'est toujours considéré que ça c'est mon premier point pour leur donner 7-3 e le deuxième tournant données 7-5 ensuite ça se alors celui-là son ordonné ces deux et puis le dernier sans leur donner ces trois alors maintenant je vais est calculée ici alors ça c'est le point qui a que 6 - 2 mais qui est située sur la droite donc en fait pour calculer où sont leurs données il faut que j'utilise l'équation de droite qui est ici en remplaçant le mix parages la parade site du point donc je vais avoir 41 41 divisez par 42 multipliez par l'atci ce alors à tisser c'est la société dans cette cellule avant de le mettre multiplient les parades et ensuite je vais enlever - 5 divisez par interpol 6-5 disait parlementaire donc là j'ai vraiment ce que j'ai écrit cissé 41 fois 42 divisez par 42 fois - 2 - 5 sur 21 ans que ça va être exactement l'ordonné du point de la droite qui a pour apsylis 5-2 voilà outre un peu plus calculer ça fait moins 2-2 d'un culte me 19 0''48 alors maintenant je vais faire le lg calculé ici le carré de l'erreur par rapport à la droite alors l'erreur par rapport à droite on m'a dit que c'était pour ce point si c c'est cette distance-là en fait partie donc c'est leur donner de notre pointe donc ça va se faire pour leur donner du poids à ses -3 - sa valeur est estimée par la droite des moindres carrés donc moins je vais faire comme ça en scène comme ça qui est ça qui est intéressant avec un excellent cette valeur la moins cette valeur et puis ça je vais les jouer aux cartes j'ai oublié de le faire donc je vais faire ça élevé au carré donc c'est vraiment la valeur leur donner des grecs - la valeur est estimée il y parlera pas par la droite des moindres carrés et jeunesse 7 cette différence au carré voilà ici alors élargir cette colonne ici c'est le carré de l'erreur des grecs par rapport à la moyenne des grecs alors la moyenne des grecs on avait calculé regardez c un quart on a calculé ici alors je vais mettre également sous la parenthèse est calculé la différence entre eux leur donner du point et la moyenne donc leur donner du poids c'est cette valeur-là les deux - car qu'est-ce que ça c'est la moyenne c'est-à-dire si roger un but 25 et ça je vais rêver aux quarts et aussi voilà et j'obtiens cette valeur la 10e but 56e 5 alors maintenant ce qui est bien avec un tableur c'est que je vais prendre j'ai sélectionné c'est c3 que ces trois cases la c3 celle-là et je l'est tirés vers le bas et en fait ça va copier et la formule don que je peux vérifier que ici je veux jeu je calculais la différence entre ces deux cellules l'arrivée au carré hélas quand je vais regarder ici je tiens il exactement la différence de ces deux de ces deux cellules là détroit - ces trois ans très différente de celle de cellules que gérer vos carrés je regarde ici la différence de ces deux cellules que gérer vos carrés quand je regarde ici donc levé et cette cellule à -0 2 du 25 avril au carré et puis ici j'avais cette cellule la b3 - 0 2025 élevée au carré donc en fait le tableur copie lui-même les formules en remplaçant avant de parler et par les valeurs qu'il faut donc ça c'est vraiment les fonctionnalités dans nos pratiques du dictateur alors maintenant ce que je vais faire je vais calculer la somme des carrés des erreurs par rapport à la droite donc la gelée tout simplement écrire somme il s'ouvre la parenthèse ensuite je sélectionne c'est que donner la je ferme la parenthèse voilà et je tiens de zabul 73 8 ainsi de suite 5 là je vais écrire que ce centre les cinq hommes alors maintenant je vais faire la même chose ici pour la somme déclarée des erreurs du direct par rapport à la moyenne donc c'est la variation des grecs par rapport à la moyenne alors que j'oublie nous sommes donc ces sommes de c alors là r ma parenthèse voilà que j'obtiens 22 08 65 alors on va reprendre un petit peu le graphique pour mais par ce qui se passe on a calculé la somme des cars et des erreurs par rapport à la droite d on a trouvé que c'était le deuxième but le 60 13 8 donc disons deux virgules 74' la somme des carrés de ses distances larmes c'est ce que c'est l'erreur qu'on fait élevée au carré à chaque fois content en place par la droite donc c'est la somme je fais cette distance-là élevée au carré plus cette distance celle d'auxerre et plus cette distance-là élevée au carré plus cette distance-là élevée au carré et j'ai obtenu deux élus 74 mais ensuite j'ai fait j'ai calculé la somme des cars et des écarts par rapport à la moyenne en moyenne ces indira cac 40 08 25 donc on va pouvoir présenter ici aussi 08 25 c'est mais ici c'est un mot que ça c'est un demi incarcéré là donc je vais pouvoir tracer à droite peu près qui représente la moyenne c'est assez cette valeur est ici c'est qu'il y voir donc ça c'est la droite des cautions et greg qui égalise gagne pas ce qu'on a fait quand on a calculé m dans le tableur on a calculé ça la somme des cars et des erreurs par rapport à la valeur moyenne des idées laïques c est en fait on n'a calculé cette distance-là la distance de ce point à la moyenne donc c'est cette distance-là élevée au carré plus cette distance-là élevée au carré plus sobre cette distance élevée au carré + 5 cette distance-là élevée au carré ça c'est la somme des carrés des erreurs par rapport à la moyenne c'est cette demande ce qu'on a fait on a calculé toutes ses distances on a élevé au carré et on en a fait la somme et on a trouvé pour le 22 avril 75 22 22 2 75' qu'est-ce qu'on va faire maintenant c'est calculez essayer de mesurer l la qualité de cet ajustement ce qu'on a fait en prenant des siens de calculer le coefficient de détermination qu'on avait vu dans la dans la vidéo précédente à leur appel cette somme des cars et des erreurs par rapport à la droite c'est l'âme la variation totale les erreurs qu'on fête totale quand on las le nuage de points par cette droite des moindres carrés et donc en fait c'est là là la somme déclarée totale qui n'est pas expliquée par un le modèle de départ la de l'ajustement linéaire et puis cette somme là les écarts par rapport à la moyenne des grecs en fait ça c'est là ce que la variation totale d y être par rapport à leur moyenne du coup quand on veut calculez la proportion de céder de ces erreurs qui ne sont pas expliqués par la droite et bien tout simplement on doit faire le rapport à ce qu'on avait fait dans la vidéo précédente on va faire le rapport et ce alors je vais garder les mêmes couleurs s c'est que la somme des carrés des erreurs par rapport à la droite divisés la somme des carrés des erreurs par rapport à la valeur moyenne donc ça on peut le faire tout ça va représenter la variation des grecs qui n'est pas expliquée par le modèle de régression linéaire alors je prends le tableur tout à l'heure ici on va calculer du coup le coefficient de détermination détermination alors pour faire ça je vais tout simplement dire que c'est c'est la somme des carrés des erreurs par rapport à la droite cette somme là divisez par la somme des cars et des erreurs total des grecs par rapport à la moyenne donc ça va être cette case-là divisé de cette cellule a divisé par cette secte voilà je trouve 0 globules 12 033 bon enfant où on va on dire ça à 09h12 08h12 donc ça ça veut dire que l'ia environ 12% des variations il y tient qu'ils ne sont pas expliqués qui ne sont pas avec split qu'hier par le modèle qu'ils ne sont pas rares ça qui est important parent le modèle 12 % qui ne sont pas expliqués par le modèle du coup et ce qu'on peut en déduire c'est que le coefficient détermination qu'on avait appelé carte bleue et bien celui-ci c'est pour ça - 09 12 ou alors que 100 % moins de 12 % c'est-à-dire finalement 88 pour ce rabais hier j'ai fait une erreur ici dans le tableur ici c'est pas le coefficient de détermination j'ai calculé en fait c'est la proportion des variations qui est expliquée par le modèle donc ici en fait si je veux calculé le coefficient de détermination que je peux le faire directement en faisant enfin - le rapport de ces de valeur ces deux syndicats et donc ça nous donne effectivement 80 8% bon sens tout à fait ce qu'on a ce qu'on aurait trouvé voilà alors qu'on avait vu que quand on avait une valeur de merdeux qui était proche de 100% s'inquiéter élevé eh bien on avait un ajustement les nerfs qui était plutôt de bonne qualité donc là on a 80 près de près de 90% les arias s'ils ont des gars qui sont expliquées par le modèle c'est quand même assez élevé effectivement quand on regarde le dessin notre droite qu'on avait tracé là le dessin est peu près correctement fait un quadrillage du tout on voit bien que en fait notre droite elle passe effectivement assez près de tous les points et en tout cas les les toutes les données sont beaucoup plus proches de la droite des moindres carrés que de leur moyenne que leur valeur moyenne donc effectivement là pouces ce coefficient de cette valeur du coefficient de détermination nous permet de dire que le le la droite de moindres car et qu'on avait trouvé constitueront bonne ajustements 2 ce nuage de données qui est ici