If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal
Heure actuelle :0:00Durée totale :12:41

Transcription de la vidéo

alors dans toutes les vidéos précédentes ce qu'on avait fait ses études et des nuages de points lors du nuage de points 7 tout simplement des points dans un plan moi je vais faire je vais faire un dessin mais uniquement dans le premier cas de rance avec une importance les points pour être disséminées partout ailleurs donc assez ému ces points se sont le stent des points qui sont disposés de n'importe comment en faillite avait disposé dendroctone disposition et on leur donne des noms alors ils ont une coordonnée celui-là par exemple sa 309 6 x 5 et sans leur donner ces caricatures on n'a par exemple un deuxième point ici qui serait dite de du direct delitte de dungu du crime 2 un troisième point quatrième point cinquième point sixième point et ainsi de suite jusqu'à après avoir à peine points donc celui ci ça serait le énième point on me prête vie de scène y m voilà donc un nuage de points c'est vraiment ça c'est des points disséminés dans le plan avec évidemment leurs coordonnées qu'est-ce qu'on avait fait dans toutes les vidéos précédentes c'était essayez de d'ajuster et ceux ces nuages de points par une droite qui pouvait être décrire le nuage de points ont donc essayé de modéliser ce nuage de points par une droite au jugé je vais là je vais tracer une droite ici qui va essayer de de passer par là le plus le plus de points possible enfin passé le plus près de l'udu plus de points possible voilà et donc on m'avait elle trouvait une manière de deux déterminer la droite qui passé le plus près possible de tous les points on recense des moindres carrés non ça c'était ce qui est important donc si je suppose que c'est cette droite là que j'ai tracé ici ce qui était évident est bon on va supposer que c'est cette droite-là cette droite là là c'est la droite ce qu'on appelle la droite des témoins les moindres carrés et on va l'appeler alors cette droite-là comme toutes les droites et là une équation qui est de la forme y légal m x plus d'aidé ce qu'on avait fait dans dans le les vidéos précédentes c'était travailler pour essayer de calculer cette année de donner une formule pour trouver cette pente de la droite des moindres carrés et l'orée de leur donner à l'origine donc c'est effectivement ce qu'on avait fait on avait finalement établi des formules pour trouver ces deux paramètres là m la pente et leur donner à l'origine de la droite dénomme des moindres car ça ce sont des données et des choses compte qu'on sait calculer maintenant une fois qu'on a mais l'agent de données alors très rapidement je voudrais reprendre un petit peu le raisonnement qu'on avait fait on avait en fait pour tracer une droite remplacer chaque point donc ici ces points dati stick stunt parsons dobson son équivalent sur le point de même ainsi ce qui est sûre située sur la droite donc ici la city directoire et là on pourrait appeler ça il y tient chapeau donc c le point qui est sur la droite qui a même assisté 800 et cette distance-là en fait c les erreurs qu'on fait donc de la piscine c'est l'erreur qu'on fait quand on remplace points de corps 2005 grec un par le point de corde mixeur y ait un chapeau et en fait on fait ça pour chaque point donc ici pour le point 2 on aurait fait erreur là ici ça c'est l'erreur 2 c'est l'erreur qu'on fait quand on remplace le point date 6 x 2' et de deux cordes et d'ordonner pardon y de par le point dati site de randonnée y de chapeau qui est située sur la droite c'est celui qui d'ici du direct 2 et puis on fait ça pour chaque point donc ici on aurait une erreur aussi l'as roma aurait une erreur aussi là on aurait une erreur aussi là on aurait une erreur et puis finalement jusqu'à la dernière erreur qui est celle là ici on aurait appelé le m erreur m et puisqu'on avait fait c'est que au lieu d'essayer de calculer la somme des erreurs ce que comique les voir des questions si on avait calculé la somme des carrés des erreurs ce qu'on avait appris comme ça à personne car et des erreurs par rapport à la droite des c'était alors le pain au carré plus près d'eux au carré plus ainsi de suite jusqu'à m m au carré et on avait même donner une expression un peu plus précise de cette quête de cette somme des cars et des erreurs par rapport à la droite des en fait l'erreur un peu cellectis québec 1- le directeur chapeau mais y ait un chapeau c'est quand même foyer de simplicité donc cette erreur on peut l'écrire comme ça c'est le directeur m x un peu plus libéré ça c'est l'erreur bien que jouer au carré plus pour les verts de bc paraissait il y 2 m plus d'aidé le tout élevée au carré plus ainsi de suite jusqu'à la dernière heure je vais il créera un peu en dessous c'est ils y tiennent moins aime x m plus d'aidé le tout élevée au carré donc cette somme des cars et des erreurs je veux dire écrire ici par rapport à l'art droite b on avait lq lyon avait minimisé en avez vu que pour des valeurs qu'on avait réussi à calculer de l'année des sept heures ces hommes des cars et des erreurs été la plus petite possible donc m l'agent assistent à cette somme des cas d erreur une fois qu'on a la droite des moindres carrés on peut parfaitement la calculer puisque l'on connaît m ebay on avait nos formules pour ça qu'on a démontré domaine et puis on sait que c'est la plus petite de ses valeurs alors il faut autre chose on m'a beaucoup plu teaser avant de donner quand on a fait des statistiques descriptives ce qui est intéressant de regarder les selles les lames la dispersion des données par rapport à leur moyenne 1 donc par exemple ici si je regarde la moyenne d y tient je peux peut-être là mètres d'ici disons que ça serait si beau la biographie va devenir un peu compliqué mais si si on accuse direct par donc ça c'est la moyenne désordonnés de nos points donc là on peut tracer une droite qui va passer comme ça et on avait utilisé très souvent un indicateur qu'on avait appelé la variance mais en fait il mesuré la moyenne des carrés des écarts par rapport à la par rapport à la moyenne alors là on va pas faire ça on va regarder quelle est la somme des carrés les écarts par rapport à la moyenne et grégoire de la donnée y tient donc ça c'était e y - il ya une barre carrez plus y un mois je dirais que de pardon - les grecs tard élevée au carré plus facile suite il y m - il y barre au carré donc ça la somme d'argent des cars et des écarts par rapport à la moyenne pour la donner il y tient carrez des écarts par rapport les haines il gagne barre bongo connaissait cette expression-là il suffit qu'on dit quand on divise par l on obtient la moyenne des carrés des écarts par rapport à la moyenne donc en fait on obtient la variance des grecs voilà pour l'instant on va s'occuper de ça et en fait la question qu'on doit se poser c quel pourcentage quelle proportion de sète le scep sommes là est expliquée par la droite alors je précise un petit peu ici en fête quand je calcule cette somme des carrés des écarts par rapport à la moyenne en fait chaque écart par rapport à la moyenne ici j'ai je suis en ligue 1 car dans tous les cas par rapport à la moyenne de ce point le premier de couleur l'écart par rapport à la moyenne de ce point qui est ici du point il y tient c'est toute cette distance-là l'écart par rapport à la moyenne de ce point là c'est cette distance-là pour ce point si ça sera cette distance-là là on aura cette distance-là ici on va voir celle là ici on aura celle-ci et ici on va voir la distance toute cette distance la voilà je représente ici les écarts en scannant les parenthèses donc nous de nous ce qu'on fait quand on fait la somme des carrés des écarts par rapport à la moyenne on additionne le carré de toutes c'est la distance que je vais être assez en jaune c'est la somme des carrés des écarts par rapport à la moyenne quilici somme par rapport à la moyenne du territoire et on va essayer de voir quelles proportions ça c'est la question qu'on doit se poser proportions d de ces écarts donc de la somme des écarts par rapport à égal bas eq expliqué par la droite c'est expliqué par la droite alors que ça veut dire en quelque sorte m comm quelle proportion de la somme des carrés des erreurs par rapport à la moyenne expliqué t'expliquer par des variations de la variable par les carabins de la variable ilic spa rapport à sa moyenne dite bahreïn mais c'est la même question alors ça a pas l'air très simple question parce que calculez la proportion de cette somme des cars et des erreurs par rapport à la moyenne du baril grill barre expliquer par la droite c'est pas très facile si on le prend dans ce sens là par contre ce qu'on peut voir ici qui sait qu'en fait cette somme des carrés des écarts par rapport à la droite qu'on a calculé un ce qu'on est dessiné en bleu c'est parti de là cette partie-là est ici cette partie-là qui restent et bien ça c'est la partie qui n'est pas expliquée par la droite si j'écris ça ces hommes des carrés des écarts et bien c'est fait la par là la partie de la somme déclarée des écarts par rapport à part la moyenne des grecques qui n'est pas qui n'est pas expliqué qui n'est pas expliqué par la droite d par la droite des moindres carrés l'accord parfait en fait c'est exactement ça puisque c'est cette partie-là qui est en bleu donc c'est effectivement l'erreur qu'on fait quand on remplace le point par le point qui le condamne à six pieds six pieds qui est située sur la droite donc là je vais faire un peu d espaces parce que là on a quand même pas mal avancé du coup quand on calcule le rapport elle seule d divisez par la psp il y tient et ce pays grégoire et bien ça c'est quoi et bien c'est tout simplement la proportion de la somme des carrés des écarts par rapport à la moyenne du territoire qui n'est pas expliqué qui n'est pas expliqué effectivement c'est bien ça puisque cette somme des écarts par rapport à la droite la partie qui est le comble c'est l'erreur qu'on fait quand on quand on remplace nuage de poids par la droite et donc quand on rapporte ça la somme déclarée total d des écarts par rapport à il ya une barre on note effectivement la proportion qui n'est pas expliquée par rapport à la droite alors en fait là on a pratiquement terminé parce que finalement la proportion des écarts qui est expliquée par la droite dossier c 100% c'est 100% - si on exprime sans pourcentage ça sera 100% - avi cette proportion n'a pas encore fait ici si ça a par exemple si cette thèse ce rapport-là c'est 30 % par exemple la proportion des deux de cette somme des écarts par rapport à grégoire qui sera expliquée par la droite et bien ça sera 100 % - 30 % donc être à 110% donc en fait ça veut dire que la proportion entre le faire en rouge la proportion de la variation des grecs par rapport à sa moyenne qui est expliqué pardé et bien c'est ce rapport qu'on a calculé tout à l'heure roatta calculer mais on la définit donc pour moi la somme des cars et des écarts par des écarts par rapport à la droite il visé par la somme des accusés car et des erreurs par rapport à la moyenne cette quantité est là on appelle ça f le coefficient de détermination dans seulement qu'on a donnée cette quantité coefficient de détermination et de manière classique on le note herbert au carré donc ça c'est le coefficient de détermination de savoir un petit peu pourquoi on l'appelle comme ça en fait il permet de déterminer e si elle n'a justement est bon ou pas alors on va voir pourquoi par exemple si on a une somme des carrés des erreurs par rapport à la droite petite ça veut dire que je reviens tout en haut ça veut dire que les airoldi 6% le 2 e 3 e élevée au carré cette somme là et très faible donc ça veut dire que la droite est un bon ajustement linéaire armes parce qu'elle va pas c'est vraiment très près de tous les points donc ça si la somme des écarts par rapport à la droite est petite évidemment ça veut dire que c'est un bonne ajustements c'est un bonheur justement du nuage voilà donc on a tout intérêt à remplacer le nuage de poids par cette 3d là ce qu'on peut voir aussi c'est que si la somme des cars et des erreurs et petites alors ce rapport si la somme des cars et des erreurs par rapport à la droite divisez par la sominice des cars et des erreurs par rapport à la moyenne ça va être quelque chose de très petits aussi et donc finalement le coefficient r2 coefficient de détermination il va être proche le pain donc ça veut dire que si on calcule notre coefficient de détermination et qu'on voit qu'il est proche de la nôtre droite sera un bonnet ajustement du nuage de points alors peut continuer un peu la distillation si au contraire on a une somme des écarts par rapport à la droite qui est grande je reviens petit peu là haut ça veut dire que dc et carla - être grant donc en fait l'erreur peut être assez grande quand on va remplacer nuage de poids par la droite donc elle la droite des ne sera pas un bonheur ajustement linéaire n'est pas mais pas un bonne ajustement et pour ce qu'on peut voir aussi c'est que 6 la somme des cars et des erreurs par rapport à la droite est grande ce rapport-là va être grand aussi être proche de printemps et du coup le coefficient de détermination va être proche de zéro 6 la somme des cars et des erreurs par rapport à la droite est grande le coefficient de dell de détermination il va être proche 2 0 donc là aussi si on calcule notre coefficient de détermination un convoi qui est proche de zéro c'est dire que notre droite des moindres carrés ne sera pas en données ajustées mans du nuage pour l'heure on a parlé de tout ça de manière très abstraite dans les autres vidéos fra des applications de tout ça pour que soit plus pratique