alors dans toutes les vidéos
précédentes ce qu'on avait fait ses études et des nuages de points lors du
nuage de points 7 tout simplement des points dans un plan moi je vais
faire je vais faire un dessin mais uniquement dans le premier cas de rance
avec une importance les points pour être disséminées partout ailleurs donc assez ému ces points se sont le stent des points
qui sont disposés de n'importe comment en faillite avait disposé dendroctone
disposition et on leur donne des noms alors ils ont une coordonnée celui-là par exemple sa 309 6 x 5 et
sans leur donner ces caricatures on n'a par exemple un deuxième point
ici qui serait dite de du direct delitte de dungu du crime 2 un
troisième point quatrième point cinquième point sixième point et ainsi
de suite jusqu'à après avoir à peine points donc celui ci ça serait le énième
point on me prête vie de scène y m voilà donc un nuage de points c'est vraiment
ça c'est des points disséminés dans le plan avec évidemment leurs coordonnées qu'est-ce qu'on avait fait dans toutes
les vidéos précédentes c'était essayez de d'ajuster et ceux ces nuages
de points par une droite qui pouvait être décrire le nuage de
points ont donc essayé de modéliser ce nuage de points par une droite au jugé je vais là je vais tracer une
droite ici qui va essayer de de passer par là le plus le plus de points possible enfin passé le plus près de l'udu plus
de points possible voilà et donc on m'avait elle trouvait une
manière de deux déterminer la droite qui passé le plus près possible de tous les
points on recense des moindres carrés non ça c'était ce qui est important
donc si je suppose que c'est cette droite là
que j'ai tracé ici ce qui était évident est bon on va supposer que c'est cette
droite-là cette droite là là c'est la droite ce qu'on appelle la droite des témoins les moindres carrés et on va l'appeler alors cette droite-là comme toutes les
droites et là une équation qui est de la forme y légal m x plus d'aidé ce qu'on avait fait dans dans le les
vidéos précédentes c'était travailler pour essayer de calculer
cette année de donner une formule pour trouver cette pente de la droite des
moindres carrés et l'orée de leur donner à l'origine donc c'est
effectivement ce qu'on avait fait on avait finalement établi des formules
pour trouver ces deux paramètres là m la pente et leur donner à l'origine
de la droite dénomme des moindres car ça ce sont des données et des choses
compte qu'on sait calculer maintenant une fois qu'on a mais l'agent de
données alors très rapidement je voudrais
reprendre un petit peu le raisonnement qu'on avait fait on avait en fait pour tracer une droite remplacer chaque
point donc ici ces points dati stick stunt parsons dobson son équivalent sur le point de même
ainsi ce qui est sûre située sur la droite donc ici la city directoire et là on pourrait appeler ça il y
tient chapeau donc c le point qui est sur la droite qui a
même assisté 800 et cette distance-là en fait c les erreurs qu'on fait donc de la
piscine c'est l'erreur qu'on fait quand on remplace points de corps 2005 grec un
par le point de corde mixeur y ait un chapeau et en fait on fait ça pour chaque point
donc ici pour le point 2 on aurait fait erreur là ici ça c'est l'erreur 2 c'est l'erreur qu'on fait quand on
remplace le point date 6 x 2' et de deux cordes et d'ordonner pardon y
de par le point dati site de randonnée y de chapeau qui est située sur la
droite c'est celui qui d'ici du direct 2 et puis on fait ça pour chaque point
donc ici on aurait une erreur aussi l'as roma aurait une erreur aussi là on
aurait une erreur aussi là on aurait une erreur et puis finalement jusqu'à la dernière erreur qui est
celle là ici on aurait appelé le m erreur m et puisqu'on avait fait c'est que au lieu d'essayer de calculer la somme
des erreurs ce que comique les voir des questions si on avait calculé la somme des carrés des erreurs ce qu'on avait
appris comme ça à personne car et des erreurs par rapport à la droite des c'était alors le pain au carré plus près d'eux au carré plus ainsi de suite jusqu'à m m au carré et on avait même donner une expression un peu plus
précise de cette quête de cette somme des cars et des erreurs par rapport à
la droite des en fait l'erreur un peu cellectis
québec 1- le directeur chapeau mais y ait un chapeau c'est quand même foyer de simplicité donc cette erreur on peut l'écrire comme ça c'est le
directeur m x un peu plus libéré ça c'est l'erreur bien que jouer au
carré plus pour les verts de bc paraissait il y 2 m plus d'aidé le tout élevée au carré plus ainsi de suite jusqu'à la dernière heure je vais il créera un peu en dessous
c'est ils y tiennent moins aime x m plus d'aidé le tout élevée au carré donc cette somme des cars et des erreurs je veux dire écrire ici par rapport à l'art droite b on avait lq lyon avait minimisé en avez
vu que pour des valeurs qu'on avait réussi à
calculer de l'année des sept heures ces hommes des cars et des erreurs été
la plus petite possible donc m l'agent assistent à cette somme
des cas d erreur une fois qu'on a la droite des moindres carrés on peut parfaitement la calculer puisque
l'on connaît m ebay on avait nos formules pour ça qu'on a démontré
domaine et puis on sait que c'est la plus petite
de ses valeurs alors il faut autre chose on m'a
beaucoup plu teaser avant de donner quand on a fait des statistiques
descriptives ce qui est intéressant de regarder les
selles les lames la dispersion des données par rapport à leur moyenne 1 donc par exemple ici si je regarde la moyenne d y tient je peux peut-être
là mètres d'ici disons que ça serait si beau la
biographie va devenir un peu compliqué mais si si on accuse direct par donc ça
c'est la moyenne désordonnés de nos points donc là on peut tracer une droite qui va passer comme ça et on avait utilisé très souvent un
indicateur qu'on avait appelé la variance mais en fait il mesuré la moyenne des
carrés des écarts par rapport à la par rapport à la moyenne alors là on
va pas faire ça on va regarder quelle est la somme des
carrés les écarts par rapport à la moyenne et
grégoire de la donnée y tient donc ça c'était e y - il ya une barre carrez plus y un mois je dirais que de pardon - les grecs tard élevée au carré plus facile suite il y m - il y barre au carré donc ça la somme d'argent des cars et des
écarts par rapport à la moyenne pour la donner il y tient carrez des écarts par rapport les haines il gagne barre bongo connaissait cette expression-là
il suffit qu'on dit quand on divise par l on obtient la moyenne des carrés des
écarts par rapport à la moyenne donc en fait on obtient la variance des grecs
voilà pour l'instant on va s'occuper de ça et
en fait la question qu'on doit se poser c quel pourcentage quelle proportion de
sète le scep sommes là est expliquée par la droite alors je
précise un petit peu ici en fête quand je calcule cette somme des carrés
des écarts par rapport à la moyenne en fait chaque écart par rapport à la
moyenne ici j'ai je suis en ligue 1 car dans tous les cas par rapport à la
moyenne de ce point le premier de couleur l'écart par rapport à la moyenne de ce point qui est ici du point il y tient c'est toute cette distance-là l'écart par rapport à la moyenne de ce
point là c'est cette distance-là pour ce point si ça sera cette
distance-là là on aura cette distance-là ici on va
voir celle là ici on aura celle-ci et ici on va voir la distance toute
cette distance la voilà je représente ici les écarts en scannant les parenthèses
donc nous de nous ce qu'on fait quand on fait la somme des carrés des écarts
par rapport à la moyenne on additionne le carré de toutes c'est
la distance que je vais être assez en jaune c'est la somme des carrés des écarts
par rapport à la moyenne quilici somme par rapport à la moyenne du territoire et on va essayer de voir quelles
proportions ça c'est la question qu'on doit se poser proportions d de ces écarts donc de la somme des écarts par rapport à égal bas eq expliqué par la droite c'est expliqué par la droite alors que ça veut dire en quelque sorte
m comm quelle proportion de la somme des carrés des erreurs par rapport à la
moyenne expliqué t'expliquer par des variations de la variable par les
carabins de la variable ilic spa rapport à sa
moyenne dite bahreïn mais c'est la même question alors ça a pas l'air très simple
question parce que calculez la proportion de cette somme des cars et
des erreurs par rapport à la moyenne du baril grill barre expliquer par la
droite c'est pas très facile si on le prend
dans ce sens là par contre ce qu'on peut voir ici qui sait qu'en fait cette
somme des carrés des écarts par rapport à la droite qu'on a calculé un ce qu'on est dessiné en bleu c'est parti de là cette partie-là est ici cette partie-là qui restent et bien ça c'est la partie qui n'est
pas expliquée par la droite si j'écris ça ces hommes des carrés des écarts et bien c'est fait la par là la partie de la somme déclarée des écarts par
rapport à part la moyenne des grecques qui n'est pas qui n'est pas expliqué qui n'est pas expliqué par la droite d par la droite des
moindres carrés l'accord parfait en fait c'est exactement ça puisque c'est cette partie-là qui est en bleu
donc c'est effectivement l'erreur qu'on fait quand on remplace le point par le
point qui le condamne à six pieds six pieds qui est située sur la droite donc là je vais faire un peu d espaces
parce que là on a quand même pas mal avancé du coup quand on calcule le rapport elle seule d divisez par la psp il y tient et ce pays grégoire et bien ça c'est quoi et bien c'est
tout simplement la proportion de la somme des carrés des écarts par rapport à la moyenne du territoire qui n'est pas expliqué qui n'est pas expliqué effectivement c'est bien ça puisque cette somme des écarts par rapport à
la droite la partie qui est le comble c'est
l'erreur qu'on fait quand on quand on remplace nuage de poids par la
droite et donc quand on rapporte ça la somme
déclarée total d des écarts par rapport à il ya une barre on note effectivement la proportion qui
n'est pas expliquée par rapport à la droite alors en fait là on a
pratiquement terminé parce que finalement la proportion des écarts qui
est expliquée par la droite dossier c 100% c'est 100% - si on exprime sans
pourcentage ça sera 100% - avi cette proportion n'a pas
encore fait ici si ça a par exemple si cette thèse ce rapport-là c'est 30
% par exemple la proportion des deux de cette somme
des écarts par rapport à grégoire qui sera expliquée par la droite et bien
ça sera 100 % - 30 % donc être à 110% donc en fait ça veut dire que la
proportion entre le faire en rouge la proportion de la variation des grecs par rapport à sa moyenne qui est expliqué pardé et bien c'est ce rapport qu'on a calculé tout à
l'heure roatta calculer mais on la définit donc pour moi la somme des cars et des
écarts par des écarts par rapport à la droite il visé par la somme des accusés car
et des erreurs par rapport à la moyenne cette quantité est là on appelle ça f le coefficient de détermination dans
seulement qu'on a donnée cette quantité coefficient de détermination et de manière classique on le note
herbert au carré donc ça c'est le coefficient de
détermination de savoir un petit peu pourquoi on l'appelle comme ça en fait il permet de déterminer e si elle n'a justement est bon ou pas
alors on va voir pourquoi par exemple si on a une somme des carrés des
erreurs par rapport à la droite petite ça veut dire que je reviens tout en haut ça veut dire que les airoldi 6% le 2 e
3 e élevée au carré cette somme là et très faible donc ça veut dire que la droite est un
bon ajustement linéaire armes parce qu'elle va pas c'est vraiment très
près de tous les points donc ça si la somme des écarts par rapport à
la droite est petite évidemment ça veut dire que c'est un bonne ajustements c'est un bonheur justement du nuage voilà donc on a tout intérêt à remplacer le
nuage de poids par cette 3d là ce qu'on peut voir aussi c'est que
si la somme des cars et des erreurs et petites alors ce rapport si la somme des cars et des erreurs par
rapport à la droite divisez par la sominice des cars et des erreurs par rapport à la moyenne ça va être quelque chose de très
petits aussi et donc finalement le coefficient r2
coefficient de détermination il va être proche le pain donc ça veut dire que si on calcule notre coefficient de
détermination et qu'on voit qu'il est proche de la nôtre droite sera un
bonnet ajustement du nuage de points alors peut continuer un peu la
distillation si au contraire on a une somme des écarts par rapport à la
droite qui est grande je reviens petit peu là haut ça veut dire que dc et carla - être grant donc en fait l'erreur peut être
assez grande quand on va remplacer nuage de poids par la droite donc elle la droite des ne sera pas un
bonheur ajustement linéaire n'est pas mais pas un bonne ajustement et pour ce qu'on peut voir aussi c'est
que 6 la somme des cars et des erreurs par
rapport à la droite est grande ce rapport-là va être grand aussi être proche de printemps et du coup le coefficient de
détermination va être proche de zéro 6 la somme des cars et des erreurs par rapport à
la droite est grande le coefficient de dell de détermination il va être proche 2 0 donc là aussi si on calcule notre
coefficient de détermination un convoi qui est proche de zéro c'est dire que
notre droite des moindres carrés ne sera pas en données ajustées mans du
nuage pour l'heure on a parlé de tout ça de
manière très abstraite dans les autres vidéos fra des
applications de tout ça pour que soit plus pratique