Contenu principal
Heure actuelle :0:00Durée totale :13:20

ANOVA 2 : calculer les SCEinter-groupes et SCEintra-groupes (somme des carrés inter et intra groupes)

Transcription de la vidéo

alors on va continuer le travail qu'on avait commencé dans la dans la vidéo précédente alors on avez des données qui étaient répartis en trois classes d'ici place à la classe de la classe 3 et puis on avait réussi à calculer la somme des carrés total de ces données-là alors juste une petite parenthèse ici on avez prix 9 donné donc répartis en trois classes qui contenaient chacune trois données effectives on avait remarqué que on pouvait pour généraliser sa très facilement un ensemble de données réparties en pleine classe et qui contiennent chacune aime donner voilà là ce qu'on va faire sauter ce que j'avais annoncé dans la vidéo précédente on va essayer de décomposée cette somme des cars est totale en somme déclarée qui proviennent de variations dans laquelle à l'intérieur des des classes et l enceinte des carrés qui proviennent des variations entre les classes voilà alors j'ai commencé par calculer la somme des carrés un trac là c'est-à-dire là la variation en % une hausse puisque c'est ça la somme des cars est totale je te rapelle c est en fait le numérateur de la variance et puis ensuite on obtient la variance en divisant par le degré de liberté donc là je vais aller regarder la variance la variation tracks la santé donc en fait j'avais calculé les écarts par rapport à la moyenne dans chaque classe par rapport à la moyenne non pas à la moyenne générale mais à la moyenne de chaque classe alors je vais faire ça alors je vais l'appeler comme ça c'est la somme des carrés et donc ça assez alors je vais à commencer par la m les données de l'âne de la classe - la moyenne de la classe sont donc ces deux élevée au carré plus la deuxième donné ces deux moi la moyenne qui est toujours debout plus et donc gérer vos carrés un pardon plus la dernière donnée qui est en jeu - la moyenne qui est deux je laisse ça au carré ensuite je vais ajouter les carrés des erreurs des écarts par rapport à la moyenne de la seconde classe donc ça je vais reprendre la couleur donc j'ai cinq tirs la moyenne de la deuxième place kikar élevée au carré donc ça je fais j'ajoute savoir plus c il faut voir sa commune c'est sur une seule ligne plus la deuxième donnée ces trois la moyenne qui est quatre et puis au carré plus saine la dernière donnée qui est qui 4 - la moyenne qui est de 4 6 élevée au carré et puis je vais continuer avec elle la dernière donnée la dernière classe pardon donc plus ici j'ai cinq heures - la moyenne qui est 6 j'élève au carré plus 6 heures - la moyenne qui est six sept généraux carré plus la dernière donnée c'est fait - la moyenne qui assistait à gérer vos cartes et voilà alors maintenant je vais faire ce calcul heures donc l'ubs pour la première classe ici j'ai 3 - de safed un peu élevée au carré ça fait un don kitch % la face à ces 2-2 ça fait zéro et ici j'ai pas moins de ce qui fait moins cinq pauget vos caresses à fait un plan que pour la première classe la variation la somme déclarée des écarts par rapport à la moyenne ces deux ensuite je vais faire le même calcul avec la donner avec les données de la deuxième classe donc j ai alors synchro casse a fait alain péloquin et ça fait 1 3-4 ça fait moins deux ans et de 47 points donc ici j'ai un plus 2 plus ce ce dernier terme qui est nulle donc la sg 2 aussi si ensuite je continue avec la croisienne place cinq mois si ça fait moins en rêver aux quarts et ça fait quand même six mois si ça fait zéro et aucun risque zéro et 7-6 a fait trois arrêts de cars et ça fait peur donc la ville aussi un plus simple c'est-à-dire 2 ça c'est la somme déclarée a-trak lacen et donc ça me donne 6 donc la somme déclarée un tracker c'est égal à 6 alors on peut voir ça en disant que on avait calculé cette somme des carrés totale qui était égal à 30 donc ça veut dire que la variation par rapport à la moyenne 7 et 30 de cette variation la de cette trempe-là six proviennent des variations 4 un trac la santé voilà c'est comme ça qu'on peut voir les choses alors qu'il ya une autre question que le truc qui est intéressante à se poser c à combien de degrés de liberté en main ici dans dans ce calcul en fait combien de données indépendantes roma de là dedans pour faire ça on va on a déjà réfléchi un peu de la même manière la dernière fois dans la vidéo précédente ici et si on se place dans cette peur dans cette première classe par exemple on a trois données et question suppose qu'on connaît la moyenne en fait la grecque deux donner indépendante là-dedans parce que si on connaît les deux sûrement koné 2 eh bien on pourra se servir de la moyenne pour calculer la troisième donnée donc en fait dans cette classe -la il n'y a pas trois données indépendantes mais deux seulement et c'est pareil dans le dans les deux autres classes et dans le cas général quand on a une classe qui contient à peine donné et si on connaît la moyenne et bien finalement il y a edmond une donnée indépendante je vais l'écrit siens le degré de liberté et danse dans ce temple nombre de variables indépendantes de données indépendantes dans ce calcul a et bien c le nombre de places 5 donc ici ces trois mais dans le cas général c'est quand même multipliez par le bais nombre de données indépendantes dans chaque classe est ici si on a peine donné un délai de six ans à peine donné dans chaque classe en fait ce que je veux dire c'est qu'il a n - zune données indépendante donc le degré de liberté là-dedans lancé ème fois et moins sont donc ici pour nous ça sera un budget l'écrire ici ici le degré de liberté il y a elle s'est également prononcée c'est égal à 3 donc c'est trois fois de detroit - za c'est-à-dire 6 ici il ya six degrés de liberté alors on fera peut-être une discussion un peu plus théorique un peu plus précise sur ce que veut dire le degré de liberté comment est ce que mathématiquement on peut l'obtenir mais là c'est utile mensah c'est vraiment ça c'est vraiment essayer de déterminer combien de données indépendantes ont marre dans dante dans notre calcul et du coup bas effectivement si on connaît dans un groupe dans une classe ainsi on connaît la mesure de tendance central donc la moyenne ici et pour le pen - -une autre donnée et bien on pourra déterminer l'albanie à me donner donc effectivement le degré de liberté c'est moins cinq plaintes au sein de ce groupe voilà on croit que c'est ça c'est la manière la plus simple plus de latitude aux critiques de voir ça on verra peut-être plus tard une manière un peu plus précise voilà donc ça c'était la lame la variation la part de la variation totale qui est dû à une variation à l'intérieure de chacun à se alors maintenant ce qu'on va faire c'est calculé la part de cette variation totale qui est dûe à une variation entre les classes donc entre finalement entre les moyennes de nos trois classes donc pour commencer on va se concentrer sur le la première la première classicisme la place et on va les regarder on va essayer de calculer la variation pour chaque donnée la variation qui est expliqué par la ram la variation de note de la moyenne de la classe par rapport à la moyenne générale alors je vais l'écrire leur jeu ça c'est cette somme que je vais calculé c'est la somme des carrés inter interclasses donc le nôtre comme ça alors je vais commencer donc par ce que je viens de dire dans le premier groupe donc pour la première la première donnée qui est ici 3 en fait je vais ne pas considérer la variation de trois par rapport à la moyenne générale mais je vais considérer uniquement la variation de cette moyenne deux par rapport larmes à la moyenne générale donc lhi 6 et 2 - 4 et ça je le lève au carré de laisser la moyenne de ma première classe et qu'après la moyenne générale ça assez la part de la variation de cette donnée-là a expliqué par amour du pardon à l'écart de cette moyenne n'a pas rapport à la moyenne générale et puis or je fais la même chose pour la deuxième valeur et en fait obtient exactement le même nombre puisque c'est toujours la moyenne de la classe qui est de moins qui est la moyenne générale au carré luce la même chose pour la 3è données de la classe donc 2 au carré alors faites tu vois j'aurais pu écrire directement que c'est il obtient trois fois la même chose en fait en trois fois la la la même quantité donc j'aurais pu écrire directement trois fois 2-4 élevée au carré gfr après ici pour séparer alors ça c'est ce qui se passe pour le premier groupe maintenant je vais faire la même chose pour le deuxième donc pour le deuxième groupe la moyenne c'est 4 donc la contribution de cette donnée-là en termes d'écarts de cette moyenne par rapport à la moyenne générale c'est alors je trouve ça assez m 4 au carré plus seul la même chose pour la 2ème donner un nom au carré plus 4 moins de quatre ans car et ça c est de la contribution de là dernière donnée et puis je fais la même chose avec la laideur et de la troisième place donc ici la moyenne de la classe et sissonne donc j'ai six heures 4 élevée au carré + r 6-4 élevée au carré encore une fois et puis encore une fois 6 - 4 élevé au carré donc maintenant je vais pouvoir faire ce calcul de l'afp dans le cas de l'agent première classe 2-4 ça fait moins de deux élevée au carré safer 4 et ça j'ai et 4 enfin et ce quatre l'on retrouve trois fois de suite donc finalement c'est la contribution de la première classe à cette variation à cette somme des carrés ces 12 plus ce pour le gain de la 2e à la deuxième place de jascha fois 4-4 ce qui fait 0 lyon carré donc ça fait zéro en fait la contribution ici et nulle dont + 6 0 et enfin pour le dernier la dernière place 6-4 ça fait deux élevés au carré ça fait quatre buts que je multiplie par 3 puisque je viens trois fois le même nombre je tire encore une fois donc finalement gm assomme déclaré intertek l'afssaps et bien c'est alors je vais l'écrire ici en rouge la somme des carrés interclasses eh bien c 24 12 plus doux ça fait vingt-quatre avant de continuer on peut se poser c'est comment la même question que tout à l'heure c'est à dire combien ce combat de degrés de liberté ici donc combien finalement interviennent de variables indépendantes quand je fais ce calcul donc pour ça on peut raisonner comme on l'a fait déjà on repense demandant bête et si je connais cette moyenne là la moyenne générale qui est 4 h si je la connais -comment de combien de deux moyenne de 2 mai classe j'ai besoin pour connaître les trois moyennes déclassées en fait laisse comme tout à l'heure on voit ici d'envoi que si je connais par exemple ces deux premières l'a enfin si j'en connais deux parmi ces trois-là je connais aussi la moyenne générale belge pourrait très facilement déterminer la troisième donner un troisième moyenne donc la moyenne de la troisième place donc finalement ici j'ai pas 3 degrés de liberté mais je n'aurai jamais que deux mais si on se met en danger le cas plus générale où on a à peine classe eh ben on va voir m moyenne donc la poursuite de la moyenne de chaque classe donc on aura et moyennes en tout et si je connais la moyenne générale il suffira que je connaisse elle - et une moyenne pour connaître effectivement aussi là la canne dernière la dernière moyenne donc le énième break voilà donc ici finalement le degré de liberté ici le degré de liberté ici c - ça et moi sommes donc ici c'est ici le degré de liberté ces trois mois ça c'est à dire maintenant je vais revenir un petit peu nos avocats nous sommes des cars et qu'on a calculé on n'avait vu que la somme des carrés totale donc ça c'est hélas cela à la variation totale de toutes les données par rapport à la moyenne générale c'est comme ça qu'on a calculé on a vu que cette c30 je vais leur écrire ici que ce soit plus claire la somme l'écart est total 30 ensuite on avait calculé que la somme déclarée un tract classement que ça c'était la somme la variation pardon amd de chaque donnée par rapport à la moyenne de sa classe 5 et on avait vu que ça ça nous donner 6 heures on peut l'écrire ici dans la somme des carrés inttra on avait dit que c'était 6 ensuite on avait calculé la somme d carrez interclasses donc c'est la variation qui est expliquée par un qui est dû à la variation contre les classes ans c'est ce qu'on a calculé en convient de calculer tout à l'heure eh bien ça on a vu que ça faisait je note comme ça interclasses le syndicat reste intacte eh bien ces 24 donc là ce qu'on peut voir tout de suite ça c'est que en général à mener c'est un résultat tout à fait générale la somme déclarée totale ça sonne décarie total donc la variation totale des données par rapport à leur moyenne générale hébert on peut la décomposer en disant que c la variation intras classe donc à l'intérieur de chaque classe la somme ça c'est ce que j'ai appelé la somme des carrés inttra classe plus la variation qui est dûe à la faa a osé carottes alors entre les classes donc ça se fait la somme des carrés un père classe ça c'est le le point fondamental de la la malice de la variance un jour c'est ça qu'il faut retenir plus important et ces ruptures bon là c'est peut-être un petit peu ça paraît un peu serait comme ça mais on fera on verra dans la vidéo précédente comment est-ce qu'on peut faire déteste d'hypothèses en utilisant à ce ce type d'analysé alors je vais avant de terminer je voudrais faire une petite remarque sur oscillé sur les degrés de liberté parce que on avait vu que la somme déclaré le total à elle avait ce qu'on appelle -5 degrés de liberté donc ça je vais l'écrire ici hein les mettre dans une mini 6 les degrés de liberté donc le degré de liberté pour la somme déclarée total en avez vu que c'était m fois haine - ça donc ici ça faisait huit ans trois fois 3-5 ça fait 8 heures donc ici ses limites et on avait vu que la somme déclarée inttra c'est le degré de liberté c'était calme fois n - za et chez nous ça faisait 6 dans notre exemple 2 tout à l'heure on vient de voir que la le degré de liberté de la somme déclarée un père classe eh bien c'était m - simple aime moins cent et -5 et pour nous c'était et on voit qu'en fait m de la même manière que pour qu'on peut décomposer la somme des cars est totale en somme de là m variations qatra classe plus la variation interclasses et bien des degrés de liberté s'ajoute aussi bien puisque si je fais et maintenant je vais faire le calcul ici si je fais m fois n - 1 20 plus m - synthes donc la somme de ces deux degrés de liberté qui sont ici ce jeu et je vais développer en faites pas ça me fait quand même fois m ça c'est que ce produit si - scène là j'ai juste développer la preuve le premier terme plus elle meurt - 5 donc geste - zeimetz la haine qui se sont amplifiées il obtient effectivement fois n - cinq pieds le degré de liberté de la somme des cars et total voilà on va s'arrêter là je voudrais juste une petite conclusion en disant que voilà le point essentiel de de tous les calculs qu'on a fait dans la vidéo précédente et dans celle-ci c'était de de montrer que la cotonnade des données qui seraient partis en classe et bien la somme la variation totale par rapport à la moyenne général 1 c'est le pc explique éric parra en fait être décomposé reprendre la variation qui existe à la terre au sein des classes donc la variation intra classe est né en variation ce qui existe entre les classes donc parés à sion interclasses et puis m il faut pas perdre de vue aussi c'est que ce taux de petites discussions convient de faire sur le degré de liberté voilà j'espère que cet arrêté est utile et puis on va se servir de ça dans la prochaine vidéo pour faire un test d'hypothèses