Contenu principal
Heure actuelle :0:00Durée totale :10:14

Transcription de la vidéo

alors dans les vidéos précédentes on avait utilisé cette série de données donc là on a neuf données réparties en trois classes différentes la classe pour la classe de la classe 3 et donc on avait travaillé sur ces données pour calculer la variante la variation totale pour cent par rapport à la moyenne générale qui était capricieux donc tout ce qu'on avait fait ici en calculant la somme l'écart est totale % et boxer les écarts entre vous n'avez qu'à trouver que cette somme déclarée total elle valait 30 et ensuite qu'on s'était demandé cet été quelle est la parade cette variation totale qui provient d'une variation à l'intérieur des classes donc dés de la variation des données par rapport à la moyenne de leurs classant donc c'est ce qu'on avait quelques lits si la somme déclarée un trac la sauce qu'on va les appeler ça comme ça et on avait trouvé que cette parade de variation intras classe c'était six heures voilà donc de ces trente lits 6% il n'y pas d'unité maison plus de sept heures variation totale de 30 et voici ce qui provient d'une variation intras classe et le reste provient de ce qu'on appelle la variation la paire classe donc de la variation entre les ponts entre les classes ici entre les classes de données donc on avait calculé aussi cette somme déclarée donc cette variation rattraper interclasses ccn ce calcul qui est ici on avait trouvé que la somme déclarée à l'interclassé qui est égal à 24 et on a vu qu effectivement si on additionne la somme des carrés un trac lassissi de six et la somme déclarée à l'interclassé bien on retrouve la somme déclarée total alors ce que je préfère dans cette vidéo c'est tout utilisé à ce qu'on vient de faire utiliser ses résultats la banque en fait on a calculé des délices des statistiques ins sur notre sang nous donner je voudrais utiliser ces statistiques pour testé en fait quelque chose pour arriver à tirer des conclusions d'un certain type 1 alors pour faire ça je vais quand même essayer de contextualiser un petit peu ce qu'on a ici donc on va - supposer que par exemple- âgées j'ai eu et j'ai pris trois trois groupes de patients et elle je le réaliserai à chacun pour soi une pilule enfin un médicament bien on va dire plutôt remaniement donc là ce groupe-là il a bien géré les aliments 1 celui-ci est bien gérée aliments 2 et celui-ci il a ingéré un aliment 3 et la roma les résultats de ce test important sur chacun des trois groupes alors maintenant la question que je me posais évidemment naturellement c qu'est-ce qu'on peut le tirer comme conclusion sur un l'impact des aliments est-ce que c'est ce que vous verrez table m'en mêle le fait d'agir et elle alimente un roulement de roulement 3 à rome un paquet sur abc les résultats des mesures qui sont fait ici donc évidemment si je regarde simplement les moyennes de ces trois classes à un monde se croise échantillons pourraient dire r je pleurais tout de suite en conclure que les la pâte est plus fort ici parce que l'âme les mesures sont plus la moyenne est plus élevé quand on m'a jamais dit non 3 que quand on n'a jamais demandé où les mouvements armés là ce que je peux demander 'c'est est-ce que cette différence de moyenne et simplement dû au hasard ou bien est ce qu'elle est elle reflète vraiment une différence me sur la population totale donc en fait la question mama question ici ça va être est ce que les moyennes mais moyenne ici et les populaires les les moyennes sur rtl sur les populations sont identiques alors une autre manière de de formuler sa pensée est-ce que tu es plage peut supposer j'ai un échantillon donc évidemment c'est un échantillon seulement que par interroger toute la population des gens qui ont mangé cet aliment par exemple mais je vais pouvoir en commettre considérer la lave en théorie la moyenne réelle sur la population pour cela je vais l'appeler mua et puis je peux faire la même chose sur la la la la population de requis à manger du monde donc ça ça sera une moyenne raimu 2 et puis la moyenne réelle pour la population qui a mangé aliments 3 donc la question c'est ça est ce que les moyennes à réelle de nos 3 occupation trompette régaler ce que alors on va avoir lieu murray galamus de l'est le gala de l'e3 alors effectivement si cette égalité n'est pas vérifiée donc si une différence entre ces trois mois et moyenne réelle eh bien je vais pouvoir en conclure qu effectivement les aliments le type d'aliments qu'on a un jeu aaa ont un impact sur cette étude alors donc je vais faire un test cette hypothèse donc je vais commencer par définir les hypothèses je descends un petit peu donc je vais les finir d'abord l'hypothèse nulle alors que la définir comme ça l'hypothèse nul c'est l'hypothèse a accusé euros c'est l'hypothèse selon laquelle l aliment n'a pas d'impact l'alignement n'a pas d'impact alors l'hypothèse alternative évidemment c'est l'hypothèse a h1n1 je l'appelle comme ça selon laquelle les aliments après un impact l'alignement on a un parc dans le premier quart dans le cas de l'hypothèse multi la limande a pas d'impact ça veut dire que les moyennes réelles sur les populations dans le groupe a un bon groupe de grands groupes 3 seront toutes les trois identifiants donc ça ça veut dire que on va avoir une loi égales à menu 2 égal à populaires et moyennes sur les populaires et moyennes réel sur toutes les populations sur les trois populations seront égales par contre si l'hypothèse alternative est vérifiée eh bien ça voudra dire que les aliments a un impacte donc que les c3 moyenne ne seront pas toutes les trois égards comment est-ce que je vais faire ce test et d'hypothèses mais comme d'habitude je vais commencez par supposer que l'hypothèse du livret a donc ça c'est ce qu'on fait à chaque fois dans les tests et d'hypothèses on suppose h 0 que m zéro et frais et ensuite on va calculer une statistique du test et puis on va voir à la probabilité de d'avoir une valeur aussi extrêmes que celles qu'on aime que la valeur de la statistique qu'on a calculé alors là je parle un petit peu d'eau fou parce que j'ai pas encore défini ce que c est que cette statistique du texte alors la statistique du test ici qui va nous être utile c'est ce qu'on appelle une statistique f statistiques statistiques du mal aujourd'hui et en fait cette statistique sl va suivre une loi de fischer noura de fichiers alors je vais pas à faire une discussion théorique sur ses toits de fission heures ce qu'on peut dire tout simplement c'est que la porte pour nous pour nous ça suffira on va tout simplement se dire que mais cette statistique s en fait c'est une il ne nie la caution de 2 de de faryab qui suivent une voix du type 2 alors douadi qui devait quand même pas nécessairement le même degré de liberté donc voilà la rue caution de 2 variable qui suivait une voix du type du type de savard et ça va donner une variable qui suit loi de fischer on dit aussi qu'il doit de fissures se les décors ce sont les deux mathématiciens qui sont introduites alors d'ici-là statistiques actuelles et je vais la définir à partir des quantités qu'on a calculé dans les vidéos précédentes en donc à partir de ces sommes déclarées et en fait je vais la définir comme ça alors je vais respecter code couleur notre valeur de la statistique r ça va être la somme a déclaré un père interclasses ce que j'avais noté comme ça sc un père divisez par a son degré de liberté lors de son degré de liberté on a vite vu que c'était m e - 5 - 5 donc ça en fait selon moi on pourrait voir ça comme la moyenne des carrés inter classe puisque c'est une sorte de moyenne divisez par là je vais utiliser la faille à sion un trac la sarre certes je vais l'écrire comme ça divisez par la somme des carrés intras intras classe que je divise également par son degré de liberté qui été fois el menzah m n - voilà c'est comme ça que je vais définir cette statistique esye alors quoi cette définition l'a déjà on peut en tirer quelque chose c'est que et si le numérateur est beaucoup plus grand que le dénominateur mais ça voudra dire que selon le principe revenir à mes données ici ça voudra dire que la fin de la part de la variation pour ce qui est du à des variations inter classe est beaucoup plus importante que la variation qui est dûe à des variations inttra classement qu'au sein des classes donc la part des variations entre les moyennes des classes sera beaucoup plus importante que la part de la variation et qui est dû à l'intérieur des classes à l'intérieur des classes elle-même et ça c'est important parce que ça voudra dire que si effectivement recent ce nombre est très grand donc si le numérateur est beaucoup plus grand que le dénominateur et bien on va enfin avoir un forte par la variation qui est dû on va rien sur un terre-plein 5 et donc on aura la pression qui effectivement le aliments ne pas avoir eu un impact surin les résultats de de but est atteint et autrement dit ainsi c'est le nombre est très grand eh bien on aura une très faible probabilité que l'hypothèse qu'il soit vrai pendant que l'allemand détenait pas d'impact alors alain vers 6 6 au contraire le numérateur est beaucoup plus petit que le dénominateur donc si ce soit cette quantité l'a beaucoup plus grande ça voudra dire que effectivement par la plus importante le plus gros pourcentage de variation est observée en fait à l'intérieur des échantillons et donc on va pouvoir se dire que les différences qu'on a observés dans fait ce sont tout simplement des différences aléatoire du à l'échantillonnage et dans ce cas là effectivement ça deviendra un peu plus difficile de les rejeter l'hypothèse où m holder ici pour la roma calculer la valeur de notre test ici dans notre cas la somme des carrés un père on avait vu que c'était hier enfin de 86 noter ici 4 divisez par le degré de liberté le degré de liberté on avait dit que c'était 2 ici donc 24 divisé par deux et puis je me disais tout ça part la somme déclarée inter un pra classe pardon qui été 6 5 et que je divise encore une fois par son degré de liberté qui c'était si saucisses donc finalement là cathy stick est-ce la valeur de la statistique esye cissé alors le dénominateur ici si divisé par six à sept points donc il nous reste à calculer ce numérateur 24 divisé par deux sa fait 12 donc notre statistiques efficy helfaut douceur alors ça on va voir que c'est une valeur assez élevé mes projets il ya quelque chose que j'ai oublié de faire et qui est vraiment très important quand on fait un test à statistiques attestent d'hypothèses c'est de fixer le seuil de signification pour ça c'est très important donc ici au vestiaire par exemple on va fixer un seuil de signification de 10% de zéro virgule zéro virgule ça ça veut dire quoi ça veut dire que lgv est calculé de la statistique du test ici et puis qui sait si j'ai une probabilité est inférieur à 28 6% d'avoir obtenu une telle valeur de la statistique f eh bien je vais pouvoir rejeté l'hypothèse nu mais si au contraire la probabilité d'une telle valeur de la statistique f et supérieur à 10% et bien je ne pourrais pas ajouté rejeté l'hypothèse donc cela c'est ce que je vais faire je vais en fait essayé de calculer la statistique la valeur de la statistique f la valeur critique de la statistique ce qui correspond à ce seuil de signification et puis je vois comment elle se situe par rapport à notre valeur ici de 12 de la statistique est-ce qu'on a calculé statistiques de notre texte alors avant d'aller le prix garder dans la table de la loi suisse air avec notre seule signification de de 10% de ses revenus le temps dakar 9 ème titre marca ici on va d'autres statistiques f en larmes produite comme étant le quotient aux 2 2 % faryab le de valeurs qui vont suivre toutes les deux des lois du kid alors le numérateur et va suivre une loi du type 2 avec elle au moins 20 ans le degré de liberté donc dans notre cas de degrés de liberté et puis le dénominateur va suivre une loi du kid aussi avec les 6 degrés de liberté donc ça c important je vais pas rentrer dans des détails de de la loi de scission armés dans notre cas mais c'est une autre vague d'autres statistiques de tête du test rudoie de fissures puisque c'est une heure la caution de 2 la variable qui suivait loi du kit de avec m de degrés de liberté pour le numérateur et 6 degrés de liberté pour le dénominateur alors je vais prendre le même dans une table de la loi de 2% l'afficheur l'ordre juste une chose à dire portante c'est que y a plusieurs tables de la loi de sitia puisque en fait on a une par ceux de signification dans un peu âgées j'ai pris la table de la loi de fichiers leurres semés décor le correspondant reçoit et de significations de 10% donc c'est-à-dire la valeur alpha égal zéro virgule donc d'ici pour qu'on avait bien vu que c'était une une table qui veut que kelley dépendre de deux paramètres le degré de liberté du numérateur pour nous ces deux alors je vais entouré cette valeur-là 2 et le degré du bf de liberté du dénominateur qui pour nous était et 6èmes si je me souviens bien voilà c'est ça le nom- le degré de liberté du dénommé une d'une mère a peur c'est de et le degré de liberté du dénominateur c6 donc je vais chercher maintenant la ligne si ce qui est ici donc finalement la valeur que je cherche c'est celle-là c'est rouen qui régule 46 trois des inculpés en 6 ça veut dire que ma tête macnab valeur critique de la statistique fr je vais l'appeler comme ça f critique eh bien ces deux virgules 46 la virgule 46 alors nous la valeur de la statistique f on m'a ému pis à un bien supérieurs à celles-ci un puisque nouvelle je suis pour nous elle vaut 12 et la valeur critique vaut deux de véhicules 46 donc effectivement d'autres valeurs à nous les biens bien supérieur elle avait alors critique non qu'il y ait commencé que il ya une probabilité inférieur à 10% d'avoir une valeur supérieure à deux virgules 46 à cette valeur critique nous on fait là on va on a une valeur nettement supérieur à ça donc on a aimé une probabilité nettement inférieur à 10% d'avoir eu une valeur aussi extrême que celle-ci 12 dans notre cas donc ça veut dire que on va être conduit à rejeter une autre hypothèse nulle dans ce cas-là donc ça c'est la conclusion on rejette on rejette à 0 on rejette à 0 parce que 12 la valeur le site de notre statistiques f est très nettement supérieur à la valeur de la statistique la valeur critique de la statistique f voilà donc on va pouvoir conclure que finalement il ya probablement les de l'alimentation a probablement un impact sur eux cette étude et pour de bon quand on fait cette conclusion on sait que trop prend un risque d'erreur de première espèce de 10%