If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Distribution d'échantillonnage de la différence de 2 moyennes

. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

alors dans cette vidéo on va servir un petit peu de ce qu'on a fait dans la vidéo dans la dernière vidéo sur les différences de deux variables aléatoires donc là je vais prendre une variable aléatoire deux variables aléatoires j'ai déjà une première variable aléatoire que j'appelle x je peux dessiner sa distribution je vais faire et sa distribution c'est peut-être n'importe quoi enfin là je vais dessiner distribution qui est à peu près normale mais c'est pas du tout important qu'elle soit normal voilà je la dessine comme ça donc c'est une distribution qui a une moyenne réelle la moyenne sur toute la population je vais l'appeler mu 2 x voilà et puis elle a aussi une variance une variance que je note comme ça c'est la variance 2x voilà donc ça je serais je répète ça c'est ma première est variable aléatoire elle a une distribution qui peut être n'importe laquelle pas forcément une distribution normale alors ensuite j'ai une autre variable que j'appelle y ait là je vais faire pareil je vais dessiner sa distribution voilà donc là je vais décider aussi une distribution loi en cloche mais c'est pas du tout important que ce soit une loi normale et puis cette distribution est là aussi une moyenne réelle sur la population qui est muet y voilà je m'appelle comme ça et puis elle a également une variance que j'appelle comme ça sigma carré de y voilà donc ça ce sont les paramètres sur la population de la variable y alors il ya une raison pour laquelle on n'est pas obligé de partir du 2 variables aléatoires qui suivent des lois normal puisque de toute façon ce qu'on va faire maintenant c'est ce qu'on a déjà fait dans pleins pleins de vidéos passer aux distributions d'échantillonnage des moyennes donc je vais commencer par le faire pour x tout ça c'est de la révision mais je vais je vais le faire pour deux variables ce qu'on n'a pas fait d'habitude jusqu'à maintenant on avait toujours utiliser une seule variable donc là je vais commencer par donner la distribution d'échantillonnage pour ja pour la variable x je l'écris c'est la distribution d'échantillonnage des moyennes je vais prendre une taille d'échantillon donc des distributions d'échantillonnage des moyennes je vais prendre ici une taille d'échantillon taille d'échantillon de on va l'appeler n donc la taille des échantillons ici ça sera m je vais le faire en violet voilà alors bon ce qu'on sait c'est que s'il est la taille de l'échantillon est suffisamment élevée 1 on va être dans les conditions du théorème de la limite centre est donc notre distribution d'échantillonnage des moyennes va suivre une loi normale donc ça va être quelque chose comme ça je vais la trace est ici alors je vais avoir une courbe en cloche et puis est ce que je sais aussi ça c'est toujours le trm de la limite centre et sait que ça va être une courbe en cloche un peu plus resserrée autour de la moyenne avec un écart type un peu plus faible que la distribution d'origine donc je vais faire une courbe en cloche qui va être un peu plus pointu disons voilà un peu plus resserrée autour de la moyenne et c'est approximativement une loi normale donc sa moyenne une moyenne réelle aussi un sas et on l'avait appelée mu 2 x paraissent qu'on sait puisqu'on est dans les conditions du théorème de la limite centre est reine est suffisamment grand et bien on sait que cette moyenne mu 2 x par la moyenne de la distribution d'échantillonnage des moyennes de xc la moyenne des 2 x c'est la moyenne réelle sur toute la population voilà alors on sait aussi que la variance de cette distribution d'échantillonnage des moyennes alors je vais l'écrire comme ça sigma 2 x barreau carré et bien le théorème de la limite centre est nous dit que c'est cette variance là c'est la variance réel ici donc sigma au carré de x / la taille de l'échantillon qui est ici n voilà ça c'est vraiment de la révision c'est tout ce qu'on avait vu sur les distributions d'échantillonnage des moyennes donc maintenant je vais faire la même chose pour y donc ça c'était pour x et là je vais faire la distribution d'échantillonnage écrire un peu vite des moyennes de hits de y et puis je vais prendre ici une taille d'échantillon différentes pour fut pas obligé de la prendre différentes mais là je vais montrer que effectivement c'est les deux variables aléatoires je suis pas obligé de prendre les mêmes taille d'échantillon donc je vais faire ça dans le cas tout à fait général la taille des échantillons ici c'est on va dire on va l'appeler m voilà alors je vais faire comme tout à l'heure je vais tracé la loi que celui-là distribution d'échantillonnage des moyennes je sais que ça va être à peu près une loi normale et je sais aussi que sur des cartes il va être un peu plus petit donc là aussi je vais avoir une courbe un peu plus pointu un peu plus resserrée autour de sa moyenne voilà quelque chose comme ça voilà et je sais comme tout à l'heure que la moyenne de cette distribution d'échantillonnage de moyenne de y donc mû de y barre eh bien ça ça va être la moyenne réelle sur toute la population donc la moyenne mue de y je sais aussi que l'écart type de distribution d'échantillonnage des moyennes donc je vais créer plutôt je vais parler en termes de variance la variance de la distribution des sentiers nage des moyennes et bien c'est la variance réel donc sigma au carré de y divisé par la taille de l'échantillon qui est m voilà donc là j'ai vraiment fait de la révision j'ai pris deux variables aléatoires j'ai regardé leur distribution et puis regardez les distributions d'échantillonnage des moyennes dans les deux cas alors bon tu te demandes portent peut-être pourquoi j'ai fait la même chose avec deux variables différentes et bien c'est parce que maintenant je vais considérer une nouvelle variable une nouvelle variable aléatoire que je vais appeler z est en fait cette variable aléatoire ça va être la moyenne 2 x - là je vais prendre les mêmes couleurs - la variet la moyenne des y alors je vais préciser un petit peu ce que ça veut dire là j'ai donc ma variable x je prends un échantillon par exemple de taille n donc je peux dire par exemple de taille 30 pour un échantillon de taille 30 là dedans je calcule sa moyenne en fait cette moyenne c'est un élément de la distribution d'échantillonnage des moyennes c'est une donnée de cette distribution d'échantillonnage des moyennes donc je vais pouvoir si par exemple ici j'ai trouv j'ai pris mon échantillon et que j'ai trouvé que la moyenne s'était 9,2 et bien ici 9,2 ça sera un une valeur de cette distribution d'échantillonnage des moyennes de x est donc ici j'aurais x parts égales 9,2 par exemple et puis je fais la même chose avec y donc le gema distribution j'ai ma mamma variable aléatoire y avec sa loi et je prélève un échantillon de tailles différentes par exemple 50 je prends un échantillon de taille 50 là dedans je calcule la moyenne et j'obtiens une valeur y part de cette distribution d'échantillonnage des moyennes en fait et bien ce que je vais considérer maintenant c'est la variable aléatoire qui consiste à dire ben quand je prends un échantillon de taille n j'ai une moyenne x barre et quand je prends un échantillon de taille différente un pas forcément exe pas forcément obligé de prendre la même taille d'échantillon donc je prends une taille je prends un échantillon de taille m de la variable y je calcule sa moyenne j'obtiens une valeur de y barre et bien dans ce cas là la variable z c'est la moyenne de l'échantillon que j'ai prélevé dans la distribution des xe - la moyenne de l'échantillon que j'ai prélevé dans la distribution d y voilà donc j'obtiens en fait une autre variable aléatoire qui va dépendre de l'échantillon 2x que j'ai prélevé et de l'échantillon de y que j'ai prélevé voilà et donc là ce qu'on va se demander c'est qu'elle est la loi de cette variable aléatoire de cette nouvelle variable aléatoire différence variable z qui est x barmon y barre alors on va essayer de construire cette loi la loi de la variable z en fait il ya déjà des choses qu'on sait d'après la vidéo précédente à la vidéo qu'on a fait la dernière fois on sait par exemple quelle est la moyenne de cette variable ça je vais l'écrire ici la moyenne deux aides donc je peux l'écrire comme ça c'est la moyenne de x barre je gardais les couleurs c'est la moyenne de x bar - y barre voilà et ça on avait vu la dernière fois dans la vidéo précédente quand fait donc c'est la moyenne du différence de deux variables aléatoires donc en fait on avait vu que c'était la différence des moyennes des deux variables aléatoires donc on va pouvoir écrire ça comme ça c'est mu 2 x barre mu 2 x bar - mu de y bar - mu 2 y - mu de y bar voilà ça c'est ce qu'on avait vu dans la dernière vidéo enfin c'est une des choses qu'on avait vu dans une des relations qu'on avait vu dans la dernière vidéo il faut supposer que x bach y bars sont indépendantes bien sûr évidemment ici on travaille d'une manière un petit peu abstraite on verra des cas plus concret avec plus avec des valeurs numériques dans les prochaines vidéos et pour ce que je peux te dire tout de suite c'est que en fait l'intérêt de ça ça va être de pouvoir faire une inférence statistiques sur une différence de moyenne donc on va pouvoir donner un intervalle de confiance par exemple d'une différence de deux moyennes ou faire des choses de ce genre là c'est ce qu'on fera dans les prochaines vidéos voilà lorsqu'on avait vu dans la vidéo précédente c'était aussi le calcul de la variance d'une différence de deux variables aléatoires indépendante donc on avait vu que la variance je vais l'écrire ici la variance de z donc que je peux écrire comme ça c'est la variance comme je viens de l'écrire 2x bar - y part ça c'est la variance deux aides est ce qu'on avait vu c'est que la variance d'une différence de deux variables aléatoires et bien c'est la somme des 2 variance d2 variance des variables aléatoires donc c'est la variance 2x bar plus la variance de y barre voilà ça c'est les deux résultats de la vidéo précédente qu'on avait établi qu'on avait vus et donc en fait on peut déjà avoir une expression des deux paramètres de la variable z alors maintenant on va essayer de tracer à tracer sa distribution donc ça va être une loi normale aussi donc ça on va pas le démontrer ici mais c'est une loi normale donc je vais tracer une courbe en cloche comme d'habitude et ce que je sais c'est que l'écart type de cette variable là ça va être un écart qu'il va être un peu plus grand que celui ci un peu plus grand que celui là puisque la variance ici c'est la somme des deux variantes donc l'écart type de ma variable z va être supérieur aux 2 écart type 2 mais variable x et y x paraît grec barre donc je vais tracer une courbe en cloche plus épaté disons plus large avec un sommet plus aplatie pic - moins pointu que les deux distributions que j'avais ici puis bon je vais pouvoir placer la moyenne alors la moyenne c'est ici c'est nu 2x bar - y barre est ce qu'on a vu c'est accepter la différence des deux moyenne donc mû 2x par - mu de y barre et puis cette distribution a aussi une variance alors la variance on l'a écrite ici indique la réécrire comme ça c'est sigma 2 x par mon y bar au carré voilà alors ce qu'on peut faire aussi c'est donner une expression de cette variance l'a1 sigma 2 x baroin y barre donc la variance de cette distribuer de cette variable là on peut l'exprimer en fonction des deux variance d'origine puisque nous ce qu'on avait vu c'est que la vaillance de x barre c'était la variance réels de la population x / haine et la variance de y la variance réel de toute la population d y sur la taille de l'échantillon m donc on va on peut l'écrire ça on peut donner une autre expression de cette variance là je vais l'écrire comme ça la variance 2x bar - y barre eh bien on va la récré en se servant des relations du dessus de ces deux relations là celle ci est celle là donc cette valeur là la variance 2x barbe je vais l'écrire comme variance 2 x / n plus ce terme si variance 2x bar qui est la variance de y la variance réel de y divisé par la taille de l'échantillon qui est m voilà donc là on obtient une autre expression de la variance 2 x y 2x bar - y barre en fonction des deux variance réel et détail des échantillons donc ça c'est une une relation intéressante et puis à partir de cette formule on peut calculer l'écart type de notre distribution différence des moyennes ben tout simplement en prenant la racine carrée des deux membres donc ici on va avoir la racine carrée de la variance de légumes ax bar - y bat pincer l'écart type 2 x bar - y barre et ça je vais pouvoir l'exprimer comme la racine carrée de cette expression là de cette somme là donc de l'écart type la variance par non sigma 2 x et la variance réel des de la population x / n taille de l'échantillon qu'on a pris dans cette population de x plus la variance la variance d y règne en ce réel d y divisé par la taille de l'échantillon n taille des échantillons qui est de mi6 voilà donc ça c'est la formule qui donne l'écart type en fonction des variances d2 distribution dont on est partis l'écart type de la différence en fonction des variances des deux variables et c'est une formule assez intéressante parce qu'elle ressemble un peu à une distance on dirait un peu une ex l'expression d'une distance et ben on verra plus tard si on arrive à dégager des outils pour visualiser sain pour comprendre un petit peu mieux ça voilà enfin bon ce qu'on va faire dans les prochaines vidéos c'est qu'on va faire de l'inférence statistiques avec cette ce qu'on vient de faire ici sur la différence de deux variables en prenant par exemple deux échantillons et en regardant s'il est probable que ces deux échantillons et la même moyenne on va faire donc de la statistique inférentielle avec deux variables voilà donc ça c'est le programme pour les prochaines vidéos à bientôt