If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Exemple de problème utilisant la distribution d'échantillonnage

Trouver la probabilité de manquer d'eau au cours d'une randonnée. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

  • scuttlebug yellow style l'avatar de l’utilisateur Wombat mal léché
    Bonjour!
    J'ignore ce qu'est une valeur centrée réduite... Quelqu'un peut-il m'expliquer?
    Et comment peut-on savoir que cette courbe obéi a une loi normale?
    Désolée pour mon manque de bases et merci d'avance!
    (1 vote)
    Default Khan Academy avatar l'avatar de l’utilisateur
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

en moyenne un homme en activité physique consomme 2 litres d'eau de litres d'eau en une journée avec un écart type de 0.7 litres vous organisez un trek d'une journée en pleine nature avec 50 hommes et vous prévoyez d'emmener 110 litres d'eau quelle est la probabilité que vous soyez à court d'eau ou alors on va commencer par examiner un petit peu ce qui se passe ici en fait on a une distribution statistique qui représente la consommation moyenne d'eau d'un homme des hommes en une activité physique 1 alors donc ça va être une distribution je vais essayer de la trace est à peu près donc fait mes axes ici on à laax ne c-zéro cette valeur là donc effectivement c'est une limite parce que personne ne boit moins 2 0 litres d'eau par jour c'est pas possible et ensuite donc on a une distribution statistique je peux pas la connaître je n'ai aucune idée de la forme qu'elle a c'est peut-être une distribution normale c'est peut-être une distribution complètement beaucoup plus bizarroïdes enfin bon je peux quand même me faire une idée par exemple peut déjà supposer que il peut y avoir des gens qui boivent très très peu d'eau mais quand même plus que 0 litres qui boivent un petit peu d'eau voilà ça va être quelque chose comme ça il y en a beaucoup qui boivent ou quelque chose parler autour de cette valeur là qui va être de litres je vais déjà tracé la moyenne placé la moyenne ici c'est la moyenne de la distribution c'est donc la consommation d'un homme en activité physique en moyenne donc ces 2,2 litres donc ce que je disais c'est que la consommation c'est de la distribution statistique donc y avoir une grande partie des gens qui vont consommer autour de 2 litres d'eau et puis disons qu'il doit y avoir peut-être une consommation maximale qui sera ici et qui va être 4 litres 1 voilà alors ça c'est la première chose et puis on nous dit aussi que cette distribution l année car type de 0,7 litre donc ça je vais le placer 0v alors ici ça va être ici c'est 3 litres là ici c'est un litre et donc notre écart type il est un peu moins de 2,1 donc c'est et voilà ici ça va être on va dire 2007 donc ça c'est un écarté cette distance là c'est un écart type et puis de même on a ici un autre écart type 1 2 litres - un écart-type voilà donc ça c'est l'écart type qui est qui et la voilà je peux même faire des des lignes pointillées comme ça pour indiquer les écarts types voilà donc ça c'est un écart type en dessous de la moyenne et ça c'est un écart type au dessus de la moyenne donc je vais le noter ici la valeur de cet écart type c 0,7 litre voilà donc ça c'est ce que pourrait ce à quoi pourrait ressembler la distribution de la consommation moyenne des hommes en activité physique par jour alors maintenant on va continuer on va rentrer dans le coeur du problème donc vous organisez un trek d'une journée en pleine nature avec 50 hommes 50 hommes et vous prévoyez d'amener 110 litres d'eau donc on nous demande de calculer les probabilités de finir à court d'eau avant la fin de la journée alors cette probabilité d'être à court d'eau qu'est ce que c'est donc je vais l'écrire ici la probabilité d'être à court d'eau et bien bon c'est tout simplement la probabilité on peut le dire comme ça c'est la probabilité de consommer que les 50 personnes consomment plus de 100 litres de 110 litres d'eau 1 210 litres d'eau puisque nous on à 110 en emmener 110 litres d'eau donc la probabilité d'être à court d'eau basse et la probabilité d'avoir consommé plus de 110 litres d'eau à nous tous un alors là on peut transformer sa encore puisque si on est 50 personnes donc moi compris et toi compris plus les 48 autres on est 50 personnes et le fait qu'on consomme plus de 110 litres d'eau on va pouvoir traduire sa part une valeur moyenne on va dire que ça c'est la probabilité que en moyenne une personne consomme plus de plus de alors faut calculer du coup la valeur 110 / 50 cent je vais le faire avec la calculatrice impôts à hauteur de pas me tromper 110 / 50 ça ça fait donc 2,2 litres donc il faut quand en moyenne une personne consomme plus de 2,2 litres voilà donc là j'ai réécrit en fait la probabilité d'être à court d'eau de manière différente en faisant intervenir la moyenne la consommation moyenne par personne consommation d'eau moyenne par personne au cours de cette journée alors là il serait utile de revoir de bien comprendre ce qu'on fait ici en fait on part d'une distribution statistique qui nous donne la consommation moyenne d'un homme en activité physique voilà et là en fait ce qu'on va faire puisqu'on prend 50 hommes on va en fait prélever 5 ans tom dans cette distribution d'origine qu'on connaît pas en fait là on nous en donne les paramètres on à la moyenne et l'écart type en a aucune idée de comment ça a été calculé tout ça probablement d'avec un grand grande très grande et un échantillon donc on a calculé la moyenne et l'écart type à partir d'un très grand échantillon et on en a déduit que c'était un bon estimateur de la l'écart type et de la moyenne de la population complète un réel de tous les hommes en activité physique voilà donc ça c'est probablement peut-être que ça a été fait au cours d'une grande enquête enfin je ne sais pas là ce qu'on sait c'est qu'on va prélever 50 hommes là dedans et en fait la probabilité qui nous intéresse avec la probabilité que la consommation moyenne de 7 échantillons donc de ces cinquante hommes soient plus grande que 2,2 litres et pour faire ça il faut qu'on arrive à déterminer à savoir qu'elle est là la distribution des mois de la moyenne des échantillons donc et ça on sait ce que c'est en fait c'est la distribution d'échantillonnage des moyennes donc il faut qu'on arrive à déterminer la distribution d'échantillonnage des moyennes de cette distribution alors ça ça a été le sujet de toutes les vidéos précédentes d'un certain nombre de vidéos précédentes et on sait que cette distribution d'échantillonnage des moyennes elle va être va suivre une loi normale donc là ce que je vais commencer à faire c'est j'ai essayé de tracer la distribution le graphique de là distribution d'échantillonnage des moyennes distribution d'échantillonnage d'échantillonnage des moyennes voilà ça on l'a vu dans plusieurs vidéos donc on connaît un certain nombre de propriétés de cette distribution d'échantillonnage des moyennes donc je vais commencer par tracé des axes voilà un axe est un autre axe alors maintenant je vais récapituler un petit peu tout ce que je sais sur cette distribution d'échantillonnage des moyennes alors on sait je viens de le dire tout à l'heure que quelle que soit cette distribution la même si elle n'est pas normal du tout s'il est très bizarre et bien la distribution d'échantillonnage des moyennes va suivre une loi très proche de la loi normale ici en plus on a une taille d'échantillon de 50 50 qui est assez élevé donc on va vraiment avoir quelque chose de proche d'une loi normale alors je rappelle rapidement un ce qu'on fait c'est que on prend 50 valeurs dans cette dans cette distribution l'a donc 50 hommes ont contre on calcule leur consommation moyenne par jour en activité physique on place la moyenne cette moyenne l'a obtenu à partir de cet échantillon sur ce graphique et puis on refait sa un très grand nombre de fois en quelques mois on fait ça sur pleins pleins d'échantillons de taille 50 donc ça effectivement les oublier de le dire ici c'est la distribution d'échantillonnage des moyennes pour n égale 50 et donc on fait cette opération là et on va obtenir on va placer ici toutes nos moyennes des échantillons et ce qu'on sait c'est que on va donc avoir obtenu une distribution statistique aussi est ce qui va être proche d'une loi normale est en fait la moyenne de cette distribution la moyenne mu x barlow c'est la moyenne de la distribution d'échantillonnage des moyennes donc pour x barre pour vous notez que c'est la variable c'est une moyenne des moyennes des échantillons ici le paramètre qu'on indique ici eh bien ça va être la même valeur que la moyenne de la population initiale donc ici je vais reprendre je vais l'écrire comme ça notre moyenne de la distribution d'échantillonnage des moyennes elle va avoir comme moyenne le paramètre mue de la population totale ce qui est égal à 2 litres voilà et puis on avait vu aussi d'autres choses on avait vu quelque chose concernant la variance où l'écart type fait je vais d'abord à l'exprimer en termes de variance on sait que la variance de notre distribution d'échantillonnage des moyennes que je note comme sahin sigma 2 x bar au carré et bien c'est tout simplement la variance de la population initiale divisé par la taille de l'échantillon voilà ça c'est ce qu'on a vu dans la dernière vidéo et puis on peut effectivement en prenant tout simplement la racine carrée des deux membres on peut en déduire une expression de l'écart type de la distribution d'échantillonnage des moyennes qu'on avait noté comme ça on peut l'appeler aussi l'erreur type de la moyenne donc 7 cet écart type cette erreur type de la moyenne on va l'obtenir de cette manière là c'est sigma donc je prends la racine carrée de la variance de la population initiale donc c'est l'écart type de la populeuse de la population initiale / racines de haine qui est la taille de l'échantillon voilà donc ça c'est la formule qui va nous donner l'écart type de la distribution d'échantillonnage des moyennes alors dans notre cas l'écart type de la population initiale c'est 0.7 donc on va voir ici 07 / racines de carhaix de haine ici n est égale à 50 donc il faudra qu'on divise par racine de 50 donc ça je vais faire avec la calculatrice alors 0,7 / racine carrée de 50 ça me donne 0,98 99 donc là je vais arrondir à 0,0 99 on va dire ça c'est à peu près égale à 0 0 99 donc maintenant on connaît notre loi normale à notre distribution d'échantillonnage des moyennes pour n égale 50 donc je vais essayer de la trace hélas ici donc on va déjà avoir une moyenne de 2 litres ici voilà alors je vais placer donc ça ça va être un litre l'a donc ici c'est 3 litres voilà et donc on va avoir une courbe en cloche père par femme symétrique par rapport à cet axe là avec un écart type 2 un peu moins d'un dixième 00 99 c'est un tout petit peu moins qu'un dixième donc on va avoir une courbe qui va être très resserré autour de cette moyenne donc là je vais essayer de la trace et donc on va avoir une courbe vraiment très très resserré comme ça va ressembler à quelque chose comme ça symétrique par rapport à la moyenne et puis on pourrait aussi placer l'écart type donc un peu plus petit que 1 10e 1 0 0 99 c'est un petit peu moins que 0,1 donc il faudrait partager cet intervalle laon 10 en 10 parties on en rêve voilà je vais le placer à peu près ici donc ça ça va représenter un écart type avant la moyenne et ça ça va représenter un écart-type après la moyenne donc voilà ça c'est la distribution d'échantillonnage des moyennes pour n égale 50 et nous ce qu'on veut c'est savoir quelle est la probabilité que notre moyenne soit plus grande que 2,2 litres c'est ce qu'on a dit ici donc en fait alors 2,2 litres je vais pouvoir le placer ça va être ici voilà ça c'est 2,2 litres et du coup en fait la probabilité de finir à court d'eau c'est la probabilité d'avoir une moyenne supérieure à 2,2 donc en fait c'est la probabilité que notre moyenne se situe dans cette partie là de du plan sous la courbe pour des valeurs plus grande que 2,2 litres non c'est toute cette partie que j'ai assuré en rouge ici est donc ce qu'on doit faire nous c'est calculé finalement l'air de cette partie du plan puisque l'air de cette partie là bas ça va être exactement la probabilité que la moyenne x barre soit supérieure à 2,2 litres voilà donc pour calculer cette probabilité en fait ce qu'on veut faire c'est regarder à combien 2,2 à combien d'écart type de la moyenne se situe cette valeur là 2,2 et puis ensuite on veut donc ça ça veut dire qu'on va passer à la variable centrée réduite un associé à cette autre variable aléatoire ici donc on va pouvoir ensuite utilisé une table de la loi normale pour déterminer cette cette probabilité qui est ici donc la leyre de cette surface la voilà alors j'ai remonté un petit peu ça et on va calculer ici la variable centrée réduite donc la variable centrée réduite je vais l'écrire que ça variable centrée réduite ça on l'a vu dans d'autres vidéos c'est en fait la variable qui mesure l'écart par rapport à la moyenne en terme d'écart type donc on va d'abord calculé donc je vais l'appeler z7 variable centrée réduite l'écart par rapport à la moyenne c'est donc 2,2 - la moyenne 2,2 -2 et puis il faut pour exprimer sa en terme d'écart type il faut diviser par l'écart type alors on va diviser par l'écart type ici notre écart type c zéro points 0,99 0,0 99 donc là j'ai vraiment le numérateur c'est l'écart par rapport à la moyenne de notre valeur de 2 et je les exprime en terme d'écart type en divisant par 0 points 0,99 c'est vraiment ça la variable centrée réduite donc je vais calculer cette variable là alors je vais faire comme ça je vais faire 2,2 -2 fermer la parenthèse et je vais / la réponse précédente comme ça je vais pas d'approximation je ferai une approximation seulement là je calcule avec la valeur totale qui est donnée ici donc je vais faire sa seconde pointe donc là je fais / la valeur du dessus qui était une valeur plus exact que celle que j'avais noté l'a déjà on dit donc et j'obtiens 2,02 donc je vais arrondir sa bouille à 2,02 donc la variable centrée réduite ses environs 2,02 alors en fait on avait déjà traduit la probabilité qu'on cherche d'être à court d'eau celle ci on m'avait dit que c'était la probabilité qu'en moyenne une personne qu'on ne consomme plus de 2,2 litres on peut l'écrire comme ça aussi si notre variable aléatoire de la distribution d'échantillonnage on l'appelle x barbe on doit chercher la probabilité que x barre soit supérieure à 2,2 litres donc à 2,2 et quand on passe à la variable centrée réduite vient il faut que la probabilité que la variable est donc celle à z suis une loi normale centrée réduite de moyenne 0 et 2 d'écart type 1 eh bien il faut que ce soit supérieur à 2,02 voilà donc là on a traduit sa en termes de lois normales centrée réduite du coup on va pouvoir prendre une table des valeurs de la loi normale sans très réduite donc ça c'est une table qu'on trouve à peu près partout sur internet ou bien on peut même le calcul est avec la calculatrice voilà ça se présente comme ça alors je vais faire un petit point d'abord parce que c'est ce que donnent ces valeurs ici c'est pas la probabilité que la variable soit supérieure à une valeur donnée mais qu'elle soit inférieure à une valeur donnée donc en fait ce qu'on va pouvoir trouver dans cette valeur c'est la probabilité de enfin l'air de toute cette surface là on ici ce qui est donné dans par par cette surface la leyre de cette surface là ça va être la probabilité que x barre ça c'est la probabilité que x barre soit inférieur à 2,2 et donc c'est la probabilité que notre variable z qui suit une loi centrée réduite soit inférieur à 2,02 voilà ça c'est la valeur qu'on va trouver cette probabilité là on va pouvoir la trouver dans la table de la loi normale donc ça va nous donner l'air de toute cette surface là et après il faudra qu'on en déduit celle là alors je vais le reprendre donc ici comment est ce que ça marche on cherche de la valeur z égale 2,02 donc là on va se mettre déjà dans les unités 2,7 cette ligne là ici c'est 2.0 ici c'est 2,01 et ici ses 2,02 donc ça cette valeur là c'est celle qu'on cherche donc on peut en déduire ici que la probabilité que notre variable z soit inférieure à 2 02 c'est zéro virgule égal à 0 97 83 voilà donc faire monter un peu maintenant donc cette valeur là toute cette partie du plan situé sous cette courbe là que j'ai assuré envers elle a une aire de 0.97 83 et donc nous ce qu'on cherche c'est la probabilité d'être à court d'eau je vais l'écrire ici la probabilité d'être à court d'eau et bien en fait c'est tout l'air sous la courbe moins celle qu'on vient de calculer qui assurait envers la partie en rouge seiler total qui est sous la courbe qui vaut 1 - celle qu'on vient de calculer assuré envers donc c'est un moins cette valeur si que j'ai très calculée au dessus 1 - 0 97 83 voilà alors je vais faire ça avec la calculatrice du coup je dois calculé 1 - 0,97 83 voilà et ça me donne 0,02 117 donc je peux dire que la probabilité d'être à court d'eau c'est zéro virgule qu'est ce que j'ai dit 0,0200 17 00 217 ça on peut l'écrire aussi comme ça c'est 2,17 pour cent voilà on a terminé on a réussi à déterminer la probabilité d'être à court d'eau c'est 2,2 17% et on l'a fait alors je rappelle ans l'a fait en prenant d'abord la distribution d'échantillonnage des moyennes et en considérant que notre échantillon de 50 hommes c'était une valeur de 7 10 13 distribution d'échantillonnage des moyennes et donc on a traduit l'événement être à court d'eau en termes de la moyenne de nos échantillons et on a on sait ramener à une variable centrée réduite pour pouvoir utiliser la table d'une loi normale centrée réduite c'est ce qu'on a fait ici et on en a déduit l'air de cette partie là et ensuite on en a déduit facilement l'air de cette portion que j'ai assuré en rouge et qui donne donc le résultat qu'on cherche la probabilité d'être à court d'eau qui est de 2,17 pour cent voilà on a terminé