If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Moyenne d'une population et moyenne d'un échantillon

En statistiques, on utilise le plus souvent un échantillon représentatif de la population étudiée. On peut déduire de la moyenne de cet échantillon, des informations sur la moyenne de la population. Créé par Sal Khan.

Transcription de la vidéo

alors imaginons qu'on soit en train de créer un produit destiné à des hommes et qui est un produit à peu basé essentiellement sur la taille donc par exemple c'est à mme habib et on va essayer de vendre cet habit à la des hommes du continent africain donc la population des clients ce sont les hommes d'afrique du continent africain alors bon ce qu'on a envie de savoir du coup avant de commercialiser ce produit avant de le fabriquer on a envie de savoir quelle est la population qu'elle est là la taille moyenne des africains donc je vais l'écrire ce qu'on cherche à faire du coup c'est à déterminer la taille moyenne la taille moyenne d'un africain d'un africain voilà alors quand on veut essayer de faire sable la façon de faire la plus précise qu'on aurait ça serait d'aller interroger tous les africains et de leur demander à chaque fois leur taille donc on pourrait imaginer de faire ça le problème c'est que ça prendrait vrai évidemment énormément de temps un en afrique ah bon je vais dessiner je dessine et voilà ça ça va représenter la population africaine donc en afrique à plus d'un milliard d'habitants donc on va dire que environ la moitié sont des hommes donc il y aurait à peu près enfin plus de 500 millions de personnes a interrogé 500 millions d'africains sommes donc évidemment ça serait très longue même si on imaginait pouvoir le faire effectivement ça prendrait tellement de temps que entre le moment où alors on aurait commencé l'enquêté moment où il aurait fini il y aurait des hommes qui seraient mais d'autres qui serait mort enfin bon la population aurait du coup changé et la moyenne qu'on aurait pu calculer de cette manière là on a non directement interroger tous les africains seraient peut-être plus la bonne voie là et puis bon de toute façon c'est quand même assez inimaginable de pouvoir faire ça donc évidemment il faut qu'on essaie de trouver une autre solution alors la solution on a déjà parlé dans d'autres vidéos ça serait d'aller n'ont pas interrogé toute la population des africains mais simplement de prélever un échantillon dans cette population donc d'aller interroger un échantillon de d'africains alors évidemment bon je vais représenter comme ça ça c'est un échantillon voilà et puis là ce que j'ai dessiné avant bon ça c'est la population la population qui nous intéresse donc c'est la population c'est l'ensemble de tous les africains aux mains alors évidemment l'échantillon qu'on va prélever on va il faut qu'on a déjà vu qu'il fallait le prélever de manière aléatoire c'est à dire que je vais pas interrogé par exemple tous les hommes qui sont inscrits dans un club de basket ou de volley où on aura probablement des gens qui sont de taille plus élevé donc voilà il fait important d'aller prélever des gens qui sont qui sont a priori de taille aléatoires donc par exemple on peut se mettre à la sortie d'un d'un grand magasin et puis interrogé la première personne qui sort refaire ça dans d'autres grands magasins dans d'autres villes d'afrique et dans d'autres pays d'afrique voilà pour avoir un échantillon de la population mâle africaine qui est aléatoire donc dans lequel on n'aura pas introduit un biais en fait qui va influencer la taille des personnes qui sont dans qui vont constituer cet échantillon voilà alors bon évidemment cet échantillon d'habitude ce qui est important c'est qu'il soit assez élevée quand même d'une taille assez élevé donc il faut interroger quand même un certain nombre de personnes au moins mille enfin dix mille le plus grand et l'échantillon le mieux ce sera bon là pour notre exemple c'est pas trés c'est vraiment pour faire un exemple on va prendre un échantillon d'une taille petite ou pour pouvoir faire nos calculs assez facilement donc on va supposer ici qu'on a interrogé cinq personnes alors on va noter les détails qui sont donnés ici donc on a une personne qui veut mesure 1 m 75 la deuxième personne lui disons qu elle mesure 1 mètre 80 de la troisième elle mesure 1 m 67 la quatrième mesure disons 1 m 72 l'acte est la cinquième mesure 1 m 89 voilà donc ça ce sont les mesures directement notre échantillon et là effectivement on peut beaucoup plus facilement calculer la moyenne alors quand je parle de moyenne ça j'ai pas préciser tout à l'heure ici quand on dit simplement moyenne en général c'est la moyenne arithmétique 1 il ya d'autres types de moyenne mais dans ce cas là le plus souvent on précise que c'est pas la moyenne arithmétique en me disant par exemple moyenne géométrique ou bien autre type de moyenne et quand on parle simplement de moyenne c'est en général la moyenne arithmétique donc là je vais pouvoir l'a calculé cette moyenne arithmétique alors je vais le faire la calculatrice c'est pas la peine de perdre du temps à faire la main alors bon j'ouvre la parenthèse qu'il faut que je fasse c'est la somme de ces cinq l'ombre et qu'ensuite je divise par le nombre de valeurs donc j'ouvre la parenthèse et j'ai 1,75 c'est la première valeur plus 1,82 plus 1,67 plus 1,72 plus 1,89 voilà je ferme la parenthèse et je vais divisé ça maintenant par le nombre de valeurs alors ici g5 valeur de 3 4 5 voilà et ça me donne cette taille-là 1,77 m donc la moyenne de mon échantillon ici je vais la notte x bar x barre en général c'est comme ça qu'on la note c'est 1,77 parce que c'est bien ça oui c'est ça 1 1 m 77 donc ça c'est la moyenne de mon échantillon voilà et cette moyenne j'ai pu la calcul assez facilement donc même si mon échantillon était de taille beaucoup plus important que je pourrai calculer quand même cette moyenne là alors maintenant ce que j'espère c'est que la moyenne de cet échantillon va être va être représentative va pouvoir me servir comme estimateur de la moyenne de la population et ça ça va être un des plus un des problèmes les plus fréquents statistiques c'est comment est-ce qu'on peut à partir d'un échantillon estimé un paramètre dans la population alors je vais fixer quelques mots ici donc cette moyenne de l'échantillon c'est ce qu'on appelle une statistique une statistique c'est un paramètre observée dans un échantillon qu'on appelle une statistique alors que la moyenne de la population l on appelle ça en général un paramètre voilà c'est pour fixer quelques mots un paramètre la différence c'est que le paramètre c'est le sait ce qu'on cherche en général estimé et la statistique c'est ce qu'on peut calculer directement puisque c'est ça c'est rapporté un échantillon alors ce que je disais tout à l'heure c'est que le problème principal en statistiques c'est de calculer une statistique donc sur un échantillon est de pouvoir en déduire des estimations du paramètre sur une population plus large dont on peut pas calculer effectivement le paramètre voilà donc on verra plus tard qu'il ya des méthodes pour essayer d'évaluer la qualité de cette estimation de canton fait cette statistique voilà alors cette notation la x bars c'est en général c'est la notation qu'on emploie pour la moyenne de l'échantillon donc c'est une statistique est en général le le paramètre donc la moyenne sur la population la moyenne de la population là des notes par la lettre grecque mue donc ça c'est la moyenne de la population donc c'est en général le paramètre qu'on cherche a estimé à partir de cette statistique voilà alors maintenant ce que je vais faire cet familiariser avec avec des notations qui ont l'air très mathématique très compliqué puis en fait tu vas te rends tu compte j'espère après après cette vidéo que c'est vraiment des notations qui représente exactement ce qu'on va faire effectivement quand on calcule la moyenne là on a fait une somme de 5 thèmes on a divisé par cinq donc par le nombre de termes et si on devait calculer la moyenne de la population ben on ferait exactement la même chose on ferait une addition de 500 millions de terres mais on dit viseraient le résultat par 500 millions c'est exactement ce qu'on fait quand on fait une moins quand on calcule une moyenne alors pour ça les mathématiciens il utilise des notations particulière alors en général quand on a une série de données en mathématiques on note on donne des noms à chaque donnait alors par exemple la première donnée très souvent on la note x trains icx un 10-1 c'est un petit 1 qui est un peu plus petit que le x1 peu plus bas aussi ensuite on a x 2 x 1 10 2 plus tôt je devrais dire x1 10,2 à chaque fois mais bon on a l'habitude c'est plus rapide de dire x1 x3 et x2 x3 ça c'est x 3 x 1 10 3 toujours x4 et puis le dernier ici qu'est x5 donc on a nos cinq donné et ça c'est le nom qu'on leur donne alors ensuite pour calculer la moyenne de ces 5 valeurs de cette série là ce que je fais c'est d'abord calculer la somme et ça on a une notation aussi pour noter sa la somme de ces cinq nombre on le note comme ça hein en général quand on note cette lettre grecque sigma ça va représenter une somme de certains termes et ici on va noter ça comme ça la somme qui va de i égal à 1 jusqu'à n ça va être la somme des termes x y alors ici il faut voir le la lettre i comme quelque chose qui va bouger la lettre grecque comme une somme donc en fait ça ça veut dire qu'on va faire la somme des termes x y et le premier cx1 et le dernier cx n alors ici notre petit est ni si ces cinq puisqu'on à 5,5 terme donc ça en fait ça veut dire je fais x1 plus ensuite x2 puisque y devient égal à 2 +63 plus plus plus jusqu'à x n voilà donc dans notre cas ici la somme ça serait x1 +62 +63 +64 + 6 x 5 par dante puisque notre petit entre 5 voilà alors ont ensuite on peut servir de cette notation pour donner une formule qui va donner la moyenne d'un échantillon alors je vais l'écrire comme saïx barre donc ça va être alors c'est la somme des données donc ça je peux l'écrire comme somme de i égal 1 jusqu'à ndx il y donc ça c'est vraiment la somme x11 +62 +63 jusqu'à xn ce que j'ai écris ici et je doit diviser le tout par le nombre de valeurs et le nombre de valeurs c'est petit n donc ça ça me donne la moyenne de l'échantillon la somme des xlii pourri qui va de 1 jusqu'à n le tout divisé par n alors je pourrais faire exactement la même chose en supposant que ce soit faisable avec la moyenne sur la population totale donc ça je peux l'écrire c'est ce mu 1 l'udc est là donc je pourrais écrire que mu eh bien c'est la somme de toutes les deux toutes les données collectées sur toute la population africaine donc là il y aurait 500 millions de données 1 donc je vais l'écrire comme ça c'est la somme pourri qui va de 1 jusqu'à alors en général bon ici pour notre cas ça serait elle environ 500 millions mais en général quand on parle d'une population comme le la taille est beaucoup plus grande que la taille de l'échantillon qui si petit n en a l'habitude de noter avec un grand n en lettres majuscules donc ça serait la somme pourri qui va de 1 jusqu'à grant ndx y le tout divisé par le nombre de valeurs et le nombre de valeurs basses et le second thème là hein donc ça serait sommes pourris qui va de 1 jusqu'à grands thèmes des xxi le tout divisé par grands thèmes ça c'est une formule qui donne la moyenne de la série sur la population alors ces textes est cette formule là elle est basée exactement comme l'eau sur cette notation ici un si j'écris ça comme ça je peux être que ce sera plus clair si je l'écris la somme qui va de pourris qui va de 1 à grand-peine des x y et bien cx1 plus x 2 plus 6 3 et ainsi de suite jusqu'à au dernier qui va être x grands thèmes voilà bon alors ça c'est nos deux formules celle-ci celle-ci la deux qui donnent la moyenne de l'échantillon c'est une formule qu'on peut juger pratique parce qu'effectivement on peut l'appliquer celle qui est là elle est effectivement on pas très pratique puisque en général on peut pas la calculer tel quel donc je répète ce que je disais tout à l'heure l'idée c'est d'arriver à estimer cette valeur là à partir de celle-ci alors le débat ça va être surtout de pouls de savoir quand est-ce que cette valeur ci est vraiment une bonne estimation de 7 de celle ci