If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Écart-type de la population

Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

dans cette vidéo on va parler de l'écart type d'une population alors pour ça on va prendre un exemple on va supposer que l'on souhaite on a envie de mesurer les dimensions des voitures qui sont dans un parking alors bon pour simplifier on va prendre une population assez de petit effectif assez petit donc on va se dire qu'il ya par exemple cinq voitures et on va mesurer leur longueur alors on par exemple la première lc 4 mètres elle mesure 4 mètres de long la deuxième mesure 4,2 m 2 le de long la troisième par exemple 5 mètres un peu plus longue ensuite et en a une autre qui mesure 4 mètres 30 et puis la dernière c'est la plus longue de tout elle mesure 5 mètres 50 voilà alors bon on va faire un peu de statistiques sur cette population va considérer que ça c'est notre population donc fait une petite population mais on va calculer quelques paramètres sur cette population alors le premier que la première chose qu'on peut essayer de faire c'est de le trouver un indicateur du milieu un petit peu de la valeur une valeur centrale de ces données alors il ya plusieurs façons de le faire la plus classique c'est c'est ce qu'on appelle ce qu'on a vu et qu'on appelle la moyenne arithmétique alors ici comme on parle de la population la moyenne arithmétique de cette population on va là noté par la lettre grecque mu puisque c'est un paramètre sur la population alors comment est ce qu'on fait pour calculer cette moyenne on avait vu qu'il suffisait d'additionner toutes les données de diviser par le nombre de données donc là je vais le faire avec la calculatrice ans a gagné un peu de temps alors j'ouvre la parenthèse il quatre mètres plus 4,2 m + 5 mètres plus 4,3 m plus 5,5 mètres je ferme la parenthèse et le divise par le nombre de données un deux trois quatre cinq ici à 5 donnait donc je divise par 5 voilà alors ça me donne 4,6 donc la moyenne ici c'est 4,6 m bon bien sûr c'est important de ne pas oublier l'unitaire la moyenne c'est une valeur qui est mesuré dans la même unité que les données elles mêmes donc ici ce sont des tout étant m alors ça ça nous donne une idée de la de la valeur centrale un peu des données donc une idée de position des données mais ce qu'on peut avoir envie de faire aussi c'est de comprendre comment les données sont dispersés en particulier comment elles sont dispersées autour de combien elle varie par rapport à cette moyenne alors ben là il ya plusieurs façons de le faire aussi on a une boîte à outils pour faire ça et l'outil principal qu'on a qu'on avait déjà introduit c'est ce qu'on avait appelé la variance la variance de cette population c'est un paramètre aussi puisque là on parle de la population et on la note de cette manière là sigma au carré donc la lettre grecque sigma au carré alors cette variante ce serait un des moyens de mesurer la dispersion des données et de la manière dont on l'avait défini c'était un assez bon moi c'est mon moyen parce qu'en fait c'est l'âme c'est en quelque sorte la moyenne des carrés des distances par rapport à la moyenne de la population donc en fait ce qu'on fait ses calculs et à chaque fois le carré de la distance par rapport à la moyenne de chaque donnée et en calculant c'est ensuite la moyenne de tous et toutes ses distances élevée au carré alors plus précisément ce qu'on fait c'est que on prend chaque donnée on calcule son écart par rapport à la moyenne mue de la population on élève au carré professa pour chaque donnée ensuite on additionne tous ces nombreux là et on divise par le nombre de données alors là je vais le faire pour 7 pour cette distribution pour cette population alors j'ai d'abord je prends la première donnée qui est 4 donc j'ai 4 - la moyenne de notre échec de notre population qui est 4,604 non 4,6 ça c'est l'écart par rapport à la moyenne que j'élève au carré ensuite jadis je fais la même chose avec la deuxième on donnait donc 4,2 - 4/6 que je lève au carré plus alors 5 - 4,6 que j'élève au carré plus pour la 4è donné ses 4,3 moins 4,6 au carré et enfin la dernière donnée 5,5 moins 4,6 élevée au carré et ça je vais le diviser par le nombre de données le nombre de termes qui a dans cette somme c'est 5 on avait vu ça tout à l'heure donc je vais divisé ici par cinq voilà alors ça je vais le calcul avec la calculatrice alors j'ouvre la parenthèse donc j'ai d'abord 4 - 4,6 au carré alors quatre mois 4,6 ça fait moins 0,6 quand j'allais vos carrés ça sera la même chose que 0.6 au carré donc j'ai 0,6 au carré plus ce terme là 4,2 mois 4,6 au car hélas 4,2 - 4,6 ça va faire 0 - 0 point 4 ce qui sera la même chose que 0,4 au carré plus ce terme là maintenant cinq mois 4,6 ça ça fait 0.4 donc je lève au carré donc il faut que j'ajoute 04 au carré encore une fois plus le délai que ce terme si maintenant 4,3 moins 4,6 au carré alors 4 3 - 4 6 a fait moins 0,3 qu'est la même chose que 0,3 au carré alors je vais placer cette ce côté-ci plus j'ajoute maintenant le dernier terme alors 5,5 mois 4,6 au carré 5,5 me 4,6 a fait zéro moins 0,9 donc même quand je lève au carré ça sera la même chose que 0,9 au carré je ferme la parenthèse et je divise par 5 voix là et ça me donne 0,316 0,316 donc la variance sur la population c'est 0,316 0,316 alors il ya quand même une question qu'on peut se poser on a là on avait des mesures en maître on avait dit tout à l'heure que la moyenne c'était aussi un nombre exprimée en mètre et là on peut se demander dans quelle unité et on doit exprimer cette variance alors ici on à ces nombreux l'a4 quatre c4 m 4,6 et 4 mètres aussi donc ce qu'on a ici cette différence c'est en mètres donc quand on l'élève au carré en fait on obtient des mètres carrés ici c'est pareil cd m - des maîtres donc la parenthèse étant m quand on lève au carré on obtient des mètres carrés et c'est pareil pour les trois termes qui restent donc en fait le numérateur ici c'est une somme de mètres carrés en m² + m² + m² plus notre quart est plus mètres carrés donc on va obtenir au numérateur quelque chose qui s'exprime en mètres carrés alors évidemment alors ensuite on divise par 5 mes5 c'est un nombre ici que c'est juste le nombre de données il n'y a pas de scène c'est un nombre qui n'a pas d'unité c'est un nombre sans dimension donc finalement cette variance qu'on obtient elle est exprimée en mètre carré 316 c'est 0 3 116 m² voilà et ça c'est important a remarqué parce que finalement c'est pas c'est pas très approprié ce qu'on veut faire on ad on a ici des dimensions donc deux dimensions qui sont exprimés en maître si on veut mesurer la dispersion des données par rapport à cette moyenne qui est elle aussi exprimée en mètre en fait on veut on voudrait regarder de combien de quelle distance elle s'écarte de cette moyenne là c'est vraiment sympa ce que c'est vraiment une distance qui va s'exprimer en maître et là on a une un paramètre qui va mesurer cette dispersion en mètres carrés donc ce paramètre c'est pas un paramètre qui s'exprime en une unité très pratique pour aller effectivement mesure et de combien ces cartes les données par rapport à cette moyenne alors comment est ce qu'on peut faire pour arranger ça en fait parce qu'on peut faire les notations d'ailleurs l'indiquent parce que ici on a la variance ans l'a exprimé comme sigma élevée au carré donc sigma élevée au carré ça donne des maîtres élevée au carré aussi donc ce qu'on peut faire pour avoir un paramètre qui va s'exprimer en maître c'est prendre tout simplement la racine carrée de la variance alors on va l'écrire comme ça si je si on prend la racine carrée de la variance ça on va noter tout simplement par la lettre sigman ça du coup c'est très cohérent avec les notations et ça ça va nous donner une mesure qui sera exprimée elle non pas en mètres carrés puisqu'on va prendre une racine carrée de cette valeur là ce sera une valeur exprimée en mètre alors du coup cette mesure l'a77 valeur sigma on va pouvoir l'a calculé ça va être tout simplement la racine carrée de la variance donc la racine carrée de 0,316 alors je vais prendre la calculatrice et je vais calculer la racine carrée 2 0 316 donc la racine carrée de notre valeur alors ses racines carrées de 0,316 voilà je ferme la parenthèse et ça me donne ce nombre est impressionnant on va l'arrondir au centième par exemple c'est 0,56 donc je prends une valeur arrondissez 0,56 et ça c'est une valeur qui s'exprime en maître c'est donc une distance qui sert un petit peu mieux notre notre but de mesurer la dispersion des données autour de cette moyenne alors comment est ce qu'on peut appeler c'est un nouveau paramètre un combat ici enfin c'est un nouvel indicateur est comme on l'a ici on s'occupe de la population cet indicateur on va l'appeler un paramètre seul donc c'est un nouveau paramètre et 7 ce nouveau paramètre qui donne vraiment une idée de la dispersion des données autour de la moyenne et bien cet indicateur la ce paramètre puisqu'on parle d'une population ce paramètre-là compte des notes par la lettre sigma on va l'appeler l'écart type c'est comme ça qu'on l'appelle c'est l'écart type de la population sur la population peut dire aussi alors ça c'est une mesure très très classique très utilisé on s'en sert donc vraiment de très nombreux cas c'est un bon paramètres pour indiquer la dispersion des données autour de la moyenne et la raison pour laquelle c'est un bon paramètres c'est que s'expriment dans la même unité que les données voilà alors parce que effectivement la variance on la calcule et de cette manière là mais on aurait pu calculer par exemple au lieu de prendre le car et des écarts par rapport à la moyenne on aurait pu prendre leur valeur absolue ou bien on aurait pu élever à la puissance 4 ça on aurait pu introduire d'autres types de variance mais on va voir que celui ci ait beaucoup d'autres propriétés statistiques qui ceux qui vont être intéressantes et en particulier la en prenant la racine carrée on en obtient un paramètre qui donne une bonne idée de la dispersion des données et qui s'exprime dans la même unité que les données elles mêmes voilà donc ça c'est dans le cas d'une population dans la prochaine vidéo on verra comment est ce qu'on peut parler de l'écart type d'un échantillon