Contenu principal
5e et 6e année secondaires - PES
Cours : 5e et 6e année secondaires - PES > Chapitre 3
Leçon 2: Distribution d'échantillonnage de la moyenne de l'échantillon et théorème central limiteThéorème central limite
Présentation du théorème central limite et de la distribution d'échantillonnage de la moyenne. Créé par Sal Khan.
Vous souhaitez rejoindre la discussion ?
Pas encore de posts.
Transcription de la vidéo
alors dans cette vidéo va se pencher un
peu plus précisément sur calque chose qu'on a déjà vu dans les vidéos
précédentes et qui est vraiment quelqu'un théorème
très très profond et maître très très utile ans il a dit que en tout cas
en statistiques et qui est le terrain de la limite
centrer théorème lahlimi la limite centrer alors ce théorème là on a déjà
parlé plusieurs fois on l'a déjà même un petit peu utilisé mais là on
va vraiment étudier la situation et voir ce que dit précisément ce
théorème alors pour ça on va parler d'une voix
probabilité n'importe laquelle on va parler d'une variable aléatoire
quantitatif bien sûr mais qui pourrait être discret tout continue et surtout qui pourrait elle suivra une
loi de probabilités quelconque en importe laquelle donc là par simplicité je vais prendre
une loi de probabilité une vague de la torpille qui suit une voie de
probabilité alors qu'elle compte discrète alors qu'il fait il a représenté par un histogramme
aucune trace ici des taxes voilà arrêtez donc on va dire que notre rêve
aléatoire elle peut prendre des valeurs donc ici ça va être les valeurs de la
variable pixels et peut prendre les valeurs un peu 5 ou si ce mal et puis là on va mettre
leurs probables probabilité de chaque valeur alors là on va d'imaginer une boîte
probabilité vraiment boisard 1% et on va la prendre je vais au fait tu en choisir une qui va
vraiment pu être très très lointaine du doigt normal parce que c'est là on va voir vraiment la
puissance de ceux qui auraient marre groupe a imaginé de scinder le très
très bizarre complètement truquée et ici il ya une très forte
probabilité d'obtenir points des probabilités mule d'obtenir d'eux c'est une nulle il ya une probabilité toutes tenir trois pieds voilà celle-ci et une probabilité d'obtenir quatre
exactement la même on peut dire ça par exemple on va dire aussi que lui une
probabilité d'obtenir 5 8 qui est nulle et puis probabilité d'obtenir six pieds équivalente à celle d'obtenir 3 donc ça c'est la loi de probabilités
de de demas variable aléatoire qui est le lancer de céder complètement truquée par exemple et donc là j'ai représenté 110
storage pourrait même passer la moyenne un de ces distributions de ce que laly
symétrie ce stade c'est moi qui ai choisi comme sa joie je n'ai pas besoin que la distribution
de laquelle on part soit symétrique mais ici on voit qu'elle est symétrique
est à peu près donc la moyenne ça va être la valeur
centrale donc elle va être un peu près ici la
moyenne et puis les listes grammes et perpendicular fatale symétrique pardon
par rapport à cette droite là qui représente la moyenne la moyenne de
l'ue et puis on pourrait aussi qu'il a su
faire d'autre marquer d'autres valeurs intéressantes par exemple écart type
on pourrait dire que c'est cette terre cette intervalle là cet écart la par rapport à la moyenne
en plus ou en moins voilà donc l'assistanat c'est vraiment une loi de
probabilité quel con carne que j'ai choisi vraiment
comme sade de manière aléatoire avec le seul souci de de ne pas tout prendre une
distribution qui est trop proche d'une voie normale mais ça tu vas comprendre pourquoi plus
tard donc voilà ça c'est la loi de
probabilité demain variable discrète et ce que je vais faire à partir de ça
je vais pas simplement de prendre des échantillons je vais en fait prendre à m des
échantillons des transferts la moyenne et ensuite en déduire une une distribution des moyennes des
échantillons de ces sept un petit peu compliqué mais bon on va le faire et tu
vas voir ce qui se passe alors je vais préciser 5 ce que je vais faire ça en fait de gea
choisir une taille d'échantillon alors on va commencer par exemple avec des
échantillons avec des échantillons de taille de taille n égal on va dire quatre pour l'instant alors ça veut dire quoi ça veut dire
que je vais prendre la première échantillon de taille 4 donc le prendre je vais répéter que je vais lancer
quatre fois l'idée en fait ici alors je vais le faire la première fois je tiens je lance une fois une fois le béton que
ça c'est un échantillon demain variable aléatoire et puis ensuite je me relance encore une
fois et je tiens encore un par exemple et puis là je me relance une devine une
autre fois encore et je tiens à le croire je lance une quatrième fois et je tiens cette
fois-ci 6 alors je peux pas obtenir un deux ou
cinq un peu ce que je te rappelle ça c'est la loi de probabilités de la
variable donc j'ai aucune chance d'avoir deux géants 5 c'est pas possible cette
expérience-là donc je peux pas voir la valeur de leur
structure la grl prix quatre échantillons demain variable et ça ça me constituer
un échantillon un échantillon de taille 4 c'est
celui-là jeunes noté comme ça ben faut faire attention parce
qu'effectivement à chaque fois qu'on fait l'expérience
on obtient en fête un échantillon des cinq échantillons de taille alors que nous on va prendre des
échantillons de taille 4 donc c'est un échantillon de drame donc un
échantillon de taille car c'est ça qui est un petit peu perturbant le club au
scapulaire c'est en fait un effort de deux à un
ensemble de quatre échantillons donc là voilà j'ai mon échantillon de de
taille 4 c les voeux la valeur les quatre valeurs
que j'ai obtenues en faisant quatre fois avant cette guerre et là je vais calculer la moyenne de
cet échantillon du coup malgré la pluie x un bar critique saint-barbe c'est tout
simplement un plus un + 3 puis 6 divisé par quatre alors un plus ça ça fait 2 + 3 ça
fait 5n plus ici ça fait trop se diviser par
quatre à la rose divisé par deux ça c'est le cinquième jeu est plus
inquiète divisé par deux sa c'est de dire que le 75 donc voilà mon premier
échantillon c'est celui-ci et sa moyenne vos deux
obus de 75 emplois c'est la première moyenne d'échantillons que j'ai réussi
à faire alors je vais prendre dans le deuxième
échantillon alors je fais exactement la même
manière sur l'âge la pièce de et je lui donc le blanc sont d une
première fois ça me fait un premier échantillon de taille et je tiens à 3 procédure commence j'obtiens 4 par
exemple et puis je recommande de pierre encore 3 et puis j'ai commencé je recommence une
quatrième fois ajoute-t-il 1 et là j'ai mon échantillon deuxième
échantillon de taille 4 je peux en calculer la moyenne comme
j'ai fait tout à l'heure il se donne pas eh bien ça fait donc trois +4 ce qui
est égal à 7 + 3 17 plus fin 11 onze divisé par quatre ça me fait on a fait tout à l'heure
c'est exactement la même chose c'est de l'abus 75 au site alors je vais en prendre encore un an
fait il faudrait qu'on en prenne badini aux frappes un très grand nombre là je vais quand même on est
explicité un autre pour pour être sûr de dire qu'on voit bien ce qui se passe je fais donc mon troisième
échantillons de taille 4 6 donc je lance une première fois à
monter je tiens par exemple alain une deuxième fois que je tiens encore
un une troisième fois j'obtiens si c'est
une quatrième fois je tiens pas encore si cet âge peut-il se terminer j'ai obtenu mon démon troisième
échantillon de taille 4 je peux être encore une fois calculer
la moyenne la moyenne mix 3 bahreïn et donc ça ça à faire un plus un de
plus si subite 8 puis 6 14 quatorze divisé par quatre
sa fait alors 14 est visé par deux ça fait 7 donc que cette divisé par
deux ça fait 3 25 donc à mon troisième échantillon est
roi sa moyenne ces trois femmes puissantes
donc là tu vois ce qui se passe à alger prix 3 et sanction de taille 4 à chaque
fois j'en ai calculé la moyenne et donc en fait je tiens à une série de
moyenne des échantillons alors là je peux déjà commencé par
placer scc moyenne sur un an sur un graphique et un an je vais donc je vais
je vais le faire c'est là où on va commencer à voir
quelque chose qui se dessine qui est intéressant c'est là où les enterrer tout a commencé à se voir je vais déjà commencer à placer ce
que cette moyenne la deuxième 75 donc disons que devient que 75 c'est ici donc la première moyenne je l'aï vu faire un entrez ici puisque
je vais j'ai déjà un élément ici donc chère un bâton
de taille indigent ça c'est pour cette première moyenne et puis maintenant je vais placer la
moyenne piste de loudon que la moyenne du deuxième échantillon x de bar un
pardon donc ça ces deux élus 75 aussi donc à voir ici rajoute devoir ajouter 1 un bâton taille un montage rabattent
qu'on paye deux ans de tous et puis enfin je vais placer celle-ci x3 bahreïn mugabe troisième simple donc
là je vais pour moi je pourrais avoir ici la valeur
3 à la haye si la troupe la valeur croît de 8 25 là la valeur 3e 5e donc la valeur 3e puis si ça serait
troisième 75 morts c'est pour graduer mon échelle et puis ici je vais donc placé de la moyenne du troisième
échantillons ou que ça samedi si une barre de taille
voilà alors on fait ça suive juste ce que je ce que le reflet de ce que j'ai fait ici
et j'ai fait seulement 3e prix seulement troisième chantier août à 4 mais en fait je vais continuer à faire
ça donc je vais prendre le plus possible des gens qui voulaient
prendre un très grand nombre d'échantillons je prends par exemple dit donc là je vais répéter mon
expérience à chaque fois c'est à dire que je vais retraités des échantillons de taille 4 jusqu'à
l'arrivée à l'échantillon sc dix mille dix
millième échantillons et donc celui-ci va avoir une moyenne et
petite dix mille qui va avoir une certaine valeur alors on va refaire exactement la même
chose que tout à l'heure c'est à dire que on va placer nos bons nos valeurs de nos nos moyenne sur 1 max hélas et c'est là où on va vraiment
voir le le repérer tout le le caire du terrain de l'ol de
la limite sans pré qui va se dégager donc là je vais en fait je vais refaire
un dessin parce que la gelée je vais commencer à faire des
histogrammes des bons je vais plutôt cognac vraiment très
grand nombre de valeurs j'ai pas envie de devoir respecter d'ézéchiel ton cap je vais traces placer des points plus tôt donc
je refais mon axe avec pour certaines une certaine
échelle de sur un an c'est pas très important oui mais imaginons que l'accès gratuit et que donc je vais pouvoir passer c'est
passé lélé les valeurs qui sont là donc je vais je vais déjà placé la
russie savait devenu 75 donc là je sais que je vais les deux premiers points il faut commencer à déplacer ms comme ça ça c'est le premier g le deuxième qui correspond à la
hâte pour les mx de bar ensuite j'ai au lieu de l'échantillon est roi sa moyenne est elle est là mais bon on est sage je vais le faire
avant pour les dhimmis l'échantillon kiss kiss qui sont là donc je vais placés à des points comme
ça à chaque fois je place la moyenne et ce qui est intéressant ce qui est
vraiment à qui tu pourrais le faire à en faire une simulation avec qui avec
celle par exemple et ce qui est vraiment intéressant
c'est que on voit on voit se dessiner une courbe en cloche une courbe en cloche comme ça vraiment c'est ça qui est intéressant avec eux
c'est ça la finesse c'est le coeur même de de terrain de la limite en
prêt c'est que l'on en fait m quand on fait cette expérience-là c'est ce que ce
relevé des échantillons dix mille échantillons et ce calcul de
leur moyenne et qu'on place la moyenne eh bien on s'approche d'une d'une loi
normale d'une courbe en cloche donc ça veut dire que quand on prend des baisers
champion de taille 4 et qu'on calcule en moyenne la
distribution des moyennes de ses échantillons helvea s'approcher du doigt normal quand on
fait un très grand nombre d'échantillons voilà ça c'est vraiment le coeur à du
théorème de la limite sans précédent alors ça c'est ce que j'ai ce que j'ai
fait ici hein ça concerne le cas où on a pris des échantillons de taille n égale caprins alors je pourrais faire ça avec une
autre taille d'échantillon c'est ce qu'on va faire maintenant on pourrait prendre par exemple un
échantillon de taille disons 20 rien n'égale 20 à ce moment-là on
prendrait un premier échantillon donc qui serait constitué de vingt échantillon de la variable m demain
variable aléatoire donc qui suit cette distribution la vente donc ce sera première échantillons qui
contiendrait 20 valeurs on prendrait sa moyenne alors je vais en refaire un diagramme en
dessous pourrait placer la moyenne de mon
premier échantillon sur ce diagramme là or là ce serait par exemple ici et puis je ferai la même chose avec un
deuxième échantillon donc de du coup de taille va encore que calculerait la
moyenne je placerais c'est cette thèse sa
valeur sur le plan graphique et puis je fais ça pour les dix mille
échantillons en fait dans ce cas-là ce qu'on aurait je jouerai des points comme ça et ce qui serait à tout ce qui est ce qui
est important c'est qu'on va avoir la même moyenne à la même moyenne que
tout à l'heure donc de mètres et demi à peu près ici comme ça un peu près comme ça et puis on aurait des valeurs qui serait ochoa plus
regroupés autour de la moyenne donc un écart type encore plus resserré et une forme encore plus proche de là
le de la loire de l'aln de la forme de la loi normale une forme encore plus ample fin dans ce cas-là on aurait en fait aucune
encore meilleure approximation de l'amour c'est pas tout c'est pas très très facile ce que je
fais là où je veux je dessine des petits points on essaie
on ne forme de forme carrée distribution cloche aussi exactement ce qui se passerait en
donc voilà avec yann égale 20 d'ici on aurait une distribution qui serait encore plus ce qu'ils auraient la même
moyenne mais qui serait encore plus resserré autour de cette
moyenne et surtout qui est qui se ferme une encore meilleure approximation de la loi normale et c'est ça qui est vraiment très intéressant avec ce terrain de la
limite sans précèdent que quand on prend une taille d'échantillon
confrères quand dira-t-on quand on prend des échantillons je vais écrire ça comme ça quand la taille quand la taille dés de l'échantillon des et des
échantillons tend vers l'infini tant vers plus infinie on aurait en fait c'est pas bien pas
vraiment besoin d'aller jusqu'à la lie jusqu'à l'infini en fait aux très souvent dans les cas les plus
fréquents dix vingt ou trente échantillons ça suffit pas déjà avoir une pensée quelque chose
de très très proche de la loi normale c'est ça qui est vraiment étonnant
c'est que on parle on peut partir d'une
distribution qui est très loufoque comme celle là vraiment une
distribution de bizarre l'équipe du tissu aucune loi
particulière et puis quand on en fait elle n'en compte en prend un
échantillon par exemple ici de taille 4 ou alors encore mieux de taille dissous voir de
taille sens quand on prend plusieurs échantillons
honte il faut comprendre échantillons d'abord
de de taille sandison calcul sa moyenne on remplaça moyenne sur le sur le
graphique pour samsung seront refaits sagne
deuxième fois une troisième tranche et bien si on fait ça un grand nombre de
fois où on va et on va avoir quelque chose de très très proche d'une voie
normale et à la limite ainsi on fait ça une
infinité de fond on aura quand même quelque chose qui suit parfaitement une
loi normale donc ça c'est vraiment là là la chose
un peu un peu incroyable de ce théorème alors là on va on a appliqué ce
théorème delà de la limite centrer avec des moyens dont on aurait pu le
faire avec simplement la somme à la somme de des valeurs de l'échantillon ça serait la même chose en or
exactement le même phénomène on vous approcherez de loi normale aussi alors c'est ça qui est vraiment mais
fondamentale et est qui et qui fait que ce que ce théorème l'asie est vraiment
centrale dans cette étude parce que en fait dd
phénomène compliqué où il ya des tas de choses qui entrent en jeu par exemple je vais pas d'aider des
interactions entre des molécules ou bien d le rapport entre des êtres
humains par exemple mais avec des comportements un peu
bizarre % donc ils suivent pas de deux lois particulières eh bien on va
pouvoir modéliser sa part une loi normale si justement on applique le terrain de la limite centriste à
dire que si on suppose 2 par exemple des rapports entre humains
suivent la même voie sansan sans se demander quelle est cette peau à la et bien quand on va faire la somme où
la moyenne de tous ces rapports on va à quantifier d'une certaine
manière eh bien on va continuellement en hausse
approché d'une voie normale voilà est en fait c'est pour ça que la
loi normale et et si central en mathématiques statistiques se
consacrant leur encontre si souvent dans la dans la vie quotidienne c'est parce qu'elle peut rendre compte
de là la somme ou de la moyenne d'âge grand nombre de deux processus soude
d'interaction trade le phénomène donc les voilà qui quittent finalement donne 7 heures grâce au théorème de
la limite centrer cette forme-là canton quand on les traces quand on trace un
histogramme donc ça c'est une loterie distribution distribution normal alors là terminé pour eux et pour eux
cette fois-ci ce qu'on va faire à la prochaine vidéo ce que ce qu'on va
essayer de de creuser un petit pc en fait on va on va voir on va se rendre
compte que canto à l'aune augmente la taille de l'échantillon et quand on
répète pour ce calcul de la moyenne sur un peu grand nombre d'échantillons
m et bien effectivement on s'approche de plus en plus d'une voie normale