If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Théorème central limite

Présentation du théorème central limite et de la distribution d'échantillonnage de la moyenne. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

alors dans cette vidéo va se pencher un peu plus précisément sur calque chose qu'on a déjà vu dans les vidéos précédentes et qui est vraiment quelqu'un théorème très très profond et maître très très utile ans il a dit que en tout cas en statistiques et qui est le terrain de la limite centrer théorème lahlimi la limite centrer alors ce théorème là on a déjà parlé plusieurs fois on l'a déjà même un petit peu utilisé mais là on va vraiment étudier la situation et voir ce que dit précisément ce théorème alors pour ça on va parler d'une voix probabilité n'importe laquelle on va parler d'une variable aléatoire quantitatif bien sûr mais qui pourrait être discret tout continue et surtout qui pourrait elle suivra une loi de probabilités quelconque en importe laquelle donc là par simplicité je vais prendre une loi de probabilité une vague de la torpille qui suit une voie de probabilité alors qu'elle compte discrète alors qu'il fait il a représenté par un histogramme aucune trace ici des taxes voilà arrêtez donc on va dire que notre rêve aléatoire elle peut prendre des valeurs donc ici ça va être les valeurs de la variable pixels et peut prendre les valeurs un peu 5 ou si ce mal et puis là on va mettre leurs probables probabilité de chaque valeur alors là on va d'imaginer une boîte probabilité vraiment boisard 1% et on va la prendre je vais au fait tu en choisir une qui va vraiment pu être très très lointaine du doigt normal parce que c'est là on va voir vraiment la puissance de ceux qui auraient marre groupe a imaginé de scinder le très très bizarre complètement truquée et ici il ya une très forte probabilité d'obtenir points des probabilités mule d'obtenir d'eux c'est une nulle il ya une probabilité toutes tenir trois pieds voilà celle-ci et une probabilité d'obtenir quatre exactement la même on peut dire ça par exemple on va dire aussi que lui une probabilité d'obtenir 5 8 qui est nulle et puis probabilité d'obtenir six pieds équivalente à celle d'obtenir 3 donc ça c'est la loi de probabilités de de demas variable aléatoire qui est le lancer de céder complètement truquée par exemple et donc là j'ai représenté 110 storage pourrait même passer la moyenne un de ces distributions de ce que laly symétrie ce stade c'est moi qui ai choisi comme sa joie je n'ai pas besoin que la distribution de laquelle on part soit symétrique mais ici on voit qu'elle est symétrique est à peu près donc la moyenne ça va être la valeur centrale donc elle va être un peu près ici la moyenne et puis les listes grammes et perpendicular fatale symétrique pardon par rapport à cette droite là qui représente la moyenne la moyenne de l'ue et puis on pourrait aussi qu'il a su faire d'autre marquer d'autres valeurs intéressantes par exemple écart type on pourrait dire que c'est cette terre cette intervalle là cet écart la par rapport à la moyenne en plus ou en moins voilà donc l'assistanat c'est vraiment une loi de probabilité quel con carne que j'ai choisi vraiment comme sade de manière aléatoire avec le seul souci de de ne pas tout prendre une distribution qui est trop proche d'une voie normale mais ça tu vas comprendre pourquoi plus tard donc voilà ça c'est la loi de probabilité demain variable discrète et ce que je vais faire à partir de ça je vais pas simplement de prendre des échantillons je vais en fait prendre à m des échantillons des transferts la moyenne et ensuite en déduire une une distribution des moyennes des échantillons de ces sept un petit peu compliqué mais bon on va le faire et tu vas voir ce qui se passe alors je vais préciser 5 ce que je vais faire ça en fait de gea choisir une taille d'échantillon alors on va commencer par exemple avec des échantillons avec des échantillons de taille de taille n égal on va dire quatre pour l'instant alors ça veut dire quoi ça veut dire que je vais prendre la première échantillon de taille 4 donc le prendre je vais répéter que je vais lancer quatre fois l'idée en fait ici alors je vais le faire la première fois je tiens je lance une fois une fois le béton que ça c'est un échantillon demain variable aléatoire et puis ensuite je me relance encore une fois et je tiens encore un par exemple et puis là je me relance une devine une autre fois encore et je tiens à le croire je lance une quatrième fois et je tiens cette fois-ci 6 alors je peux pas obtenir un deux ou cinq un peu ce que je te rappelle ça c'est la loi de probabilités de la variable donc j'ai aucune chance d'avoir deux géants 5 c'est pas possible cette expérience-là donc je peux pas voir la valeur de leur structure la grl prix quatre échantillons demain variable et ça ça me constituer un échantillon un échantillon de taille 4 c'est celui-là jeunes noté comme ça ben faut faire attention parce qu'effectivement à chaque fois qu'on fait l'expérience on obtient en fête un échantillon des cinq échantillons de taille alors que nous on va prendre des échantillons de taille 4 donc c'est un échantillon de drame donc un échantillon de taille car c'est ça qui est un petit peu perturbant le club au scapulaire c'est en fait un effort de deux à un ensemble de quatre échantillons donc là voilà j'ai mon échantillon de de taille 4 c les voeux la valeur les quatre valeurs que j'ai obtenues en faisant quatre fois avant cette guerre et là je vais calculer la moyenne de cet échantillon du coup malgré la pluie x un bar critique saint-barbe c'est tout simplement un plus un + 3 puis 6 divisé par quatre alors un plus ça ça fait 2 + 3 ça fait 5n plus ici ça fait trop se diviser par quatre à la rose divisé par deux ça c'est le cinquième jeu est plus inquiète divisé par deux sa c'est de dire que le 75 donc voilà mon premier échantillon c'est celui-ci et sa moyenne vos deux obus de 75 emplois c'est la première moyenne d'échantillons que j'ai réussi à faire alors je vais prendre dans le deuxième échantillon alors je fais exactement la même manière sur l'âge la pièce de et je lui donc le blanc sont d une première fois ça me fait un premier échantillon de taille et je tiens à 3 procédure commence j'obtiens 4 par exemple et puis je recommande de pierre encore 3 et puis j'ai commencé je recommence une quatrième fois ajoute-t-il 1 et là j'ai mon échantillon deuxième échantillon de taille 4 je peux en calculer la moyenne comme j'ai fait tout à l'heure il se donne pas eh bien ça fait donc trois +4 ce qui est égal à 7 + 3 17 plus fin 11 onze divisé par quatre ça me fait on a fait tout à l'heure c'est exactement la même chose c'est de l'abus 75 au site alors je vais en prendre encore un an fait il faudrait qu'on en prenne badini aux frappes un très grand nombre là je vais quand même on est explicité un autre pour pour être sûr de dire qu'on voit bien ce qui se passe je fais donc mon troisième échantillons de taille 4 6 donc je lance une première fois à monter je tiens par exemple alain une deuxième fois que je tiens encore un une troisième fois j'obtiens si c'est une quatrième fois je tiens pas encore si cet âge peut-il se terminer j'ai obtenu mon démon troisième échantillon de taille 4 je peux être encore une fois calculer la moyenne la moyenne mix 3 bahreïn et donc ça ça à faire un plus un de plus si subite 8 puis 6 14 quatorze divisé par quatre sa fait alors 14 est visé par deux ça fait 7 donc que cette divisé par deux ça fait 3 25 donc à mon troisième échantillon est roi sa moyenne ces trois femmes puissantes donc là tu vois ce qui se passe à alger prix 3 et sanction de taille 4 à chaque fois j'en ai calculé la moyenne et donc en fait je tiens à une série de moyenne des échantillons alors là je peux déjà commencé par placer scc moyenne sur un an sur un graphique et un an je vais donc je vais je vais le faire c'est là où on va commencer à voir quelque chose qui se dessine qui est intéressant c'est là où les enterrer tout a commencé à se voir je vais déjà commencer à placer ce que cette moyenne la deuxième 75 donc disons que devient que 75 c'est ici donc la première moyenne je l'aï vu faire un entrez ici puisque je vais j'ai déjà un élément ici donc chère un bâton de taille indigent ça c'est pour cette première moyenne et puis maintenant je vais placer la moyenne piste de loudon que la moyenne du deuxième échantillon x de bar un pardon donc ça ces deux élus 75 aussi donc à voir ici rajoute devoir ajouter 1 un bâton taille un montage rabattent qu'on paye deux ans de tous et puis enfin je vais placer celle-ci x3 bahreïn mugabe troisième simple donc là je vais pour moi je pourrais avoir ici la valeur 3 à la haye si la troupe la valeur croît de 8 25 là la valeur 3e 5e donc la valeur 3e puis si ça serait troisième 75 morts c'est pour graduer mon échelle et puis ici je vais donc placé de la moyenne du troisième échantillons ou que ça samedi si une barre de taille voilà alors on fait ça suive juste ce que je ce que le reflet de ce que j'ai fait ici et j'ai fait seulement 3e prix seulement troisième chantier août à 4 mais en fait je vais continuer à faire ça donc je vais prendre le plus possible des gens qui voulaient prendre un très grand nombre d'échantillons je prends par exemple dit donc là je vais répéter mon expérience à chaque fois c'est à dire que je vais retraités des échantillons de taille 4 jusqu'à l'arrivée à l'échantillon sc dix mille dix millième échantillons et donc celui-ci va avoir une moyenne et petite dix mille qui va avoir une certaine valeur alors on va refaire exactement la même chose que tout à l'heure c'est à dire que on va placer nos bons nos valeurs de nos nos moyenne sur 1 max hélas et c'est là où on va vraiment voir le le repérer tout le le caire du terrain de l'ol de la limite sans pré qui va se dégager donc là je vais en fait je vais refaire un dessin parce que la gelée je vais commencer à faire des histogrammes des bons je vais plutôt cognac vraiment très grand nombre de valeurs j'ai pas envie de devoir respecter d'ézéchiel ton cap je vais traces placer des points plus tôt donc je refais mon axe avec pour certaines une certaine échelle de sur un an c'est pas très important oui mais imaginons que l'accès gratuit et que donc je vais pouvoir passer c'est passé lélé les valeurs qui sont là donc je vais je vais déjà placé la russie savait devenu 75 donc là je sais que je vais les deux premiers points il faut commencer à déplacer ms comme ça ça c'est le premier g le deuxième qui correspond à la hâte pour les mx de bar ensuite j'ai au lieu de l'échantillon est roi sa moyenne est elle est là mais bon on est sage je vais le faire avant pour les dhimmis l'échantillon kiss kiss qui sont là donc je vais placés à des points comme ça à chaque fois je place la moyenne et ce qui est intéressant ce qui est vraiment à qui tu pourrais le faire à en faire une simulation avec qui avec celle par exemple et ce qui est vraiment intéressant c'est que on voit on voit se dessiner une courbe en cloche une courbe en cloche comme ça vraiment c'est ça qui est intéressant avec eux c'est ça la finesse c'est le coeur même de de terrain de la limite en prêt c'est que l'on en fait m quand on fait cette expérience-là c'est ce que ce relevé des échantillons dix mille échantillons et ce calcul de leur moyenne et qu'on place la moyenne eh bien on s'approche d'une d'une loi normale d'une courbe en cloche donc ça veut dire que quand on prend des baisers champion de taille 4 et qu'on calcule en moyenne la distribution des moyennes de ses échantillons helvea s'approcher du doigt normal quand on fait un très grand nombre d'échantillons voilà ça c'est vraiment le coeur à du théorème de la limite sans précédent alors ça c'est ce que j'ai ce que j'ai fait ici hein ça concerne le cas où on a pris des échantillons de taille n égale caprins alors je pourrais faire ça avec une autre taille d'échantillon c'est ce qu'on va faire maintenant on pourrait prendre par exemple un échantillon de taille disons 20 rien n'égale 20 à ce moment-là on prendrait un premier échantillon donc qui serait constitué de vingt échantillon de la variable m demain variable aléatoire donc qui suit cette distribution la vente donc ce sera première échantillons qui contiendrait 20 valeurs on prendrait sa moyenne alors je vais en refaire un diagramme en dessous pourrait placer la moyenne de mon premier échantillon sur ce diagramme là or là ce serait par exemple ici et puis je ferai la même chose avec un deuxième échantillon donc de du coup de taille va encore que calculerait la moyenne je placerais c'est cette thèse sa valeur sur le plan graphique et puis je fais ça pour les dix mille échantillons en fait dans ce cas-là ce qu'on aurait je jouerai des points comme ça et ce qui serait à tout ce qui est ce qui est important c'est qu'on va avoir la même moyenne à la même moyenne que tout à l'heure donc de mètres et demi à peu près ici comme ça un peu près comme ça et puis on aurait des valeurs qui serait ochoa plus regroupés autour de la moyenne donc un écart type encore plus resserré et une forme encore plus proche de là le de la loire de l'aln de la forme de la loi normale une forme encore plus ample fin dans ce cas-là on aurait en fait aucune encore meilleure approximation de l'amour c'est pas tout c'est pas très très facile ce que je fais là où je veux je dessine des petits points on essaie on ne forme de forme carrée distribution cloche aussi exactement ce qui se passerait en donc voilà avec yann égale 20 d'ici on aurait une distribution qui serait encore plus ce qu'ils auraient la même moyenne mais qui serait encore plus resserré autour de cette moyenne et surtout qui est qui se ferme une encore meilleure approximation de la loi normale et c'est ça qui est vraiment très intéressant avec ce terrain de la limite sans précèdent que quand on prend une taille d'échantillon confrères quand dira-t-on quand on prend des échantillons je vais écrire ça comme ça quand la taille quand la taille dés de l'échantillon des et des échantillons tend vers l'infini tant vers plus infinie on aurait en fait c'est pas bien pas vraiment besoin d'aller jusqu'à la lie jusqu'à l'infini en fait aux très souvent dans les cas les plus fréquents dix vingt ou trente échantillons ça suffit pas déjà avoir une pensée quelque chose de très très proche de la loi normale c'est ça qui est vraiment étonnant c'est que on parle on peut partir d'une distribution qui est très loufoque comme celle là vraiment une distribution de bizarre l'équipe du tissu aucune loi particulière et puis quand on en fait elle n'en compte en prend un échantillon par exemple ici de taille 4 ou alors encore mieux de taille dissous voir de taille sens quand on prend plusieurs échantillons honte il faut comprendre échantillons d'abord de de taille sandison calcul sa moyenne on remplaça moyenne sur le sur le graphique pour samsung seront refaits sagne deuxième fois une troisième tranche et bien si on fait ça un grand nombre de fois où on va et on va avoir quelque chose de très très proche d'une voie normale et à la limite ainsi on fait ça une infinité de fond on aura quand même quelque chose qui suit parfaitement une loi normale donc ça c'est vraiment là là la chose un peu un peu incroyable de ce théorème alors là on va on a appliqué ce théorème delà de la limite centrer avec des moyens dont on aurait pu le faire avec simplement la somme à la somme de des valeurs de l'échantillon ça serait la même chose en or exactement le même phénomène on vous approcherez de loi normale aussi alors c'est ça qui est vraiment mais fondamentale et est qui et qui fait que ce que ce théorème l'asie est vraiment centrale dans cette étude parce que en fait dd phénomène compliqué où il ya des tas de choses qui entrent en jeu par exemple je vais pas d'aider des interactions entre des molécules ou bien d le rapport entre des êtres humains par exemple mais avec des comportements un peu bizarre % donc ils suivent pas de deux lois particulières eh bien on va pouvoir modéliser sa part une loi normale si justement on applique le terrain de la limite centriste à dire que si on suppose 2 par exemple des rapports entre humains suivent la même voie sansan sans se demander quelle est cette peau à la et bien quand on va faire la somme où la moyenne de tous ces rapports on va à quantifier d'une certaine manière eh bien on va continuellement en hausse approché d'une voie normale voilà est en fait c'est pour ça que la loi normale et et si central en mathématiques statistiques se consacrant leur encontre si souvent dans la dans la vie quotidienne c'est parce qu'elle peut rendre compte de là la somme ou de la moyenne d'âge grand nombre de deux processus soude d'interaction trade le phénomène donc les voilà qui quittent finalement donne 7 heures grâce au théorème de la limite centrer cette forme-là canton quand on les traces quand on trace un histogramme donc ça c'est une loterie distribution distribution normal alors là terminé pour eux et pour eux cette fois-ci ce qu'on va faire à la prochaine vidéo ce que ce qu'on va essayer de de creuser un petit pc en fait on va on va voir on va se rendre compte que canto à l'aune augmente la taille de l'échantillon et quand on répète pour ce calcul de la moyenne sur un peu grand nombre d'échantillons m et bien effectivement on s'approche de plus en plus d'une voie normale