Contenu principal
Heure actuelle :0:00Durée totale :13:20

Transcription de la vidéo

alors maintenant qu'on a une connaissance à fait correcte de la distribution des championnats gt moyenne alors qu'on va explorer un petit peu plus dans cette vidéo c'est la manière dont paris la distribution quand on fait varier la taille de l'échantillon alors on va d'abord commencer par revoir un petit peu ce qu'on avait fait dans l'est dans les vidéos précédentes ce qu'on avait fait ses comptes on était parti d'une distribution absolument quelconque vraiment le de la porte laquelle au fond ça pis on va prendre une distribution discrète 1 avec une variable discrète parce que si l'on peut être un peu plus compliqué à la 19e et là de quoi faire enfler décidée le de l'histogramme d'une distribution absolument qu'elle compte dont par exemple on peut avoir cette valeur laïcité la valeur un pilon on peut avoir une valeur 2 mais avec un petit peu moins de chance c'est quelque chose que vous à voir cette valeur 2 on va dire au contraire que au lieu de probabilité assez élevé d'avoir la valeur 3 à une probabilité nul heureux d'avoir la valeur qu'apporte la safra bâton de taille nulle et puis la valeur fin qu'elle est aussi à l horizon af est probable aussi voilà ça c'est la valeur 5le et puis la valeur qui oui probable aussi mais moins voilà en tout cas je fais vraiment une distribution complètement à la régate en fait ce que je veux c est qu elle ressent pas tellement anormale alors on va dire que et absolument aucune possibilité d'avoir un cette mini habitants donc probabilité nul devant cette toile ou militaires les cures le le neuf par contre aucune valeur qu'on a la cei fréquemment donc ça c'est vraiment une distribution quelle contrainte les phrases comme ça au hasard c'est ce qu'on avait fait dans la vidéo précédente et qu'on avait prélevé loin de l'art des échantillons dans cette distribution et on avait choisi des échantillons de taille 4 donc est-ce que ça veut dire prendre un méchant qui ont pas été un peu dire qu'on va choisir au hasard cas de valeur dans cette distribution donc il y aura beaucoup de chance d'avoir un 9 e beaucoup de chance d'avoir cinq au plan pourra pas avoir de fête du litani de 4 plus qu'une probabilité nulle savoir à 87 wahhabite en fait on prélève aarau hasard 4e4 valeur de dans cette distribution alors je vais le faire là on peut par exemple avoir on peut dire que on a prélevé d'abord un échantillon de près de 4 39 mètres ça c'est la taille de l'échantillon et médias 4 donc on va dire que le couple par exemple première valeur comcom a choisi cet honneur du maurier beaucoup de chance d'avoir un neuf nous profitons d'ailleurs 5 heures près de 25% là aussi beaucoup de chance d'avoir à 5 4 ensuite on a eu 1 900 corps une fois et puis la dernière valeurs ppr particulier pas beaucoup de chance d'avoir un train d'effectuer un possible donc on a fait ce qu'on a vu alors qu'on a fait ensuite à partir de cet échantillon c'est qu'on va calculer sa moyenne or la moyenne on l'appelait clique un peu barak et on l'a calculé tout simplement en faisant la somme des valeurs disant parole le nom de la vertu à dire 4 donc ici saffré neuf plus de 5 14 +9 23 à +1 1 24 donc on a réussi 24 sur 4 ko moyenne jones cap sur kate a fait l'homme qui a divisé par quatre donc la moyenne de cet échantillon est ici de degré 4 pays alors qu'est-ce qu'on va fesser placé à cette moyenne sur 1 sur un graphique donc le show est retracée un acte et je vais tracé de cette moyenne d'abord puis correspond à cet échantillon d'adn donc je vais faire tout simplement un point ici pour la valeur ça c'est la valeur donc je suis un point qui représente la moyenne piste un bar de cette première échantillons alors on peut continuer à faire ça en compte continuer à faire ça et on va avoir d'autres l'échantillon avec d'autres moyens de combat continue a placé la tunisie on peut voir par exemple deuxième échantillon qui a aussi moyenne 6 5 c'est possible on peut avoir aussi un autre échantillon com qui va avoir une moyenne les plastiscines quatre ou cinq tirs et puis rien je peux continuer nous avons encore un autre échantillon de gens de moyenne par exemple cette issue vite ici et donc si je continue à faire ça donc c'est toujours des échantillons prélevés de taille 4 prélevés dans la distribution initiale alors qu'on avait vu dans les vidéos précédentes l'exécution continue à faire ça on allait avoir en fait on comprend qu'on continue à placer sur ce plan graphique et les moyennes eh bien on va avoir quelque chose qui va s'approcher une loi normalien donc ça va être quelque chose qui va avoir une forme en cloche comme ça oui évidemment ça fera pas parfaitement une voix normale parce que déjà une grosse différence c'est que e on peut pas avoir ici des valeurs inférieures à part à la moyenne quand on prélève un échantillon dans cette distribution les valeurs possibles qui entrerait 9 donc une moyenne de buts par exemple pas possible donc ici en arrêt aucune valeur inférieure en fait quand même pas je n'aime pas le verrons bien et aucune valeur supérieure à 9 ans donc effectivement on aurait pas dans le cas d'une loi normale on aurait dit que de distribution qui souhaite qu'il ne s'interdit pas continuer à croître et à gauche ici ce ne sera pas le cas qu'est-ce que ça va s'arrêter enfin on va avoir une valeur maximale une valeur minimale alors effectivement ça fait une grosse différence par rapport à la normale mais quand on regarde toute la partie centrale la partie qui est ici et bien en fait on va s'approcher d'une distribution normale de la forme d'une distribution normale alors que je voudrais approfondir dans cette vidéo toujours quelque chose quand même dont on a déjà parlé avant c'est qu'est-ce qui se passe quand on peut la taille de l'échantillon varient alors qu'ici on a pris un échantillon de taille m il gagne 4 avec ses 4 donc ici on va se demander qu'est-ce qui se passe quand m me qu'est-ce qui se passe quand peines varient alors qu'ici on a pris des échantillons de taille 4 on aurait pu prendre des échantillons de taille distinguer ici on aurait pu prélever 10 valeurs dans cette distribution ça nous aurait donné un échantillon de taille dix ans j'aurais pu calculer sa moyenne et le placer la placer sur le graphique recommencer à rehausser les cloner une dizaine d'années il va leur exactement dans cette distribution en calculer la moyenne et la placer correctement comme on l'a fait ici avec un tel échantillon de 4 voilà on l'a fait dans une précédente vidéo en décidant de simulation qui est fait sur un site internet pour voir où va la reprendre d'ailleurs cette simulation voilà on avait utilisé des taille d'échantillon de sphinx de 25 ans on peut le faire avec 10 enfants voilà alors avant de reprendre la simulation qu'on a vu la dernière fois ouvrez un système qui peut regarder un petit peu ce qui se passe avec des petits des champions donc le cas le plus petit fait quand elle était liée à la fin je vais te montrer un petit peu que ça donc le faire ça on veut prendre une taille des champions nb galles alors qu'est-ce que ça veut dire ça veut dire que on est champion ça très injuste une valeur un peu de de la distribution de lait prélevé une valeur de la distribution je vais calculer la moyenne sa frappe et de valeur elle mène évidemment tu t'es qu'une seule valeur et au fait qu'il avait placé donc du coup cette valeur alors je vais tracfin graphical ones mon bac voilà profite ce que je fais c'est rêver finalement une valeur là-dedans alors quand je prélève une valeur la danger j'ai un certain nombre de chantiers il est possible que j'aie dr roger cher pas mal de chance d'avoir bien quand même donc les paroles du maître ici ça c'est la valeur donc les politiques que j'ai des copains komorowski j -p quelques chances d'avoir des deux mains un petit peu moins donc je peux avoir un certain nombre de deux ici par exemple et puis j'ai beaucoup de chance d'avoir des trois ans je vais avoir un la jeunesse qui est roi on peut avoir beaucoup de 2 3 comme ça c'est que j'en ai vraiment beaucoup alors je sais pas combien d'essais je fais mais je suis un grand nombre d'équipés alors par contre les populations t'avoir à 4 plus que la probabilité savoir qu'après musiciens ont donc joué aucune chance d'avoir un père donc dans ma distribution d'échantillonnage de la moyenne dans ce cas-là pourquoi elle n'égale ailleurs aucune offre aucune valeur 4 1% après je peux avoir beaucoup de 5 à la valeur a atteint qui est très probable donc je peux avoir effectivement beaucoup de femmes qui comme fin je peux avoir du coup le fils que j'ai défini par l'oms or un certain nombre de fils comme ça aussi depuis jeudi aucune chance d'avoir amené à nielle vite par contre je peux avoir beaucoup de neuf ans donc la fed 9 c'est une valeur très probable je veux voir quelque chose qui ressemble fort donc voilà ça c'est une représentation possible de la reine de la pop distribution déchirante d'échantillonnage des moyennes dans le cas où es-tu elle est égale effectivement là on voit bien que fait absolument pas proche d'une voie normale et des valeurs qui sont mais pas à tintin l'éolienne c'est pas du tout symétrique et plusieurs modes enfin on est vraiment très très loin du mois normal ça rejoint ce qu'on avait vu dans les vidéos dans la vidéo précédente et que pour ne pas s'approcher d'une voie normale quand la taille des champions va grandir un peu donc là qu'il faut comprendre c'est que ça dépend pas d'une du nombre des ses confères du nombre d'échantillons comprends ça dépend de la taille de l'échantillon à donc le jeu théorème de la limite entre et ilike quand m s'approche de la fille m s'approchent de leur film et bien la distribution excentive d'échantillonnage des moyennes devient rare trois jeunes s'approchent de plus en plus seul une distribution normal effectivement là quand on voit bien qu'avec elle égale insa marche pas pas suffisant on pourrait voir le 4 ème et galbées aussi wen et gagne 2 verges moi ce que je vais faire moi je sais pas exactement à quoi ça va ressembler mais je peux me faire une idée ça va pas être proche d'une voie normale parce que béjaïa des valeurs qu'on va pas pouvoir avoir par exemple ici la valeur fils et demi on peut pas l'avoir puisque quitter mais il faudrait avoir par exemple 4 et 4 et après neuf ça c'est pas possible ou alors à un autre s'inquiétait de liste on prend peut pas avoir non plus ou alors le fils est fait on peut pas avoir non plus donc la valeur qui fait qu'on peut pas la voir donc lui pour me faire une idée tout avoir je vais faire des points le couple fait au hasard je peux avoir des ravages peut avoir des deux au début de nuit les trois blessés monde croie pas mal de troie les trois et demi l'ex-cadre décès 5 mais ce qui est sûr c'est que les voir un trou ici pour tisser des liens ici la fesci faibli en tout cas cette valeur suis sûr qu'on peut pas la voir et puis ensuite on peut avoir des fêtes des 8 des neuf donc on va voir peut-être quelque chose comme ça ce qui est sûr c'est qu'il aura un trou ici at-il séduit donc être ça sera pas une loi normale donc voilà ici on va voir peut-être une vie une distribution un petit peu propre profil que dans le cas où elles n'étaient gala mais en tout cas ça sera pas du tout normal puisqu'il en a fait le trou en tout cas ce qui séduit donc donc c'est important de comprendre que le théorème de la limite en prêt il dit que le corps elle tend vers plus tôt philippe donc en tant que prend des échantillons de taille très grande eh bien on va avoir à une distribution normale alors qu'il effectue mans dans la pratique et bon elle n'égalera et mégane 2 ça suffit pas mais on n'a pas besoin de prendre des échantillons de taille très très élevé parce que la distribution d si on a des moyens ne converge très rapidement vers une distribution normale on est donc dans la pratique et mégane 10 ou bien inégale 20 16 déjà fessés c'était suffisant pour avoir quelque chose de vraiment très proche d'une distribution normale donc quand on fait tendre la taille des files d'échantillons verbales de l'échantillon vers plus de clients obtiennent distribution normale a enfin fait ça veut dire quoi ça veut dire que quand on va voir une distribution parfaitement normale donc cela dessine ici une distribution parfaitement normal donc une courbe en cloche comme ça ça il faut le voir un peu comme la c'est là la population à la population entière qu'en général on connaît par marque dedans dans le cas d'un programme informatique aucun d'entre eux ne convient de faire on part d'une distribution qu'on connaît et on fait cuire on prélève des échantillons dans cette distribution en général c'est pas ce qui se passe en général on connaît pas la distribution m deux départs donc on connaît pas sa moyenne en particulier mais est-ce que nous assure le théorème de la limite au préfet que prélève des échantillons de taille très élevé eh bien on va avoir une distribution normale et que cette distribution normale vous êtes donc ça s'est fait vraiment une distribution et la distribution d'échantillonnage et moyennes des moyennes bancaire c'est que c'est une vraie distribution qui est qui suit loi parfaitement normal quand même temps la plus réussie et elle a une moyenne cette moyenne brûlé ici par exemple à jouer à noter mu c'est par le repli du bar parce que c'est la moyenne nette de toutes les moyennes de tous les échantillons qu'on a prélevé l'occident moyenne de moyenne alors évidemment si on connaît pas la distribution initiale on pourra pas prélevées dans cette distribution la ldd et champion de taille finir bien sûr que non par contre trophée infections prend des échantillons par exemple de taille eh bien les coureurs au monde prélève après bon nombre de deschamps qui ont de tels fonds va avoir une distribution qui va l'approché de fêtes distribution d'échantillonnage des moyennes qui est une loi normale par cette offre comprendrait un plan vertical pour moi l'art en général c'est ça qu'on fait comparons à une distribution qu'on connaît pas on prélève des échantillons de taille suffisamment élevé et puis enfin plus que la taille de l'échantillon le début de chantier on sera élevé plus on s'approchera de cette distribution d'échantillonnage des moyennes en tout cas à partir de 7 heures mais ces échantillons de ses très nombreux échantillons de grande taille on peut calculer la moyenne du coup ça frappait une estimation assez banal de la moyenne d'âge de la distribution d'échantillonnage des moyennes donc de cette moyenne là les pistards alors une autre chose qui était intéressant qu'on avait déjà relevé dans la hâte dans la halle du bio précédente à partir de simulations si on prend par exemple est négatif et un cap on prend fin mais des échantillons pas et cinq à dix on va voir déjà quelque chose qui va s'approcher d'une dune doit normalement non clip court et peu près comme ça voilà un peu asymétrique bon pas tout à fait normal mais ce qu'on avait vu aussi quelques pions n'augmente la taille de l'échantillon constate que le théorème de la limite s'entraîne bien sûr qu'on va avoir quelque chose une distribution qui va être encore plus proche de la loi normale mais ce qui est intéressant c'est que en fait on va avoir une distribution qui est ce qui va être plus donc plus proche d'une voie normale mais aussi plus resserré autour de la moyenne car on l'avait vu dans la vidéo précédente en cours on notait une distribution qui a la même moyenne la moyenne est ici à peu près intéressés c'est une moyenne très proche qui suit un peu plus une voix normale mais surtout ce qu'on voit c'est que elle est plus resserré autour de la moyenne en fait ça veut dire que elle a un écart type plus petite donc le plus on augmente la taille de l'échantillon plus on s'approche du mans-nord mâle né aussi plus on s'approche d'une loi qui est resserré autour de la moyenne donc avec elle ahmed karti plus faible plus petits et elles vont faire on peut pas rembourser à partir de n'importe quelle distribution d'areva on peut le faire à partir de fête distribution ici qu'on avait choisi au départ un fait ça dépend pas de la distribution initiale voilà tout à fait ça c'est une chose importante en fait plus on augmente la taille de l'échantillon plus on notait une distribution resserrée autour de la moyenne avec effectivement un écart type qui est même plus faibles que celui de la distribution de départ 1 de la distribution initiale on va voir the art of war reprendre la simulation de la dernière fois et on va voir ça avec cette signature ben alors bon on va pas faire de cette distribution la revue avait très bien fait dans les pas du tout normal avec les boules molles aux femmes ont le plus lourd à partir de celle-ci on va en fait comparer alors on va faire déjà fait comparer le cas où on prend des échantillons de paix 2006 m des échantillons prélevés et des échantillons de taillefer donc les moyennes féminine et puis lb et ses standards des déchets de la fiction c'est le coefficient asymétrie et que faisait cette collection d'aplatissement l'a vu dans l'est dérobée dans les dernières vidéos donc je vais commencer je vais prendre un méchant qui ont d'abord de taille de l'île mais la moyenne est maintenant les premiers champions de taille 16 et il va calculer la moyenne qui va placer ici voilà alors groupe a fait une fois maintenant je vais je vais faire dix mille fois voilà et voilà ce qu'on obtient tout de suite ici on voit bien que la distribution dans le cas où on a pris des échantillons de taille devait bien le distributeur l'iman pas normal l a3 pikin mon enquête déjà fait si pour dire qu'elle est pas normal on peut le vérifier ça aussi avec elle les coefficients d'asymétrie et de de turretot zillisheim vous êtes donc d'aplatissement celle qui elle a un coefficient moral et pratiquement symétrique dans ce cas-là le bureau de la ville que sur la symétrie est proche de zéro là elle est pratiquement symétrique avec une légère asymétrie vers la gauche bon et puis le coefficient d'aplatissement la cure politicienne négative donc que dire quand on a un pic un peu plus faible et puis dès que distribution peu plus un peu plus courte luke que dans le cas d'une loi normale alors que maintenant quand on regarde le cas n égale celle de la vraie mandat il me semble tout à fait proche de la loi normale vraiment une forme en cloche on a une moyenne qui est pratiquement la même recette 65 à 7 67 donc assurément les deux mêmes moyenne donc ça c'est intéressant mais surtout ce que je voudrais faire remarquer c'est que l'écart type dans le cas de cette distribution et les deux fils 42 alors que quand on prend des échantillons de boeuf de taille faire du bien écart type est beaucoup beaucoup plus faible et peu près trois fois plus faible donc on a une distribution qui effectivement est beaucoup beaucoup plus resserré autour de la valeur moyenne et elle est même beaucoup plus resserrés autour de cette valeur moyenne que la distribution initiale donc ça c'était ce qu'on avait vu tout à l'heure on vérifie d'haïti par la grâce à cette innovation donc ça fait déjà quelque chose de très intéressant alors maintenant on va pouvoir effacer tout ça et on va comparer détails des chandelles de distribution avec des tailles des champions un peu plus les importantes donc on va attendre par exemple mégane 16 ici et puis si on va prendre elle n'égale 25 points alors que mengele faire une fois en proa on voit ce qui se passe donc là on prélève on est champion de taille 16 ici on a fait ce qu'il fallait maintenant il va calculer la moyenne et la plasticité la ville prend des champions de taille 25 juin et il va calculer la moyenne et la placer dans le graphique donc le dernier graphique voilà exactement donc ça je pourrais le refaire mais je vais le faire directement dix mille fois ça c'est l'intérêt des ordinateurs ces programmes voilà alors on obtient de forme de distribution des championnats des moyennes dans les deux cas les distributions sont très très proche d'une voie normale ici dans le cas où elle n'égale 16 on a un coefficient d'asymétrie qui est pratiquement nul 1-1 0-0 hein un aplatissement qui est très faible si donc on est effectivement là très proche d'une voie normale dans le cas elle égale 25 min la symétrie est pratiquement nul aussi 1 - 09 02 et de l'aplatissement aussi donc là on est dans les deux cas très proche d'une voie normale et m on a une moyenne qui est la même un pratiquement tous obtenu 66 quand on prend également une fin qui est faisable 67 quand on prend un égal 16 heures donc on est dans les deux cas très proche de la moyenne de la population initiale qui était de 16 68 donc ça fait tout à fait ce qu'on a vu dans les annuaires dans les vidéos précédentes est-ce qu'on peut remarquer ici et ça se voit à l'oeil nu évidemment fait que l'arabe dans le cas où m est égal à 25 et bien la distribution d'échantillonnage des moyennes est beaucoup plus resserré autour de la moyenne en fête la cloche est beaucoup plus fine dans le cas où elle m'est égal accès de tous à tester nous le disent les valeurs de l'écart type a initié en mars dans le cas des gaz 7 ans manet karti qui est de 2 à 8 28 eur les 28 28 c'est là alors que dans le cas de l'actuelle mégane 25% des capacités de passage du 82 donc là c'est vraiment très trop flagrant même dans le cas où on a des tailles des échantillons suffisamment élevé pour s'approcher très fortement d'une voie normale la différence c'est que quand on augmente encore le le la taille de l'échantillon diront on se retrouve avec une oeuvre une loi normale beaucoup plus resserrée autour de la moyenne avec un écart type beaucoup plus faible effectivement ça se comprend on a déjà rapidement parler dans les dents les vidéos précédentes en fait on peut voir pour pour se faire une idée fait pas mal de temps de prendre un cas vraiment extrême par exemple si on prend des échantillons de taille un million bien donc ça veut dire qu'on va prélever pour cent millions de données dans cette distribution a effectivement il est très très peu de probabilité que l'on prenne un million de données dans cette partie n'a par exemple pas encore faite quand on prend un échantillon de le million de données dans cette distribution et qu'ensuite on en fait la moyenne des renvois avoir une moyenne qui va s'approcher mqf écarté très peu de la moyenne initiale ça paraît tout à fait logique puisque il est très peu de chances d'avoir pris plus d'un million de valeurs très loin de là haut de la moyenne donc en fait on a beaucoup de chance d'avoir pris comme millions de valeur disséminés autour de la moyenne des cantons va prendre la roue à la moyenne de 5 1 millions de valeur on va effectivement ça peut être très proche de la moyenne réelle de là de la distribution donc c'est ça qui fait que quand on te documentes la taille de l'échantillon on va finalement le diminuer les risques de ces quartiers de la moyenne de la population initiale donc on va voir diminuer l'écart type effectivement on va voir dans le tapis uche s'engagea alors réfléchir là-dessus si c'est pas très claires et aider de même à manipuler cette utilisation parce que faire se peut que je joue vraiment t'aider à comprendre mais en tout cas ce qui est important c'est qu'en fait il existe une formule très nette très clair entre le nul à l'écart type de la distribution d'origine et l'écart type de la distribution d'échantillonnage des moyennes et et puis évidemment cette formule va faire intervenir le nombre d'échantillons et la taille des échantillons comprend donc la tête qu'on va faire à la prochaine vidéo la tendance dans le champ des rares réfléchir avant calmement là-dessus et à t'entraîner aires il a manipulé cette simulation