If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Marge d'erreur 2

Trouver l'intervalle de confiance à 95 % du pourcentage d'une population votant pour un candidat. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

alors on avait terminé la dernière vidéo sur une sorte de questions trouver un intervalle autour de 0.43 ça c'était la moyenne de l'échantillon qu'on avait prélevé telle que l'on peut raisonnablement penser on avait on va revenir là dessus sur le pourquoi pourquoi est-ce qu'on est obligé d'être aussi vague certaine manière donc telle qu'on peut raisonnablement penser qu'il y à 80 195 chance sur 100 que mu la moyenne réelle sur la population donc c'est la proportion réelle de des électeurs qui vont voter pour le candidat b soit contenue dans cet intervalle alors ici on avait parlé de la proportion réelle un proportion réelle sur toute la population en fait on sait que cette proportion réelle bien c'est la même chose que la moyenne de la distribution d'échantillonnage qu'on a noté ici mu 2 x barre donc ça je vais je vais l'écrire ça c'est aussi mu 2 x barre voilà alors on va essayer de répondre à cette question on va je vais d'abord commencé par un maître par écrit quelques quelques idées alors déjà ce qu'on peut faire c'est se demander si je prends une valeur dans la distribution d'échantillonnage donc je vais prendre un point de cette distribution d'échantillonnage des moyennes c'est à dire qu'en fait je prends un échantillon de ma population réelle au départ jean calcule la moyenne donc ça ça me donne un point d'une valeur de cette distribution d'échantillonnage des moyennes je peux me demander quelle est la probabilité qu'elle est la probabilité je vais l'écrire comme ça que cet écran la moyenne de ce donc cette valeur là donc c'est la moyenne d'un échantillon que j'ai prélevés au hasard soit situé à moins de deux écarts types de la moyenne de la distribution d'échantillonnage donc ça je vais l'écrire comme ça quelle est la probabilité que si je prélève un échantillon au hasard sa moyenne soit plus grande que la distribution d'échantillonnage des moyennes mu 2 x bar - deux écarts types sigma 2 x par est plus petit que la moyenne de la distribution d'échantillonnage plus de écart-type voilà alors ça c'est on peut l'on peut le voir ici c'est une distribution normale et on peut même place et la valeur deux écarts type on connaît pas l'écart type mais on peut aussi on le place ici comme ça on peut voilà ici ça c'est la valeur la moyenne moins deux écarts types et ici ça sera la moyenne plus de ces quatre types donc ce qu'on va chercher en fait c'est la probabilité que quand on prend un échantillon aux arts on prélève un échantillon aléatoire donc en fait on prélève une valeur de cette distribution d'échantillonnage est calculé cette probabilité là ça revient à calculer la probabilité que la moyenne de l'échantillon qu'on a prélevé ces cartes de moins de deux écarts types de de notre moyenne de la distribution d'échantillonnage donc ça revient en fait à calculer l'air de cette portion ici de plans qui est sous la courbe de la loi normale entre les valeurs musique ce bar - deux écarts types plus émues de x bar +2 écart-type donc ces deux valeurs ici voilà alors si tu n'es pas encore familier si tu vas pas encore si tu te souviens pas encore des pourcentages à connaître dans le cadre de la loi normale du tu devrais retourner le voir les vidéos enfin c'est quand même une bonne chose à savoir en fait ce qu'on sait c'est que dans le cas d'une loi normale il ya 95 ya une probabilité de 95 alors en général on dit 95% mais on peut même le dire on peut même donner une valeur plus exact c'est 95 4% il ya 95 points 4 % des données qui sont situées à moins de deux écarts types de la moyenne donc ça cette probabilité là en fait c'est 95,4 % voilà ça c'est exactement l'air de cette surface là que j'ai assuré en violet donc c'est la probabilité que quand on prélève un échantillon quand on prélève pardon une valeur dans cette distribution d'échantillonnage des moyennes c'est à dire quand on prélève un échantillon qu'on calcule sa moyenne eh bien il ya une probabilité de 95 4% que cette moyenne soit comprise dans cet intervalle donc ça soit situé à moins de deux écarts types de la moyenne de la distribution d'échantillonnage des moyennes alors là je vais bon je fais peut-être que ce soit plus clair d'âge faire passer ça en vert puisque ces sept districts cette moyenne la mue de x barcella moyenne de la distribution d'échantillonnage des moyennes alors je vais traduire ça d'une autre manière puisque ça ça veut dire que la moyenne x barre et se situe à moins de deux écarts types de la moyenne de l'adisq but sur d'échantillonnage des moyennes et ça on peut le voir on peut inverser les rôles de x barré de mu 2 x barre puisque 6 x bar est situé à moins de deux écarts types de la moyenne du 2x paraît bien la moyenne but d'olic bar sera situé à moins de deux écarts types de la moyenne x barre on peut donc écrire ça comme ça alors je vais l'écrire différemment donc ça c'est exactement le même la même chose que de dire que la moyenne mu 2 x bar est comprise entre la moyenne x bar plus de deux fois l'écart type et la moyenne x bar - deux écarts types voilà ça tu peux te convaincre de ça en travaillant sur les inégalités en fait là cette double inégalités est équivalente à celle ci ça tu peux le faire de manière algébrique on a fait dans d'autres vidéos alors ça c'est aussi 95,4 % même valeur puisque c'est exactement la même le même événement alors ensuite on peut se rappeler d'une chose on avait on sait que la moyenne de notre distribution d'échantillonnage en fait ça sera égal à la moyenne de la distribution réel et donc ça sera égale en fait à la propre propre à la proportion réelle de jantes de d'électeurs qui vont voter pour le candidat b donc en fait on peut réécrire sa de cette manière là en disant que la cce identité là est équivalente à celle ci la proportion réelle la probabilité pardon que la proportion réelle paix soit comprise soit situé à moins de deux écarts types de la moyenne de notre échantillon donc c'est la probabilité que paix soit plus grand que x bar - deux écarts type est plus petit que x bar plus de ces quatre types et bien cette probabilité là c'est aussi 95 4% 95,4 % voilà là pour l'instant on a on a travaillé avec des valeurs exactes ce qu'on fait c'est que on a juste utilisé des propriétés de la loi normale pour trouver une probabilité qui sera une valeur exacte d'un certain événement le fait que la proportion réelle soit situé à moins de deux écarts types de la moyenne de notre échantillon qu'on a prélevés au hasard alors maintenant on va comprendre pourquoi est-ce qu'on est obligé de dire réserve raisonnablement penser alors ça c'est parce qu'en fait ici on a x par moins deux fois l'écart type 2 x barre mais on ne connaît pas cet écart type que cet écart type la x bar on ne le connaît pas on n'a pas réussi à le calculer parce que pour le calculer son expression était faisait intervenir d'écart type réel de sur toute la population qu'on ne peut pas calculer à moins d'aller interroger les 100 millions d'individus ce qui serait quand même pas tout à fait réalisable donc ce qu'on a fait c'est prendre une estimation de sectes écart type là est l'estimation qu'on en avait donné c'était la meilleure qu'on pouvait trouver c'était de prendre pour pour écart type l'écart type de notre échantillon l'écart type corrigé de notre échantillon qu'on avait ici trouvait donc ce qu'on a fait c'est remplacer notre écart type de la population réelle par cette valeur là à 0,50 et ensuite on a calculé l'écart type de notre échantillon en disant bien fait attention à dire que c'était une valeur approcher un fait une approximation ici donc on a supposé que notre cette valeur si et 0.50 / disque on a calculé en utilisant la l'écart type de notre échantillon était une estimation correcte une bonne estimation de l'écart type de notre distribution d'échantillonnage des moyennes sigma 2 x barre donc voilà c'est là où du coup on va ce qu'on va faire c'est réécrire cette cette inégalité l'a donc 7 pour le prg à la probabilité de cet intervalle là en remplaçant par les valeurs qu'on a de sigma x bar qui ne sont pas des valeurs exactes mais des valeurs approché donc ce qu'on va faire maintenant c'est qu'on va pouvoir écrire c'est la probabilité de donc je vais réécrire sa mère remplaçant sigma 2 x barre par la valeur approché qu'on a réussi à calculer donc on va maintenant avoir la probabilité on va pouvoir écrire ça la probabilité que notre proportion paix soit comprise entre x barre - deux fois 0,05 et x bar plus deux fois 0.52 fois pardon deux fois 0,05 et bien ça c'est une probabilité alors effectivement là il faut faire attention et c'est pour ça que tout à l'heure je disais on peut raisonnablement penser c'est que là on perd l'exactitude on a plus quelque chose on peut plus être absolument certains que cette probabilité là va être de 95 24% en fait là on va dire c'est à peu près de 95% cette probabilité là est à peu près de 95% on peut raisonnablement penser que la probabilité que la proportion réelle pardon paix est comprise dans 95% dans cet intervalle voilà alors maintenant on va pouvoir faire les calculs donc je continue on va dire que cette probabilité du coup alors je vais calculer les valeurs ici cx bar moins deux fois 0.50 donc ça ça fait moins 0,10 plus petit que paix qui est plus petit que x bar plus deux fois 0.50 donc plus 0,10 voilà et cette probabilité là c'est à peu près 95 % mais j'insiste sur le fait que là ce que j'ai fait en fait c'est uniquement traduire c'est toutes les lignes que j'ai écrites sont sont équivalentes à la seule chose c'est que quand on passe de cette ligne si à celle ci est bien on perd l'exactitude des données puisque on appris non pas la valeur exacte de l'état retire sigma 2 x par de l'écart type de la distribution d'échantillonnage des moyennes mais une estimation qu'on a calculé à partir de notre échantillon est effectivement notre échantillon pour être très bizarre et absolument pas représentatif du coup on pourrait avoir là un résultat qui pas du tout conforme à ce qu'on a mais c'est quand même une manière de mesurer un peu la qualité de notre de notre échantillon la représentativité de notre échantillon est donc c'est pour ça que là on avait des signes ego qui est qui était qui indiquaient des valeurs exactes alors que là on a une valeur indicative une valeur approcher on sait que ça va être il ya des chances que ce soit proche de 95 % c'est que ces probabilités là soit proche de 95 % alors on peut aussi puisque là en fait on avait pris un échantillon particulier à la moyenne s'était 0,43 à la moyenne de notre échantillon x par donc ça on peut le réécrire de cette manière là en disant que la probabilité que la proportion p alors on va remplacer simplement x barre par sa moyenne donc on va avoir un intervalle avec une certaine probabilité donc l'intervalle c'est la proportion paix de vote votant pour le candidat b ça va être compris entre 0,43 - 0 10 et 0 43 +0 10 voilà et 7 cette probabilité lasser on peut raisonnablement penser que c'est à peu près 95 % voilà et donc ça une autre manière de le dire c'est que on a un intervalle de confiance donc ça tu peux aller regarder les vidéos sur les intervalles de confiance en fait on a ici on a établi on a construit un intervalle de confiance à partir d'un échantillon un intervalle de confiance à 95 % et qui est celui ci en fait c'est alors la borne inférieure donc le noter comme ça la borne inférieure c 030 points 43 pardon - 0,10 donc 0,33 et puis la borne supérieure c'est 0 43 +0 10 donc c'est 0,53 donc on peut aussi et l'écrire de cette manière là on pourcentage c'est le même intervalle que 33% je vais écrire comme ça 33 % et 53 % donc ça veut dire que il est probable que la proportion réelle d'électeurs qui ont voté pour b soit comprise dans cet intervalle donkey et entre 33 % et 53 % de vos d'électeurs qui votent pour le candidat b alors il ya une autre manière de formuler ça et qu'on rencontre très souvent dans les médias c'est que là on va dire que on a fait un sondage sur 100 personnes et que de ceux d'après ce sondage il ya 43 % des électeurs qui vont voter pour le candidat b vote pour le candidat b et donc le reste donc 57% qui votent pour le candidat à voilà donc ça on nous donne ces résultats là le plus souvent résultats d'une enquête sont donnés de cette manière là avec une précision supplémentaire qui est la marge d'erreur donc on va on nous dit il ya d'après notre sondage il ya 43 % des électeurs qui vont voter pour le candidat b avec une marge d'erreur avec une marge d'erreur de 10% voilà donc ça c'est le terme à retenir ici c'est le terme marge d'erreur est en fait ça correspond tout simplement à l'amplitude de notre intervalle enfin la moitié de l'amplitude puisqu'ici cette marge d'erreur de 10% bien en fait c'est tout simplement cette valeur là ces deux écarts types deux fois deux fois l'écart type calculé avec notre estimateur de l'écart type calculée sur l'échantillon donc c'est ça la marge d'erreur et qu'on retrouve ici donc voilà ça c'est une autre manière de décrire un intervalle de confiance à qui est assez utilisé dans les médias il faut pas oublier cette marge d'erreur qui est quand même vraiment importantes et surtout je voudrais insister sur le fait qu'on peut pas dire qu'à 95% des chances que 43% vote pour le candidat d'aidé puisque effectivement nous ce qu'on a fait c'est prendre une estimation donc une estimation de l'écart type donc c'est une estimation de l'eca de la marge d'erreur en fait donc on ne peut pas dire précisément qu'il ya 95% des chances que ça se passe de cette manière là alors autre chose qui est quand même important a remarqué c'est que cette marge d'erreur ici c'est 10 % c'est quand même assez élevé en particulier on nous dit 43% des électeurs ont l'intention de voter pour le candidat b ça veut pas dire que le candidat à qui est donc crédité de 57 % des votes avec notre échantillon va être effectivement élu on peut pas on peut pas en déduire ça puisque même avec cette marge d'erreur là en fait le le prouver la proportion d'électeurs qui votent pour le candidat b qui déclare voter vouloir voter pour le candidat b ça peut être de 53% donc il reste une chance que le candidat b soit élu quand même malgré tout donc ça c'est très important à comprendre mais donc si on prend un échantillon de taille sens et vous voilà la marge d'erreur qu'on peut avoir c'est vraiment là la seule chose qu'on peut dire avec un échantillon de taille sans alors si on voulait réduire cette marge d'erreur ce qui serait quand même une bonne chose est bien la seule chose qu'on peut faire c'est prendre des échantillons de taille plus élevé ici on apprend et pris des échantillons de taille sens si on prend un échantillon de time il par exemple eh bien on va avoir un écart type qui va être plus petit puisque ça va être l'écart type original donc on va prendre un estimateur bien sûr de cet écart type réel et on va diviser par racine 2000 donc on va obtenir un écart-type plus petit ce qui veut dire que ensuite quand on va faire tous ces calculs pour trouver notre intervalle de confiance et bien en fait on va se retrouver avec une marge d'erreur en fait cette marge d'erreur va être diminuée donc voilà les deux choses à retenir à mon avis ici c'est que on obtient un intervalle de confiance qui va être raisonnablement être vrais dans 95 % des cas et on obtient une marge d'erreur et si on veut diminuer cette marge d'erreur est bien il faut faire une étude sur un échantillon de taille plus élevé est autre chose qu'on peut ajouter pour terminer ce qui si on a un échantillon donc dans cette si on s'en tient à cet échantillon notre candidat paix n'est pas élu c'est le candidat à quai et lui et ça c'est un résultat qui est qui et qui a nuancé justement grâce à cet intervalle de confiance puisque là effectivement même ans à partir de cet échantillon où le candidat mme b n'est pas élu et bien on lui laisse à cause de cette marge d'erreur on lui il ya quand même du possibilité qu'ils soient finalement quand même élu après l'élection présidentielle et finalement pour avoir un sondage un peu plus efficace qu'il faudrait faire c'est prendre un échantillon de taille plus élevés pour réduire la marge d'erreur ce qui permettrait finalement d'à vous de prévoir les résultats avec un peu plus d'exactitude donc avec en fait une marge d'erreur plus faibles