If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Tester une hypothèse dans le cas où l'échantillon est de petite taille

. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

pour être conforme aux nouvelles réglementations les nouveaux moteurs doivent avoir un taux d'émission inférieure à 20 parties par million ppm donc ça c'est une unité de mesure ce que conseille d'aller si tu sais pas ce que c'est tu peux faire une recherche une usine fabrique un premier lot d'un nouveau modèle de moteur pour effectuer des tests les taux d'émission de ces premiers moteurs sont alors là on nous donne un échantillon en fait et à 1 2 3 4 5 6 7 8 9 10 moteurs qui ont été fabriquées alors là pour gagner du temps j'ai déjà calculé la les statistiques sur cet échantillon donc la moyenne de cet échantillon cx barre et elle vaut 17,17 17,17 et puis j'ai calculé aussi l'écart type s qui vaut 2,98 voilà ces données fournissent tels des raisons suffisantes pour conclure que ce nouveau moteur est conforme aux réglementations le risque d'erreur de première espèce est fixé à 0,01 bon ça on va revenir là-dessus tout de suite emmené dans le cas d'un test d'hypothèses on nous demande de décider si quelque chose est vraie ou pas donc la première chose à faire c'est de définir les hypothèses nous nos deux hypothèses un l'hypothèse nuit les l'hypothèse alternative alors je vais commencer par définir l'hypothèse nul 0 à 0 et 1 0 je vais la définir en disant que c'est l'hypothèse où selon laquelle le les nouveaux moteurs ne sont pas conformes aux réglementations donc en fait ils ont une taux début d'émission qui est pas inférieure à 20 parties par million lors ge pourrait définir cette cette hypothèse en disant que la moyenne 2 le taux d'émission moyen est supérieur à 20 parties par million mais en fait ce que je vais faire c'est de définir de cette manière là je veux dire que la moyenne elle est égale à 20 parties par million 20 parties par million au fait je prends la plus petite valeur pour laquelle on n'est quand même pas conformes aux nouvelles réglementations voilà et puis je vais définir mon hypothèse alternative h1 qui va être les moteurs sont conformes aux nouvelles réglementations donc la moyenne le taux d'émission moyen ça va être inférieure mu 1 c'est le taux d'émission moyen va être inférieur à 20 dpm voilà et donc là j'ai bien défini mais deux hypothèses est en fait alors cette dernière phrase le risque d'erreur de première espèce est fixé à 0 0 1 0 0 1 ça veut dire qu'on va rejeter à zéro on va rejeter l'hypothèse nul si la probabilité d'avoir un échantillon de moyenne 17,17 x parts égales 17,17 sachant que h0 est vrai je l'écris comme ça et bien si cette probabilité là est inférieure à 0,01 on va rejeter notre hypothèse nul est donc là tu peut remarquer que en fait il ya une probabilité inférieur à 0 01 de faire une erreur de premières espèces à dire de rejeter à zéro alors qu'elle est vraie c'est ça une erreur de premières espèces alors bon du coup nous on va se placer dans on va faire une supposition va supposer que l'hypothèse nul est vrai c'est ce qu'on fait habituellement donc on suppose on suppose que h0 est vrai ça c'est notre supposition de départ et c'est à partir de ça qu'on va travailler alors ensuite on va procéder comme d'habitude c'est à dire qu'on va aller regarder la distribution d'échantillonnage des moyennes et on va regarder quelle loi est ce qu elle peut suivre et ensuite on va calculer une statistique la statistique du test qui va suivre une certaine loi alors si l'échantillon est suffisamment grand cette loi on l'a vu ce sera une loi normale comme la distribution d'échantillonnage des moyennes par contre si l'échantillon est petit et bien ça sera pas une loi normale ça sera une loi de student donc statistiques du test dans ce cas là ça sera une statistique t1 alors bon ben là ici on a un échantillon de taille 10 n égale 10 n égalise donc c'est un petit échantillon on avait dit que on pouvait considérer qu'un échantillon était de grande taille s'il était plus grand que 30 la honda n égale disent donc c'est un petit échantillon donc notre statistiques du test c'est une statistique tes statistiques t alors on va là calcul et maintenant je remonte un petit peu alors notre statistiques t je vais l'écrire comme ça on l'avait calculé plusieurs fois donc toute façon au départ on fait toujours on calcule toujours la même chose c'est la moyenne de l'échantillon - la moyenne de l'adisq bution d'échantillonnage / l'écart type dont on prend une un estimateur donc c'est on va le calcul et de cette manière là s pour quel est l'écart type de notre échantillon / la racine carré de la taille de notre échantillon ici c'est 10 voilà donc je vais même le faire comme ça je vais donc ix barry cissé 17,17 mu 2 x barre bon ben on a supposé que yaz 0 était vrai donc le nôtre moyenne ces 20 parties par million donc on a ici 17,17 moins 20 / alors notre écart type c'était 2,98 donc ici ça va être 2,98 / racines de 10 voilà alors là hein je te rappelle on voit bien que c'est on part d'une variable centrée réduite dans le cas où on a un grand échantillon cette variable centrée réduite elle suit une loi normale mais dans le cas où où l'échantillon est petit de petite taille comme c'est le cas ici et bien en fait on est obligé de prendre une autre distribution qui est construite à partir de là distribuable de la distribution normale mais qui tient compte du fait que l'échantillon est petit et que là en fait on a une valeur un peu sous-estimé de cet écart type donc dans ce cas là cette variable t elle suit une loi t2 student donc je vais calculé ça avec la calculatrice alors j'ouvre la parenthèse pour le dénominateur 17,17 moins 20 / alors j'ouvre la parenthèse ici parce que je vais avoir 2,81 18 / racine carrée de 10 je ferme la parenthèse pour la racine carrée et ensuite je ferme la parenthèse pour le dénominateur et je trouve moins 3,003 je vais arrondir à moins 3 donc notre statistiques t elle est pratiquement égal à - 3 - 3 alors voilà donc non à romane autre statistique t elle suit une loi de student ouaté de student et donc nous ce qu'on doit chercher c'est une valeur de la statistique t telle que la probabilité d'obtenir une valeur inférieure cette valeur 6 - 3 soit 2 1% alors on peut faire un petit dessin quand même ça sera plus facile donc je vais dessiner la courbe de la loi de student donc voilà c'est une courbe en cloche alors même là ça sera une loi de studen centrée réduite donc la moyenne ici sera nulle puisque c'est comme dans le cas de dunois normal quand on calcule ça on calcule la variable centrée réduite donc on est dans le cas de la variable de la loi normale centrée réduite ici c'est pareil avec la loi de student donc c'est une courbe symétrique par rapport à cette moyenne 6 et nous ce qu'on doit chercher c'est une valeur seuil en fait un seuil ici qui sera là par exemple donc ça c'est notre seuil donc on cherche en fait une valeur seuil tels que la probabilité de cette queue de distribution là que je hachures envers soit 2 1% cette probabilité là ça doit être de un pour cent voilà alors ça c'est une loi de thé de student donc je vais décrire loi t2 student pour des échantillons de taille n égale disent est ce qu on dit en général pour une loi de sudan c'est con on donne plus que la taille de l'échantillon ce qui compte c'est le degré de liberté et là on a 10 - 1 c'est à dire 9 degrés de liberté donc on va aller chercher notre seuil dans une loi t de studen pour 9 degrés de liberté alors ici on a un test unilatérale en fait on s'occupe que de 7 que de distribution là je veux dire qu'en fait la probabilité d'avoir une valeur supérieure à ce seuil donc la leyre de toute cette surface là que je hachures maintenant ça ça va être 99% 1 99% voilà alors le problème c'est que dans la plupart des cas la table de la loi de studen ne donne pas à n'est pas construite pour donner des valeurs négatives ici on a une valeur négative donc on va pas pouvoir là y'a d'la trouver directement alors j'ai une table de la loi de studen ici est en fait ce dont il faut se rappeler c'est que cette table de la loi de studen tel va donner pour l'un test by unilatérale elle va donner quelque chose comme ça je vais l'avoir dessiné une ici voilà en fait puisqu'elle donne sept tables de la loi de studen c'est plutôt des valeurs positives 1 elle donne des valeurs positives donc des seuils tels que cette probabilité là pour des valeurs supérieures que la probabilité d'avoir une valeur supérieure à ce seuil ici est de 1% donc on va pouvoir trouver avec la table de la loi normale ce seuil la dont tels que en fait toute cette partie là soit 99% la partie que je hachures ici soit 2 99% voilà donc la table va donner la probabilité d'avoir une valeur inférieure à ce seuil live ici on va donc chercher et la valeur seuil tels que cette probabilité a soit 99% alors quand on regarde nos deux courbes en fait on sait que la courbe de la loi dite du don't et symétrique par rapport à cette moyenne donc voilà c'est de ça dont il faut se rappeler en fait on voit que de cette manière là la table de la loi de studen va pouvoir nous aider à déterminer notre saillie 6 1 alors bon là on est dans une dans le cas d'un test unilatérale en une situation unilatérale on s'occupe que d'une seule des queues de distribution et on va chercher dans la table de leur grotte student ce soit ici tel que la probabilité d'avoir une valeur inférieure à ce seuil est de 99% alors on va prendre la table de la loi voilà donc nous on est dans le cas unilatéral c'est ce qu'on vient de dire donc ces sept ligne là ici est ce qu'on veut c'est avoir une probabilité inférieur à 99 % donc on va chercher ici 99% c'est là donc on sera dans cette colonne l'a ensuite on avait dit que les la taille de l'échantillon s'était dit ce donc qui avait 9 degrés de liberté 10 - 1 donc on va se mettre dans cette ligne ici 9 degrés de liberté c'est là donc finalement ce qu'on trouve comme valeur c'est celle ci 2,8 121 donc notre saillie si le seuil ici c'est 2,8 121 ça c'est ce qu'on obtient par lecture de la table de la loi de studen tu éduques ou dans notre cas enfin le cas qui nous intéresse ici notre seuil ça sera de moins 2,8 121 par symétrie 1 comme on l'a dit tout à l'heure alors ça ça veut dire quoi ça veut dire que la probabilité d'avoir une valeur une taie statistiques inférieures à - 2,21 et bien elle est de 1 % 2 alors ça ce qui est hachurée envers du coup c'est je n'ai pas dit tout à l'heure c'est ce qu'on appelle note la zone de rejet c'est la zone dans laquelle si notre statistiques se trouvent dans cette zone là eh bien on va rejeter l'hypothèse nul en sachant mesurer le risque d'erreur de premières espèces qu'on fait un don qui si effectivement notre des statistiques notre statistiques t elle est de -3 donc elle est dans la zone de rejet puisqu'elle est inférieur à moins de 821 donc ça c'est la valeur - 3 donc effectivement ce qu'on va faire c'est rejeter l'hypothèse nul on va rejeter l'hypothèse nul on rejette l'hypothèse nul et du coup on peut raisonnablement accepter l'hypothèse alternative donc dire que notre nouveau moteur est conforme aux nouvelles réglementations voilà et quand on fait ça on sait que notre risque d'erreur de première espèce est inférieure à 0,01 donc inférieure à 1% donc on sait qu'on à risque de moins de 1% de rejeter notre hypothèse nul alors qu'elle est alors qu'elle est vraie et donc voilà finalement après tout cette étude on peut raisonnablement dire que notre nouveau moteur est conforme aux réglementations