If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Test d'hypothèse et valeur critique

Un neurologue teste l’effet d’un médicament. Créé par Sal Khan.

Transcription de la vidéo

un neurologue souhaitent tester l'effet d'un médicament sur le temps de réaction pour cela il injecte à sang rare une dose unitaire de ce médicament puis les soumet à un stimulus terol neurologiques et enregistrent leur temps de réaction une neurologue c'est que en l'absence de ce médicament le temps moyen de réaction des rats et de 1,2 seconde alors que dans l'échantillon des 100 rats soumis à l'injection ce temps moyen est de 1,05 seconde avec un écart type de 0,5 secondes donc ça c'est la moyenne de l'échantillon un temps de réaction moyen de 1 05 secondes dans l'échantillon avec un écart type de 0.5 secondes pensez vous que le médicament a réellement un effet sur le temps de réaction dérape alors en fait les réponses possibles à cette question c'est oui le médicament un effet sur le temps de réaction bien non il n'a pas d'effet alors en fait ça ça va nous conduire ce qu'on va faire c'est formulé deux hypothèses on va d'abord formuler une hypothèse qu'on va appeler l'hypothèse nul on voit la notte comme ça à 0 c'est l'hypothèse nul et celle là elle va suppose que le médicament n'a pas d'effet n'a pas d'effet voilà alors ça c'est en général c'est comme ça qu'on va définir toujours l'hypothèse nul c'est l'hypothèse qui en fait exprime le statu quo donc aucun changement et là c'est ce qui se passe qu'on injecte le médicament ou non considère que là ça va être le résultat va être le même donc en fait ça ça veut dire que le temps moyen de réaction ne va pas changer donc on peut exprimer cette hypothèse nul en disant que dans ce cas là le temps réaction moyen ça va être égal au temps de réaction moyen normal c'est à dire ça va être égal à 1,2 seconde 1,2 seconde parce que ça c'est le temps moyen de réaction en l'absence de médicaments donc ça on va se dire l'hypothèse nul va considérer que la moyenne et 1,2 seconde même avec l'injection du médicament même avec injection voilà donc quoi qu'il arrive la moyenne ne change pas elle est toujours à deux secondes alors après ce qu'il faut faire c'est définir la deuxième hypothèse 1 l'hypothèse ce qu'on pourrait appeler la conterie potez c'est ce qu'on dit parfois mais en général on dit que c'est h 1 on appelle ça l'hypothèse alternative alternative voilà donc c'est l'hypothèse contraire à l'hypothèse nul alors celle là c'est tout simplement que le médicament a un effet médicaments a un effet et donc que l'âme le temps de réaction moyen est différent quand on injecte le médicament et quand on ne l'injectent part donc en fait on va avoir une moyenne différente de la moyenne sans injection de médicaments donc ça c'est ça va être le cas avec l'injection du médicament donc si on injecte le médicament on va obtenir une moyenne différents temps de réaction moyen différent de deux secondes ce qui indiquera qu effectivement le médicament un effet alors voilà la maintenance qu'il faut qu'on fasse s'est trouvé un moyen de décider quelles hypothèses on doit retenir en fait on va essayer de décider s'il faut accepter l'hypothèse alternative ou bien s'en tenir à l'hypothèse nul qui exprime le statu quo donc un effet nul du médicament voilà alors on va faire ce qu'on fait alors dans cette vidéo on va faire comment on fait en général dans la plupart des sciences on va commencer par supposer que l'hypothèse de que l'hypothèse nul est vrai on va supposer que les potes l'hypothèse nul est vrai et on va regarder si dans ce cas là en supposant que cette hypothèse là est vrai qu'elle est la probabilité d'avoir obtenu un échantillon avec ce temps de réaction moyen ce temps moyen de réaction voilà et si cette probabilité vraiment très faible à ce moment là on va se dire bon ben on a quand même des raisons de supposer que l'hypothèse nul fosses donc on a des raisons de rejeter l'hypothèse nul au profit du coup de l'hypothèse alternative voilà donc ça c'est le plan d'action qu'on va se fixer on va commencer par s'y poser que l'hypothèse nul zéro est vrai on va essayer de déterminer la probabilité d'avoir obtenu un échantillon avec un temps moyen de de 1,05 secondes et ensuite à la lumière de cette probabilité on va décider si oui ou non il faut accepter et l'hypothèse nul ou pas voilà donc c'est ce qu'on va faire on va d'abord supposé je vais l'écrire on suppose que h0 que l'hypothèse nul est vrai suppose que h0 est vrai donc ça c'est notre notre six positions qu'on va faire et puis dans ce cas là on va essayer de calculer la probabilité d'avoir un échantillon avec ce temps moyen et cet écart type ce temps moyen de 1 05 secondes celui là et cet écart type de 0 5 seconde alors on va en fait même calculé quelque chose une probabilité un peu plus large on va essayer on va calculer la probabilité d'avoir un échantillon encore plus extrême que ça qu'ils soient encore plus différents que ça hein donc encore plus extrême que ça alors bon pour faire ça on va considérer la distribution d'échantillonnage des moyennes alors ce qu'on sait sur la distribution d'échantillonnage sait que ça va être une loi presque une loi normale larron plus ici on a un effet des échantillons un échantillon de taille sans donc on va avoir vraiment une distribution proche de la loi normale donc je vais tracer sa voie comme ça alors on va avoir donc une loi non une courbe en cloche comme ça ça c'est donc la louve la distribution d'échantillonnage des moyennes cette distribution déchantent end échantillonnage des moyennes à la une moyenne qui est ici celle axe de symétrie de la courbe en cloche et on sait là puisque on suppose que la l'hypothèse nul est vrai on suppose que notre distribution d'échantillonnage des moyennes du coup sa moyenne mu 2 x paraît bien ça va être la même moyenne que la distribution d'origine donc ça va être mû c'est à dire qu 1,2 seconde ici puisqu'on a supposé que l'hypothèse nul était vrai c'est à dire que la moyenne n'avait pas changé donc elle est toujours un ou deux secondes même si on injecte le médicament alors on c'est autre chose aussi puisqu'on sait comment calculer enfin en théorie on sait comment calculer l'écart type de sept districts sur l'échantillonnage des moyennes on a une formule pour ça la formule je vais la donner c'est l'écart type sigma 2 x barre il est donné par l'écart type de la population réelle l'écart type réel sur toute la population divisé par la taille racine carré de la taille de l'échantillon ici donc c'est la taille de l'échantillon cessant non content d'avoir on va voir l'écart type réel / racines de sang alors effectivement le problème c'est que l'écart type réel on ne le connaît pas on n'est pas donnée ici on ne le connaît pas donc on va être obligé de remplacer cet écart type réel par une estimation est la seule estimation qu'on peut prendre ici c'est l'écart type de l'échantillon est ce qui vaut à 0,5 seconde alors là on est dans un cas favorable qu'à bon parce qu'on a un échantillon de taille sans sens donc c'est un ses plus grosses ans et plus grand que 30 et en général quand on sait que quand on a un échantillon de taille supérieure à 30 et bien l'écart type de l'échantillon est en général un bon estimateur de l'écart type réel sur toute la population donc là ce qu'on va faire c'est remplacer sa part s on va remplacer l'écart type réel sur toute la population par l'écart type de notre échantillon s est donc on va avoir un estimateur de l'écart type l'erreur type de la moyenne ici qui va être l'écart type de l'échantillon / racines de sang c'est à dire l'écart type donc l'écart type ici 70.5 je vais écrire directement / racines de sang qui est 10 voilà donc finalement on a une manière de trouver un estimateur alors je vais l'écrire comme ça de l'écart type de la distribution d'échantillonnage des moyennes je mets un petit chapeau pour qu'on voit que c'est un estimateur parce que là j'ai remplacé l'écart type réels de la population par un estimateur par une estimation de ce cette valeur donc ce que j'obtiens c'est pas l'erreur type proprement dit mais c'est l'erreur une estimation de l'erreur type qui va être du coup 0.5 divisé par dix ça fait 0,05 voilà donc l'âge et les caractéristiques principales de ma distribution d'échantillonnage des moyennes donc c'est une loi normale de moyenne 1,2 seconde et d'écart type 0 5 alors maintenant on va procéder un peu comme d'habitude comment on fait en général avec cette distribution d'échantillonnage des moyennes on va se demander on va prélever un échantillon au hasard dans dans notre distribution d'échantillonnage de moyenne et on va se demander quelle est la probabilité d'avoir un échantillon d'avoir prélevé un échantillon avec cette moyenne l'a1 ce temps de réaction moyen de 1,05 secondes alors en fait ce qu'on va faire c'est essayer de déterminer à combien d'écart type cette valeur se situe de la moyenne de la distribution d'échantillonnage des moyennes donc ça en fait on va finalement définiront ce qu'on fait d'habitude on va définir une variable centrée réduite en fait dans ce cas là ça s'appelle la statistique du test statistique du test et c'est donc la variable centrée réduite associée à cette valeur de 25 secondes donc je vais là je vais l'appeler enfin je vais la définir pardon donc ces jeux calculé en fait je vais calculé d'abord laissé l'écart de cette valeur par rapport à la moyenne donc ça je vais le faire de cette manière là je veux dire que c'est 1,2 moins 1,05 je le fais dans ce sens là pour avoir quelque chose de positif parce que le but c'est ensuite d'aller regarder une table de la loi normale donc en général dans les tables de la loi normale ya que les valeurs positives et je vais maintenant exprimer cet écart en terme d'écart type de la distribution d'échantillonnage donc je vais diviser sa part 0,05 donc ça c'est ce qu'on appelle la statistique du test c'est tout simplement la variable centrée réduite associée à notre valeur de 1,05 secondes voilà alors bon ça je peux le calcul et 1,2 moins 1,05 ça fait 0,15 donc 0 15 / 0,05 ça fait 3 donc notre statistiques du test elle vaut 3 donc ça veut dire finalement que notre temps moyen ici dans l'échantillon de 1,05 seconde il se situe à trois écarts types de la moyenne de la distribution d'échantillonnage heures je vais lever dessiner je vais dessiner un petit peu donc ici je peux dire que ça c'est un écart type après la moyenne donc ici j'ai deux écarts types après la moyenne et l'a3 écart type a pas les moyens là j'ai un écart type avant la moyenne là j'ai donc deux écarts type avant la moyenne et puis ici j'ai trois écarts type avant la moyenne voilà donc notre notre échantillon la de cet échantillon aussi il se situe ici en fait il se situe très exactement 3 écart type avant la moyenne donc il est là c'est ça ici alors ce qu'on cherche où c'est la probabilité d'avoir un échantillon de ce genre là donc en fait d'avoir un échantillon mène encore plus extrême que ça ça veut dire qui c'est qu'il soit encore qui s'écarte encore plus de trois écarts types de la moyenne donc en fait on va regarder les la probabilité qu'un échantillon se situe par là donc avec une valeur inférieure à 0,5 ou alors par ici supérieur à 1 cette valeur-là qui est cette valeur ici qui est la moyenne de 1,2 +3 écart-type donc plus 0.15 donc ça sera ici 1,35 donc la question qu'on se pose nous c'est quelle est la probabilité quand on prélève un échantillon dans cette distribution d'échantillonnage d'avoir un échantillon dont la moyenne est situé dans ces queues de distribution ici donc qu'ils s'écartent de plus de trois écarts types de la moyenne ici plus de x par voilà alors évidemment on peut déterminer ses probabilités là en ce sens reportant la loi normale sans très réduite on trouvera la valeur mais il ya quand même des choses dont c'est bien de se souvenir et en particulier on peut se souvenir de la règle empirique dont on a déjà parlé en fait la règle empirique elle dit que la surface qui est ici un donc c'est pour toute la société la surface pour toutes les valeurs qui s'écarte de moins de trois écarts types de la moyenne ça c'est toute cette distance là et bien cette surface là elle a une aire de 99 7% donc ça c'est quand même pas mal de souvenirs de sa l'air sous la courbe de la loi normale pour des valeurs situées à moins de trois écarts types de la moyenne et bien c'est 99 points 7 % 2 de la surface totale voilà donc maintenant on peut facilement en déduire ce qui reste pour ces queues de distribution évidemment il reste pour cette distribution pour ces deux queues de distribution celle là et c'est là ici il reste 100 % - 99,7 c'est-à-dire 0 23% voilà donc ça veut dire finalement que si on suppose que l'hypothèse nul est vrai bien on a une probabilité de 0 23% d'obtenir un échantillon qui va s'écarter dans la moyenne dont le temps moyen de réaction va s'écarter de plus de 3 écart type on a vraiment une chance très très faible 0 3% c'est vraiment pas beaucoup donc ça veut dire que dans notre cas précis si on suppose que l'hypothèse nul est vrai bien notre échantillon est vraiment très très peu vraisemblable un puisqu'elle 0.3 chance sur cent d'obtenir un échantillon aussi extrême que ça donc c'est vraiment une chance est vraiment une probabilité très faible donc effectivement enfin un bon sens en tout cas on a des raisons largement suffisante de penser que notre supposition de départ était fausse donc que l'hypothèse nul était fausse donc j'aurais tendance à rejeter à zéro a rejeté l'hypothèse nul dans ces conditions là alors attention je ne suis pas à cent pour cent sûr qu'il faut rejeter cette cette hypothèse nul peut-être que j'ai je prends un risque de me tromper évidemment quand je fais ça parce que je ne suis pas complètement sûr mais j'ai quand même de grandes chances de supposer que cette hypothèse nul et est fausse puisque si je suppose qu'elle est vrai bien le temps l'échantillon que j'ai obtenus et est un échantillon très très très peu probable donc ça c'est raisonnable de rejeter l'hypothèse nul et donc si on rejette l'hypothèse nul ça veut dire qu'on accepte l'hypothèse alternative donc on va en déduire que l'hypothèse alternative est la bonne et dans ce cas là que le médicament a un effet sur le temps réel le temps de réaction des rats alors voilà on a répondu à la question 1 on peut raisonnablement penser que le médicament a effectué en effet sur le temps de réaction des rares alors avant de terminer je voudrais donner un petit peu de vocabulaire cette probabilité là qu'on a calculé qui est la probabilité d'avoir obtenu un résultat aussi extrêmes ou plus extrême que celui de l'échantillon en supposant que l'hypothèse nul est vrai et bien cette valeur là on l'appelle la paix valeur la probabilité critique et on peut dire ça aussi et dans notre cas ici elle vaut 0 23% donc 0 3% c'est 0 003 donc c'est vraiment une probabilité très très très faible mais c'est pour ça qu'on en déduit que finalement l'hypothèse nul et n'étaient pas là n'était pas la bonne et qu'il faut la rejeter donc une valeur une paix valeurs aussi faible ça veut dire que lier probabilité très très très faible d'avoir obtenu un échantillon comme le nôtre si l'hypothèse nul est vrai donc ça ça fournit des raisons pour rejeter l'hypothèse nul alors en général il ya la plupart des gens utilisent un seuil en a on utilise un seuil au delà duquel la paix valeur la paix valeur va être considéré trop faible donc va permettre de rejeter l'hypothèse nul 7 ce seuil en général c'est 5% donc c'est une chance sur 20 c'est le seuil qu'on utilise le plus fréquemment la plupart des gens utilisent ce seuil la donc si on a moins d'une chance sur 20 d'obtenir un échantillon aussi extrêmes ou plus extrême que celui qu'on a eu et bien dans ce cas là on va rejeter l'hypothèse nul au profit de l'hypothèse alternative ici on a bien moins d'une chance sur 20 donc on est bien au-delà de ce seuil de 5% parce que là on va trois chances sur mille 1 donc c'est vraiment très très peu donc effectivement on a ici toutes les raisons de conclure ce qu'on a déjà dit de conclure que l'hypothèse alternative est vrai donc que le médicament a effectivement un effet sur le temps de réaction des rats