If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Présentation de la loi normale

À la découverte de la loi normale. Cliquez ici pour télécharger le tableur Excel utilisé dans la vidéo. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

dans cette vidéo ce qu'on va faire c'est parler de la loi normale alors la loi normale c'est vraiment un des concepts les plus les plus importants c'est vraiment un concept central en statistiques aux statistiques inférentielle surtout est en fait bon statistiques inférentielle ce qu'on fait c'est faire des inférences à partir de données donc tirer des conclusions à partir de données et en fait on va se rendre compte que dans la plupart des cas et bien ce qu'on fait c'est lié d'une manière ou d'une autre à la loi normale alors on va utiliser ce tableur que j'ai préparé ici et que tu peux télécharger sur le site de la khan academy donc tu vas dans les temps de téléchargement et ce fichier s'appelle loi normale intro alors voilà donc tu peut le télécharger de façon là on va explorer un petit peu cette loi normale et ensuite on manipulera le tableur on va s'amuser un petit peu à changer les paramètres et puis on verra ce qui se passe alors pour l'instant on va explorer un petit peu tout ça est ce que je voudrais c'est de donner en fait les bases d'une compréhension et d'une bonne compréhension de ce que c'est que la loi normale pour que tu puisses a ensuite plus tard quand tu quand on te dira là on fait on suppose que la variable suis une loi normale toi tu sauras ce que ça veut dire du connaîtra la formule tu seras comment l'appliquer voilà donc c'est ça qu'on va essayer de faire ici alors pour commencer si tu fais une recherche sur internet on donnant les mots-clés doit normal tu vas tomber sur cette formule alors effectivement elle a l'air un peu effrayante avec toutes les lettres grecques et tout ça alors en fait ceci que mac et là on le connaît ça c'est l'écart type delà de la distribution qui est ici alors ce qu'on a ici c'est en fait une densité une fonction de densité de probabilité j'encourage à les regarder les vidéos sur les sur les densités de probabilités donc sur les variables aléatoires continue effectivement là c'est ce qu'on a on va on va s'occuper d'une variable aléatoire continue et en fait c'est intéressant d'aller regarder ses vidéos parce que tu vas te rends tu compte que finalement on il ya une certaine transition du de la loi binomiale à la loi normale quand on fait un grand grand grand un très très grand nombre d'essai partant d'une loi binomiale ont fait un grand grand nombre d'essai et on s'approche en fait de ce qu'on appelle une loi normale alors essayez une très grosse différence c'est que par exemple dans le cas d'une loi binomiale on peut très bien se demander quelle est la probabilité que la variable soit égale un nombre donné par exemple six ou sept ans on va dire et du coup à ce moment là ce qu'on fait on aura à notre disposition l'histogramme diagramme en bâtons des probabilités de la variable aléatoire qui suit une loi binomiale et on ira regarder dans ce dans ce diagramme alors on ira chercher la valeur cet ici dans sur l'axé des abscisses et puis on ira lire la probabilité correspondante en eau sur la sur le l'histogramme donc la retrouvera ici cette cette valeur là qui sera la probabilité que la valeur que la variable aléatoire soit égal à 7 alors dans le cas d'une variable aléatoire continue on peut pas faire ça ça n'a pas de sens en fait de demander la de se demander quelle est la probabilité que la variable est une valeur donnée précise et parce qu'en fait ça ne peut pas se produire là de nouveaux champs engage à les revoir la vidéo sur les densités de probabilité est en fait du coup ce qu'on doit se demander c'est pas à quelle est la probabilité que la variable x soit égal à 7 ou 8 une valeur n'importe laquelle données mais quelle est la probabilité qu'elle soit dans un intervalle donné un dock par exemple on peut se demander quelle est la probabilité que la variable aléatoire soit comprise entre sept et demi donc là je fais pas du tout les choses à l'échelle et 6 et demi par exemple voilà et donc on va avoir ici on va repérer la valeur 6 et demi sur la densité de probabilités sur la courbe de la densité de probabilité qui est ici et puis on repérera la valeur cet ennemi aussi et on aura du coup cette cette bande en fait qu'ils aient compris sous la courbe est en fait la probabilité que la variable soit comprise entre 6 et demi et set et demi et bien ça va être tout simplement l'air qui hélas compris sous la courbe entre les valeurs 6 et demie et 7 et demi alors si tu connais le calcul intégral tu sais comment calculer cette l'air de cette partie qui est comprise sous la courbe en fait ce qu'on va faire c'est l'intégrale de la fonction de la fonction de densité de probabilité qui est pays si celle-là p 2 x alors attention parce que c'est pas forcément une loi normale en eux très très très nombreux cas ça sera une loi normale mais c'est pas obligatoirement une loi normale donc dans le cas général on peut avoir une autre densité de fond de probabilité le problème sera toujours le même c'est à dire que pour calculer la probabilité que la variable soit dans une fourchette donnée eh bien on va calculer l'ère de la partie sous la courbe dans cette fourchette donnée la voilà alors du coup ça si tu connais le calcul intégral si tu connais pas je t'engage aller voir les vidéos là dessus eh bien tu vas tout simplement faire l'intégrale entre les valeurs données donkey 6 et 6,5 et 7,5 de la fonction densité de probabilités dp2x dx du coup voilà ça ça te donnera exactement l'air qui est compris sous le quai comprise entre les valeurs 6 et demi et c'est 17 et demi et la courbe de la densité de probabilité alors bon on a réduit sa du calcul intégral mais évidemment quand on regarde la fonction de densité de probabilités dans le cas de la loi normale donc c'est cette expression qui est ici c'est pas du tout une fonction qui est facile à intégrer un donc on va pas calculer l'intégrale de cette fonction là mais on va procéder numériquement c'est à dire qu'on va en fait on va essayer de faire des approximations de trouver une valeur approximative de ces intégrales alors faut pas que ça ça te semble imprécis ou incorrectes et que tu sois un peu déçu de de faire des approximations alors que tu pourrais essayer de calcul et l'intégrale de cette fonction mais c'est vraiment pas quelque chose de facile donc c'est tout à fait acceptable d'aller chercher des approximations l'aria des fonctions qui vont être qu'ils vont donner des approximations de ces intégrales là mais on peut aussi trouver des approximations en faisant exactement ce qu'on avait fait ce qu'on fait quand on calcule l'erc y compris sous une courbe par exemple là on peut très bien dire que l'ère de la surface ici que j'ai assuré en violet et bien en fait ça va être on peut tracer le trapèze donc la base là donc avec ce côté qui part de ce point là jusqu'à ce point là et on va dire que les l'air qui est compris sous la courbe elle est très proche de l'air de ce trapèze donc on va pouvoir ensuite calculé l'air de str apaise et on aura une approximation de l'air de cet air là donc de l'intégrale qui est ici alors il ya d'autres façons de faire ça c'était une façon de faire on en utilise plusieurs quand on fait du calcul intégral par exemple on peut aussi se dire que si on prend cette droite là qui est le milieu de l'intervalle qui passe par le milieu de l'intervalle on pourrait calculer la probabilité enfin l'ère du règles de ce rectangle si la la j'ai c'est de le tracer à peu près correctement dont claire de ce très fière de ce rectangle là pardon et puis en fait ça aussi ça serait une assez bonne approximation parce que ici on voit que on a on a oublié cette petite partie qui est là mais on va rajouter celle qui est ici qui a l'air à peu près qui à peu près la même qui à peu près la même surface salaire ses proches de deux triangles qui sont à peu près identiques donc ça aussi ça constitue une bonne approximation de l'air qu'on cherche à calculer donc de cette intégrale la voile alors là il insiste sur le fait que l'on peut très facilement calculer l'air de ce rectangle c'est simplement la longueur du segment de base ici x cette hauteur là qui est donc p27 où la valeur la densité de probabilités calculé pour x et gallas est donc ça c'est facile à calculer c'est tout ce que je veux dire là sur ces deux manières différentes approches de donner une approximation de cette ère sous la courbe c'est ce qu'on fait dans le calcul intégral changala les revoir toutes ces vidéos si tu les a pas regardés mais voilà et donc ça aussi ça te montre aussi ce que devient une loi binomiale par exemple qui est constituée par des parrains y stocker représenté par un histogramme comme ça avec plusieurs bâtons et en fait quand on répète une expérience binomiale qui suit une loi binomiale un très grand nombre de fois en fait ça de ça on s'approche de plus en plus d'une loi normale c'est ça qui est très important alors de manière générale on a quelques résultat très important ce résultat on l'appelle le théorème de la limite centre est et en fait c'est un résultat vraiment fondamental en statistiques et c'est un peu une généralisation de ce que je viens de dire sur la loi binomiale quand on la répète quand on répète une expérience binomiale un nombre très très très grand deux fois on s'approche d'une loi normale alors dans cette vidéo va pas essayer de démontrer ce théorème de la limite centre et on va juste essayer de comprendre ce que ça veut dire et en fait on peut se faire une idée de sa as en reprenant ce qu'on a fait sur le lancer d'une pièce de monnaie non truquée donc on lance cette pièce de monnaie un certain nombre de fois et disons que par exemple on marque un point quand on a quand on a eu quand on obtient face alors on va avoir une variable aléatoire qui va noter le nombre de succès donc le nombre de points finalement qu'on aura en un certain nombre de lancers et donc chaque lancer est indépendant c'est ça qui est important par contre quand on fait un très très grand nombre de données si on imagine faire quelque chose qui approche la fina nombre de lancers qui approchent l'infini et bien finalement le nôtre variable aléatoire va suivre une loi normale alors ce qui est important à bien comprendre c'est que nous lancer indépendants et bien ils n'ont pas il sait pas la peine qui suit on leur demande pas de suivre une loi normale 1 par contre quand on fait un nombre un nombre d'essai qui approchent l'infini et bien finalement il la variable aléatoire va suivre une loi qui approche la loi normale c'est ça qui est très important lors par exemple on peut parler de particules on peut se dire que si deux particules se rencontrent elles vont interagir ensemble cette interaction ne va pas forcément suivre une loi normale par contre quand on va faire la somme de toutes les interactions possibles dans une heure je pas dans l'univers ou dans une partie de l'univers entre différentes particules et bien finalement on va obtenir une loi normale c'est ça qui rend la la loi normale si importante qui fait qu'elle est si naturel au fond et qu'on la rencontre si souvent parce que dès le moment où on a un certain nombre un phénomène que l'on reproduit de manière indépendante plusieurs fois de suite un très très grand nombre de fois et bien plus le nombre de fois où on reproduit ce phénomène est grand plus on peut légitimement penser que la loi va être proche d'une loi normale voilà c'est vraiment un théorème très très important et qui fait que cette loi normale est si fondamental en statistiques et en fait quand on a affaire à des phénomènes très complexe on peut très bien les subdivisée en une somme d'un très grand nombre de termes indépendant et du coup on va pouvoir on va pouvoir formuler l'hypothèse que cette somme suis une vraie une loi normale alors on verra plus tard dans d'autres vidéos comment est ce qu'on peut dire si cette supposition cette hypothèse que la loi la loi a suivi et net une loi normale comment est-ce qu'on peut mesurer si c'est effectivement le cas ou pas hein donc ça ce sera le sujet d'autres vidéos là on va commencer déjà par essayer de se familiariser un petit peu avec avec cette formule alors ce qu'on a ici la paix de x c'est alors un sur racine est sûre sigma racines de deux pays alors c'était cette expression là en fait celle exponentielle de la parenthèse qui est là donc je vais déjà à réécrire ça comme ça p 2 x c'est un sur sigma donc ça c'est l'écart type x racines de 2 pi x e donc ça ici celle exponentielle de cette parenthèse donc c'est eux puissance cette parenthèse donc je vais pouvoir l'écrire comme ça de puissance - x - mumu c'est la moyenne de la population au carré divisé par deux fois sigma au carré donc sigma c'est l'écart type donc sigma oh caresser la variance donc là on a réécrit cette formule de la densité de faune de probabilités de la loi normale la fonction densité de probabilités de la loi normale c'est celle ci qui ont écrit de cette manière là alors ça en fait comment est-ce qu'on se sert de cette fonction c'est tout simplement admettons par exemple là on essaie de horn et on est en train d'étudier une distance que parcourt je n'ai pas les clients d'un restaurant pour aller au restaurant donc la moyenne de ses cinq as imaginons qu'on souhaite qu'elle claque calculer la probabilité que quelqu'un ait parcouru à peu près 7 km pour venir au restaurant bien ce sera donc deux fois plus que la moyenne donc on ce qu'on va faire c'est remplacer x par cette ensuite musset la moyenne donc on pourra le remplacer par cinq sigma c'est l'écart type qui est ici on pourra le calcul et en faisant un échantillonnage donc on aura une valeur de ce sigle en aura aussi une valeur de sigma au carré et ensuite en remplaçant ce x par sept du coup on aura la densité de probabilités au point x égale cep alors c'est important de bien comprendre que ça donne pas la probabilité d'avoir une valeur exactement égal à 7 parce que sa fille dit physiquement c'est absolument impossible que une personne habite à exactement exactement 7 km2 du restaurant puisque même en mesurant le plus précisément possible en aura une marge d'erreur est d'ailleurs même l'unité m il n'est pas défini à lot à l'atome près 1 donc ça c'est ce qu'on avait vu déjà dans une autre vidéo sur les densités de probabilités donc finalement on n'a pas de sens de parler de la probabilité d'accueillir cela variable distance soit égal à 7 mais du coup si on veut calculer une probabilité qui va nous donner une idée de ça on va il faut qu on demande qu'on se dise quelle est la probabilité que la variable x prennent une valeur proche de 7 donc comprise dans une fourchette et c'est ça qu'on qu'on m'a fait tout à l'heure en calculant du coup l'air de cette surface voilà ça c'était juste pour te montrer comment comment on utilisait cette densité de probabilité qui nous donne finalement la hauteur de ce point là qui est ici est qui et qui représente la densité de probabilités en ce point là mais c'est pas la probabilité que la variable soit égal à 7 parce que cette probabilité là elle est nulle alors cette densité de probabilité c'est une vraiment on la rencontre tellement souvent dans la nature est bon bien sûr statistiques inférentielle a aussi principalement que vraiment il faut il faut arriver à se l'approprier elle a manipulé assez facilement donc on va commencer par parfaire sa part essayer de manipuler un peu cette expression donc je vais effacer tout ce que j'ai fait jusqu'à maintenant je vais faire un peu de place aussi voilà alors maintenant si je regarde cette formule il ya ce sig mac est là donc ça c'est l'écart type je peux très bien considéré que ça c'est la racine de sigma o car est donc en fait c'est rentré le sigma dans dans le nord sous la racine carrée donc je vais pouvoir écrire que p 2 x du coup c'est un sur racine de 2 pi x sigma au carré est bon ça je voulais pas vu enfin c'est pas quelque chose qu'on fait classiquement j'ai pas vu ça souvent écrit comme ça mais c'est pour faire apparaître la variance la variance on peut la calculer c'est ce qu'on calcule avant de calculer l'écart type donc puisqu'on l'a déjà ici là on leur a ici aussi ensuite on a vu que l'exponentielle de cette parenthèse en fait c'étaient eux puissance alors je peux donc j'avais écrit comme ça j'avais écrit e puissance - xx xx - mu au carré sur deux sigma au carré est en fait ce que je peux faire c'est réunir ça pour avoir une fraction que je vais élevée au carré donc en fait je peux écrire ça comme ça paie de x ça va être alors je réécris cette fraction l'a1 sur racine de 2 pi x la variance x e puissance alors du coup là je vais avoir - 1/2 x alors ici ça va être x - mu x - mu / sigma le tout au carré voilà alors ça c'est intéressant parce que ce qui est dans la parenthèse ici la xe - mu / sigma on peut l'interpréter graphiquement alors pour voir ça on peut regarder déjà le numérateur x - mu en fait si on est par exemple ici et bien x donc ça ça serait xx xx - vu ça c'est musset la moyenne qui est ici un sas et la moyenne mu c'est ce que ce qui est noté ici hein ça c'est la loi normale de moyenne 5 et d'écart type 4 c les paramètres qui sont donnés ici donc ça c'est la moyenne et cette distance-là cette distance la cx - mu et puis autre chose qui est important c'est que donc on a un écart type de 4,1 et qui en fait est représenté par cette distance là ça c'est un écart type donc en fait quand je fais x - mu / sigman ça me dit de combien d'écart type je suis éloigné de la moyenne donc de combien d'écart type cette valeur x s'écarte de la moyenne donc c'est ça qui est intéressant et alors ce rapport là en fait on va l'appeler ça va être on va lui donner un nom c'est une variable centrée réduite on en reparlera dans d'autres vidéos alors je vais l'appeler z cette quantité ici je vais l'appeler z alors je peux je vais continuer à jouer un peu avec cette formule parce que je crois que c'est important d'arriver à la manipuler de voir ce qu'on peut faire avec comment est-ce qu'on peut l'écrire parce que ça c'est une forme qui est la plus standard mais justement il ya d'autres formulations de cette fonction de densité de probabilités normal donc on va on va voir ce que ça donne c'est important quand même parce que c'est encore une fois une formule qui est qu'on retrouve énormément dans la nature qui permet de décrire énormément de phénomène est encore une fois c'est assez mystérieux mais encore une fois on a une c'est une forme kylie 2 nombre très important le nombre pi ici et le nombreux qui sont vraiment de nombre très important qui du coup se retrouve de nouveau l'allier dans une formule qui a énormément d'applications alors dit de nouveau parce qu'elle aussi la formule très connu le puissant cipi égales - un voile à ces deux nombre de nouveaux liés dans une loi qui va décrire énormément de phénomène c'est quand même pas anodin et je crois que c'est important d'arriver à manipuler tout ça donc je vais continuer alors je vais rappeler d'abord une formule de la une propriété de l'ex potentiel si on écrit e puissance - 1/2 de a en fait ça c'est la même chose que ^ ^ - 1/2 donc finalement ça va être une quantité élevée la puissance - 1/2 c'est l' inverse de la racine de cette quantité donc c'est un sur racine 2e puissance voilà alors là je vais utiliser ça donc je vais continuer à transformer ma formule donc j'ai toujours un sur racine de 2 pi x la variance multiplier alors là je vais écrire que c'est eux puissance donc comme j'ai dit tout à l'heure c'est eux puissent ans alors je vais mettre z depuis 100 cède au carré le tout est élevé à la puissance - 1/2 et donc je continue ça va être un sûr et là je vais pouvoir comme je vais avoir ici un sur racine 2e puissance z au carré je vais donc pouvoir faire tout rentrer dans la racine je vais mettre une seule racines ça va être racines de 2 pi x sigma au carré x e puissance z au carré voilà et là on a une formule qui est d'apparence beaucoup plus simple qui est assez uniforme en n'oubliant pas ici que le z mesure de combien d'écart type on s'écarte de la moyenne voilà alors maintenant qu'on a manipulé un peu l'expression de la fonction de densité de probabilités de la loi normale on va travailler sur va manipuler la loi normale elle même et bouger les paramètres donc je vais maintenant ouvrir le tableur alors voilà ça c'est le tableur que tu peux télécharger sur le site alors blanc on a la courbe de la courbe en cloche donc la courbe de gauss aussi ça s'appelle comme ça qui représente la fonction de densité de la loi normale avec ces paramètres là la moyenne de 0 donc c'est ce qui est indiqué ici par la droite verte et puis un écart type de 4 ici l'écart type de 4 alors s'est matérialisée en fait par ces deux droites verticale qui marque la distance d'un écart type par rapport à la moyenne donc cette distance qui hélas delà de la droite vers tala droite bleus c'est un écart-type donc c'est ce qu'on peut voir ici donc cette cette valeur qui est la c4 1 comme ça on aura une distance de 0 à 4 alors le fichier est fait de telle manière qu'on peut changer les paramètres c'est ça qui est intéressant alors si par exemple on change de moyenne on peut mettre une valeur de 4 par exemple comme moyenne qu'est ce qui se passe quand on voit que la la courbe courbe en cloche chez décalé se décale vers la vers la droite avec la moyenne de 4 ici c'est exactement la même courbe que tout à l'heure mais elle est juste déplacé vers la gauche vers la halle et déplacé en fait de 4 vers la droite de quatre unités si je prends par exemple une valeur d'une autre valeur si je pour une moyenne de moins 3 da je vais avoir exactement le même phénomène c'est à dire que la courbe en cloche va être trans la tlv décaler vers la gauche de trois unités et la moyenne sera matérialisé toujours par cette droite verte et indiquant la valeur - 3 voilà alors ça c'est intéressant donc je vais remettre une moyenne de 0 maintenant on va regarder ce qui se passe quand on change l'écart type on va changer la valeur de l'écart type donc ici j'ai mis la variance aussi c'est juste à titre indicatif on peut pas la changer on peut la changer en changeant l'écart type et puis là on aura le car est donc ici j'ai dit que cette distance là on entre la droite verte et la droite bleus c'est une distance de 4 qui représente l'écart type si je change cet écart type si je m'arrête par exemple je mets un écart-type plus faible de 2 je vais avoir voilà une courte qui va être beaucoup plus resserré en fait beaucoup plus resserré autour de sa valeur moyenne alors moyenne ici c'est zéro donc la laquelle la variance est calculé aussi un alors si au contraire je prends une valeur plus élevée de l'écart type qu'est ce qui va se passer alors essayez de t'imaginer ce qui va se passer si par exemple lima l'écart type est de 6 eh bien la voilà la courbe va être beaucoup plus aplatie en fait elle va être beaucoup plus élargie aura beaucoup plus de valeur qui seront plus lointaine de qui seront situées plus loin de leur moyenne alors ce qu'on vient de voir là ça correspond bien ce qu'on sait de la de l'écart type puisque la variance rappelle toi c'était la moyenne des carrés des écarts par rapport à la moyenne et quand on prend les quartiers pour prendre racine carrée de la variance donc en quelque sorte en obtient exactement ça mais on obtient quand même quelque chose qui donne une idée de la distance moyenne par rapport à la valeur moyenne de la distribution donc effectivement plus cet écart type est grand plus les valeurs sont sont dispersés sont éloignés de leurs de leur valeur moyenne et plus l'écart type est petit plus les données sont resserrés autour de cette vallée remet de cette valeur moyenne on peut prendre un cas encore plus extrême par exemple avec un écart type de discours beaucoup plus grand et voilà la courbe est encore plus aplatie les données sont distribués plus sont plus étalés autour de leur valeur moyenne alors là on peut voir aussi une différence vraiment majeur avec la loi binomiale ici il faut imaginer que ça seul et la courbe se prolonge des deux côtés 1 est en fait dans le cas d'une loi binomiale on a un nombre fini de valeur donc il ya des d'autres valeurs les valeurs qui ne sont pas qui ne se font pas partie des valeurs possibles de la variable et bien leur probabilité nuls évidemment alors que là on a toujours une probabilité même si on prend un nombre très élevé par exemple ici dix mille et bien la probabilité d'avoir une valeur proche de 10 milles ça sera peut-être ça sera vraiment très infime mais ça sera pas nul ça sera pas une probabilité d'une c'est vraiment une différence importante avec la loi binomiale puisqu'ici on a une infinité de valeur un dock la courbe se prolonge des deux côtés mais elle ne touche jamais la kz2 et des ah ben si simple donc il ya toujours une ère sous la courbe qui n'est pas qui n'est pas nul ça c'est tout simplement parce qu'à la différence de la loi binomiale cette loi normale elle est définie pour toutes les valeurs de xto les toutes les valeurs réelles de la variable x alors ce que je disais au début de la vidéo c'est ici ça n'a pas de sens de parler de la probabilité d'une seule valeur il faudra qu'on parle de la probabilité d'un intervalle de valeur bon enfin je vais préciser ça alors je vais prendre une autre distribution je vais prendre une mois une moyenne par exemple de moins 6 voilà pour ce soit un cas un peu moins particulier alors ici ici ça n'a pas de sens de calculer la probabilité que la valeur de la variable soit égal à zéro mais on va devoir calculer une fourchette donc on peut calculer par exemple la probabilité que la variable et de prêts d'une valeur comprise entre - 0.5 et 0.5 par exemple on peut le faire ici je le fais ici après je te montrerai comment comment j'ai programmé le tableur pour qui calcule tout ça donc on va calculer la probabilité que la variable est une valeur comprise entre -0 5 et +0 5 voilà et donc ça on nous dit enfin le tableur lanoux calculs cette probabilité là et bien c'est 3 3% alors là je vais prendre mon outil stylo et donc ce qu'on a fait ici c'est tout simplement calculer la probabilité donc la probabilité disons que moi - 0.5 on va dire que c'est à peu près ici et 0,5 on va dire que c'est là et on va en fait on a calculé quand on va calculer la probabilité que x soit compris entre -0 25 et 0.5 et bien en fait on a calculé l'air de cette surface laquée moi j'arrive pas très bien dessinés ça avec cet outil stylo qui est dans le tableur voilà on calcule en fait l'air de cette partie là du plan qui est comprise entre - entre les valeurs - 0.5 et 0.5 et la courbe de la densité de probabilité c'est exactement ce qu'on a fait c'est exactement ce que je disais au début donc ça on peut dire aussi que c'est on peut le voir comme ça si tu connais le calcul intégral tu peux dire que ça c'est l'intégrale de moins qui va de moins 0,25 à 0,5 de la fonction de densité de probabilité avec les paramètres qui sont ici à sygma alors si demain on connaît ses 10 et la moyenne mu qui est moins six donc ça on va pouvoir l'écrire donc ça va être l'intégrale de 1 sur sigma donc c'est dix fois racines de 2 pi x l'exponentielle alors de moins x moins -6 donc x + 6 élevée au carré sur deux alors sigma au carré ça va être sensé la variance inquiet noter ici donc c'est deux fois 100 200 voilà des x faut pas oublier la différentiel dx lorsque j'ai calculé ici ça va être cette valeur là on cette intégrale là donc ça on avait dit au départ que c'est pas facile en général de calcul est vraiment l'intégrale la fonction intégrale de la fonction de la densité de probabilité c'est pas quelque chose qu'on fait facilement on n'arrive pas à le faire donc on fonctionne par des approximations et c'est par ces méthodes là qu'on a trouvé ici cette valeur là de -3 de 3 3% pardon alors pour faire ça en fait on a défini une fonction qui s'appelle la fonction de distribution comme cumulative fonctions de distribution qui met cumulative qu'on note comme ça fdc c'est moi qui la nôtre comme ça et en fait cette fonction de distribution cumulative elle va donner la probabilité d'avoir une valve à une valeur inférieure à cette valeur x qu'on donne ici donc si je fixe x par exemple ici et bien la fonction de distribution cumulative appliquée en xl va nous donner elle va nous calculé finale en fait l'ère de la portion de planquer compris sous la courbe pour les valeurs inférieures à notre valeur x qui est ici donc en fait elle va calcul r je peux l'écrire comme ça si tu connais le calcul intégral ça va être l'intégrale de moins l'infini donc toutes les valeurs inférieures à x jusqu'à la valeur x de la faune de la fonction densité de probabilités donc p or là je vais changer de nom pour la variable la variable d'intégration un pde tdt voilà ça c'est ce qu'on appelle la fonction de distribution cumulative on va voir un peu plus on va continuer à l'étudier après et en fait quand on est avec un tableur canton veut faire appel à la loi de la loi normale on a cette fonction là on tape loi points normal ensuite entre parenthèses on donne d'abord cette valeur x ensuite on donne la moyenne mais ensuite on donne l'écart type l'écart type sigma et puis ensuite on donne une valeur logique qui sera vrai ou faux alors si on si on met ici vrai et bien donc si j'écris vrai mais en fait je vais tracé cette fonction de distribution cumulatives si je mets faut à ce moment là je vais tracé la courbe total delà de la loi normale la cour complète de la loi normale si je veux traceur je répète si je veut tracer cette courbe lala ici celle que j'ai tracée ici là il faut que je mette faux seins faux et si je mets vrai je vais être assez la fonction de distribution cumulatif c'est ce que j'ai fait plus bas alors je vais je vais enlever l'outil stylo voilà j'ai même enlever toutes les écritures donc je vais aller regarder maintenant plus bas parce que c'est ce que c'est là où j'ai tracé la fonction de distribution de distribution au cumulatif pardon voilà qui est ici alors ça ici c'est la fonction de distribution cumulative lac est tracée en bleu violet là et on au dessus on à la loi normale la normale qui est ici donc par exemple on va voir comment ça marche si on veut se demande si on se demande par exemple quelle est la probabilité d'avoir une valeur inférieure à 20 ici donc ça veut dire que hausse autorise à prendre toutes les valeurs qui sont plus petites que vingt ici donc quand on qu'en fait-on ça reviendrait à calculer tout l'air sous la courbe à partir de ce point en partant vers la vers la gauche vers les valeurs inférieures à partir de la valeur 20 et puis si on regarde maintenant le la courbe de la fonction de distribution cumulative qu'est ce qu'on voit la valeur vin est ici et on voit que la probabilité que la valeur x soit inférieure à 20 elle est pratiquement 100% et que c'est effectivement on serait cohérent avec ce qu'on a vu au dessus puisque ici on a pratiquement toute la courbe en fait un tout l'air qui est situé sous la courbe près ce qu'il en reste effectivement un petit peu après on peut prolonger ça il restera une mère sous la courbe mais très très très très faible ce qui fait qu effectivement c'est cohérent avec ce que dit ce graphe ici on a une probabilité de près de 100% d'avoir une valeur inférieure afin alors si on se dit par exemple quelle est la probabilité d'avoir une valeur inférieure à -6 par exemple alors -6 c'était notre moyenne je reviens là haut cette distribution là elle avait moyenne de - 6 donc là en fait ça revient à se demander quelle est la probabilité que d'avoir une valeur inférieure à la moyenne et bien finalement cette probabilité on peut la lire ici puisque là c'est la moyenne qui représentez ici ça c'est la moyenne donc sur cette courbe pour lire la probabilité d'avoir une valeur inférieure à la moyenne il faut lire l'ordonné de ce point là qui est effectivement 50% là c'est pas si clair que ça mais je pense que si on voyait les données ce sera exactement 50 % et c'est cohérent avec le fait que la cour de symétrique par rapport à sa moyenne la courbe de la loi normale ici la courbe en cloche elle est symétrique par rapport à cette valeur là qu'est la moyenne alors maintenant comment est-ce qu'on a calculé tout à l'heure qu est ce qu est ce qu a fait le tableur pour calculer cette probabilité d'avoir une valeur comprise entre -0 5 et 0 points 5 5 on va essayer de voir maintenant donc je vais reprendre l'outil crayon alors ce qu'on va faire c'est d'abord calculer la probabilité que x soit inférieures à - 0 5 tout ça je vais noter ici moins 0,5 et donc ce qu'on peut faire c'est calculé la valeur de la fonction de distribution cumulative comme ça qui va donner donc ça c'est la valeur de la fonction de distribution commune cumulative calculé en moins 0,5 voilà c'est cette ça va nous donner l'air de cette surface l'a compris sous la courbe jusqu'à la valeur x égales - 0.5 et puis ensuite je vais faire alors je vais changer de couleur donc ensuite ce que je vais faire c'est calculé la valeur ici donc ça c'est 0.5 je vais calculer la valeur de la fonction distribution cumulative pour 0.5 pour rixes et gagnent 0,5 donc je vais calculé ça la fameuse la fonction de distribution cumulative en 0.5 ce qui va me donner toutes ces terres là qui est comprise sous la courbe jusqu'à la valeur x et gagne 0.5 et en fait ce qui se passe ce qui est important c'est que là on voit que nous ce qu'on cherche à déterminer calculer c'est cette partie qui est ici un cette partie qui est là que j'achète plus petit plus fin et bien cette ces terres qui est là je vais à noter comme ça on peut calculer on peut la calculer en disant que c'est la fonction de distribution cumulative appliquée en 0.5 donc toutes ces terres là - celle que j'ai assuré en jaune ici c'est à dire - la wla la valeur de la fonction de distribution au cumulatif calculé en moins 0.5 voilà c'est exactement ce que fait le tad le tableur il calcule la leyre de cette surface là que j'ai assuré en orange et il s'est soustrait l'air de la surface là que j'ai assuré en jaune donc ça ça donne effectivement la probabilité que la variable soit compris entre -0 5 et donc la variable x soit compris entre 20 mois 0,5 et 0,5 voilà donc je reprends un peu ce que j'ai fait je vais regarder je vais traduire ce que j'ai fait sur l'autre graphique celui qui donne la fonction de distribution cumulatives en fait j'ai là dessus sur ce graphique j'ai évalué déjà alors pour 0,5 et qui est moins 0.5 pardon qui est ici j'ai trouvé la valeur de la fonction de distribution au cumulatif avec le tableur et puis j'ai fait la même chose donc c'est cette valeur qui est ici je peux la reporter la saa cf dix décès de moins 0,5 et puis ensuite j'ai calculé la même chose pour 0.5 et l'a donc là j'ai trouvé la valeur de la fonction de distribution de cumulative en x et gagnent 0,5 c'est celle là donc ça cfdc de 0.5 et ensuite j'ai calculé la différence fdc de 0.5 - fdc de -0 5 c'est à dire que j'ai calculé cette distance là en fait et cette distance à elle représente exactement l'air que j'ai quelques que j'ai assuré ici donc là on retrouve exactement le même résultat de cette distance là en fait c'est la mesure 2 r ici sous la courbe en cloche comprise entre les valeurs - 0 25 et 0 25 moi je te je t'encourage à vraiment à jouer avec ce tableur qui est fait ici à regarder ce qui se passe quand tu changes les variables et ainsi de suite vraiment à manipuler ce tableur alors il ya une autre chose qu'on peut regarder maintenant avec ce tableur c'est qui est assez intéressante c'est de regarder quelle est la probabilité de se trouver à une distance d'un écart type de la moyenne que la probabilité donc d'avoir une valeur qui s'écarte de un écart type de la moyenne donc en fait alors ici un ce que j'avais dit à l'ats cette droite qui est ici c'est c'est la moyenne ici on a une moyenne de la moyenne ici c'est moins six c'est ce qui est noté ici donc elle est représentée par cette droite verticale ici ça ça représente la moyenne et les deux droites qui sont représentés là ce sont les écarts types enfin c'est sa marque une distance de un écart-type par rapport à la moyenne donc cette distance là qui est là c'est une distance d'un écart type sigma d'ailleurs on peut le vérifier puisque l'écart type i 6 et 10 et quand on fait moins 6 + 10 ans va se retrouver ici qu'ils étaient 4 1 c'est sa c4 ici et puis de la même manière cette distance là c'est aussi un écart-type voilà et là on trouve ici effectivement - 5 - disque ce qui fait moins 6 par dont -10 ça fait moins 16 donc ici c'est bien moins 16 on est bien la moyenne - écart type alors là ce qui est intéressant c'est d'arriver à calculer la probabilité de se trouver à moins d'un écart type de la moyenne c'est à dire de se trouvait en fait dans cette partie ici dans toute cette partie là alors ça je peux le faire je vais enlever le l'outil crayon voilà donc pour calculer cette probabilité a donc ce que je disais à la probabilité de se trouver entre - 11 14 - 16 ici et 4 correspond à un intervalle centre est dans la moyenne et d'amplitude 2,2 fois là l'écart type on va pouvoir le calculer avec avec le tableur donc ici si je veux la probabilité d'être à un écart type de la moyenne ça va être ici - se mettre moins 16 ce que je disais tout à l'heure et ici je vais mettre 4 1 ça ça va être la moyenne plus l'écart type c'est à dire moins six plus d'isf et 4 alors je peux calculer ça et je trouve cette valeur là 68 3% alors ce qui est très intéressant et d'une certaine manière assez étonnant aussi c'est que ce sera toujours le cas dans le si on a une si on a affaire à une distribution normale à une loi normale en fait on aura toujours une probabilité de 60 8 3% de s'écarter de moins d'un écart type de la moyenne alors ça ça veut dire que en fait quand on a affaire à une loi normale on a toujours dans tous les cas chaque fois qu'on a une loi normale quels que soient les paramètres de cette norme de cette loi normale on va toujours 68 3 % de chances que la variable et prennent une valeur entre comprise entre la moyenne - l'écart type et la moyenne plus l'écart type donc en fait ça veut dire que cette cette surface qui est là sous la courbe entre la valeur ici la moyenne - l'écart type et la moyenne plus les cartes id c'est toujours 68 3 % 68 3% à 7 un résultat vraiment intéressant et on peut vérifier ça situe si tu changes les paramètres la moyenne l'écart type et si tu calcules la probabilité que la variable soit comprise entre la moyenne - l'écart type et la moyenne plus l'écart type tu trouveras toujours cette valeur-là de 68 3% alors cette surface la leyre de cette surface là on la calcule avec la fonction de distribution que mieux cumulative comme on a vu déjà dans d'autres cas je veux descendre un peu voilà en fait ce qu'on fait c'est déjà calculer alors ici c'est la moyenne - 6 quand je fais moins six plus notre écart type qui étaient dix je me retrouve ici à -4 à +4 pardon et je dois évaluer la fonction distribution cumulative dans ce point-ci donc c'est à peu près à peu près ça un 10 on évalue la valeur de la fonction de distribution comme cumulatives au point 4 ce me donnent bon quelques chats proxim hâtivement 80 85 84 % à peu près et puis maintenant je vais évaluer la fonction distribution cumulative en -16 puisque la moyenne s'était - 6 - l'écart type disent donc là je fais je vais évaluer la fonction distribution cumulative en la moyenne - l'écart type donc ça me fait moins 16 qui va se trouver à peu près ici c'est 17 et demi donc 16 - 16 c'est là donc je vais avoir voilà sept cette valeur ici un but qui vaut à peu près bon c 17 17 18% à peu près voilà et ce qui est intéressant c'est que quand je fais 7,7 cette soustraction là en fait je fais la différence entre cette valeur 6 et 7 valeurs si donc cette valeur si - cette valeur si ça me donne cette distance là en fait alors quand je calcule la fonction distribution cumulative au point 4 ici ça revient à calculer l'air de toute la courbe ici qui est de toute la portion de plans pardon qui est sous la courbe jusqu'à la valeur 4 1 qu'est la voilà et ensuite quand je calcule la fin de la valeur de la fonction distribution cumulative en moins 16 eh bien je trouve en fait l'ère de la courbe qui est ici un continuer la courbe comme ça donc là je vais trouver finalement l'air de cette partie là du plan voilà et donc effectivement quand je prends tout l'air la fonction distribution cumulative calculé en cas en 4 ici c'est tout cet air là et quand je relève ce bout qui est ici cette portion de plans qui est ici bien je trouve effectivement cette cette surface là et ce qui est ce qui est intéressant est ce dont il faut se souvenir c'est que cette proportion là c'est toujours quels que soient les paramètres de la loi normale c'est toujours 68 3% si on a une loi normale dire suivante alors je t'engage vraiment à jouer avec ce tableur inchangé les valeurs à voir ce qui se passe quand par exemple si je là je vais déplacer la moyenne je vais là des placeurs qu'est ce que c'est que ça voilà je déplace la moyenne 5 par exemple laissent l'écart type le faire et la voilà la courbe c'est exactement la même elle est juste des cas les déplacer décaler vers la droite centré autour de 5 et ce qui va être important c'est que l'air qui est ici comprise entre les deux droites bleus qui marque l'écart type eh bien ça va être 68 % de toute façon donc soit tu pourra le vérifier encore en calculant ici les probabilités donc de que la variable soit comprise entre la moyenne - l'écart type et la moyenne plus l'écart type on va le faire ici donc la moyenne - l'écart type ça va faire ici la moyenne de ces cinq et l'écart type c 10 donc ça va faire moins 5 la moyenne plus l'écart type ça fait 15 et là je retrouve encore cette valeur de 68 3% voilà on peut on peut prendre maintenant un écart type beaucoup plus petits pour voir ce qui se passe donc je vais prendre par exemple un écart type 2 2 alors on a une courbe qui est beaucoup plus resserré autour de sa valeur moyenne et si je prends la probabilité de l'âme que la variable soit comprise entre la moyenne - l'écart type ce alors la moyenne - les quartiers ça va faire cinq - 3 5 - 2 ça fait 3 et la moyenne plus l'écart type ça fait 5 + 2 ça fait c'est là je retrouve encore 68 3% c'est intéressant parce que là on voit que le dessin est complètement différent et malgré sa dent alors je vais prendre l'outil crayon ce qui est ici là cette partie là donc c'est toute la partie qui est sous la courbe comme ca comprise entre cette droite là qui marque la moyenne - l'écart type et cette droite là qui marque la moyenne plus l'écart type toute cette surface qui est ici que je hachures en violet ça c'est encore une fois 68 3% des données donc la probabilité de 68 3% alors maintenant je vais te montrer un peu comment comment j'ai construit stabler tu peux aller regarder toi-même toutes les formules qui sont saisis dans les dents les dans les sites dans les cellules et puis même virtuellement entend reconstruire un du même type alors ici ce que j'ai fait dans ce tableau là en fait j'ai juste j'ai pris des valeurs de de la variable x qui vont de la de -20 je les ai prises qui vont de moins 20 jusqu'à j'aurais pu faire plus et en fait j'ai juste incrémenté la variable de 1 c'est à dire que là j'ai moins - 20 - 19 - 18 à chaque fois j'ai fait plus un sou c'est moi qui ai choisi de faire ça j'aurais pu prendre incrémenté de 0.5 ou en fait du coulage et une courbe qui est pas vraiment lissens est décédé des points que j'ai relié par des segments de droite en des segments de courbe mais bon comme c'est assez grand ça se voit pas trop je vais reprendre pour qu'on voit mieux je vais prendre un écart type plus grand ça sera plus plus visuel voilà donc donc c'est ce que j'ai fait là j'ai donc la variable alors ici j'ai calculé la valeur de la variable - la moyenne pour ça qu ici dans la formule on a b vite qui est cette salle cette cellule à cette valeur là qui est contenu dans cette cellule est moins la valeur ces trois que j'ai indiquées avec des dollars pour montrer que c'est cette cellule a que je me réfère à chaque fois donc j'ai copié cette formule partout là sur toute la colonne ici j'ai divisé par l'écart type donc là je peux l'écrire voilà c'est donc ces huit la case c8 c'est à dire la différence entre la valeur de la variable - la moyenne / l'écart type qui est là voilà et ensuite j'ai calculé à chaque fois la fonction distribution qui me cumulative je peux voilà alors cette expression là ces lois normales ici j'ai noté le paramètre b8 qui est donc la valeur de la variable là j'ai noté la variable la mode la moyenne pardon ici l'écart type et puis la gemmi vrai pour que effectivement ça me donne la fonction de distribution cumulative et non pas la loi normale elle même donc ça c'est comme ça c'est ce que j'ai fait dans cette cellule depuis l'ag calculer la densité de probabilités pour cette valeur là 2 x donc c'est avec l'expression qu'on avait donné tout à l'heure un peu transformés voilà je t'aime tu peux aller regarder ça de ton côté alors maintenant ce qui est intéressant c'est de voir ce que je comment j'ai fait pour calculer cette probabilité qui est ici un an fait là j'ai tout simplement calculer la valeur de la fonction distribution cumulative pour x égal 7 - la valeur de la distribution preuve de la fonction de distribution cumulative pour 3 pour la valeur 3 1 que le donner ici est donc la différence ça me donne effectivement le pourcentage de valeur qui sont comprises entre 3 et 7 donc la probabilité que lavalin que la variable soit comprise entre 3 et 7 donc l'air sous la courbe située entre la valeur 3 et la valeur cette voie là donc bon tu te laisse manipuler on va de toute façon reprendre des feuilles de calcul de ce genre là dans d'autres exercices parce que c'est vraiment utile il ya des tas de situations pour lesquelles on aura besoin de ce genre de choses et je t'engage à regarder bien ce que j'ai fait ici essayer d'en faire de ton côté éventuellement de faire des feuilles de calcul autre différente de ton côté voilà et on va j'espère que ça te fera bien aidé à comprendre ce que c'est qu'une loi normale et puis on se retrouve dans la prochaine vidéo