If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

D'autres formules de la variance

La formule de la variance est V= ( Σ (x-μ)² ) / N. On démontre que V= ( (Σ x²) / N ) - μ². Cette formule est plus simple à appliquer si on calcule la variance à la main. Créé par Sal Khan.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

dans cette vidéo on va jouer un petit peu avec la formule de la variance ça va être d'utile d'abord parce que ça va nous donner une autre formule pour calculer cette variante puis ensuite ça va être aussi très utile parce que on va se familiariser on va s'entraîner un petit peu a utilisé cette notation en somme avec le symbole sigle à la skis et ski sera pas une mauvaise chose alors je vais commencer par rappeler ce qu'on avait comment on avait défini la variance donc on va parler d'une population donc là je veille à noter comme ça sigma au carré alors ce qu'on avait fait c'est qu'on avait d'abord commencé par prendre chaque donnée meuse donc chaque donnée x y mesurer son écart par rapport à la moyenne donc c'était x/y - but on avait élevé cet écart aux carrés et puis ensuite on avait calculé la moyenne de toutes ces de tous ces écarts élevée au carré donc en fait on avait fait la somme déjà la somme de tous et toutes ses distances au carré donc c'était la somme pour ikea les de la première donnée jusqu'à la dernière alors ici on va de supposer que comme c'est une population on a grand thème donné et puis ensuite on a divisé tout ça par grands thèmes qui est le nombre de données voilà donc si on faisait ça sur un échantillon frais à peu près la même chose sauf que dans certains cas il faudrait plutôt prendre la variance corrigé donc divisé ici par rennes - enfin bon pour l'instant ça ne va pas du tout s'occuper de ça ce qu'on va faire c'est essayer de transformer cette formule alors je vais m'occuper d'abord du numérateur donc je vais déjà développé cette partie là cette partie là alors je vais l'écrire ici je peux cx i - mu x x y - mur ça ça sera je fais ça pour tous les termes xxi alors c'est une identité remarquable il suffit de développer ça donc j'ai x il faut x6 assez x y au carré ensuite j'ai - mu fois xxi ici là et puis j'ai xxi fois moins mis d'accord tout j'ai moins de mu x y voilà enfin j'ai le dernier produit moins 1000 fois moins mu c'est à dire plus mu au carré donc finalement cette somme le numérateur qui est là je vais leur aide de cette manière là le numérateur la somme qui va de i égal 1 jusqu'à n 2 x 6 mois mu au carré baer je vais l'écrire comme ça c'est la somme alors je vais respecter les couleurs qui va de y égale un jusqu'à illégal n 2 alors dans la parenthèse au lieu d'écrire xxi mois muet au carré je vais remplacer pas ressasser x/y au carré - deux nus x x y plus mû au carré alors voilà là il c'est le premier paquet qui est peut-être un petit peu compliqué quand on n'a pas l'habitude de manipuler cette notation l'a en fait là ce qu'on fait c'est additionner ce terme là pour y égale un plus le même terme pour illégal deux plus le même terme pour y égal 3 et ainsi de suite en fait on voit qu'on peut réorganiser les données complètement et en fait on peut faire sorte séparer les termes de sommation donc on va écrire ça comme ça c'est la somme pourri égal 1 de ce terme là x y au carré plus la somme pourri égal 1 alors j'ai oublié il va de 1 à n à chaque fois de alors ici on a moins deux mille fois xxi donc on va l'écrire comme ça - de mu x x y plus la somme pourri qui va de 1 jusqu'à petites haines aussi alors je me suis trompé c'est des grands ten partout donc là c'est des grands thèmes voilà de la somme de mieux au carré alors bon et qu'est-ce qu'on peut faire quelque chose avec ces termes là le premier qui est la somme des égale 1 1 jusqu'à grands thèmes des xxi au carré je vois pas très bien ce qu'on peut faire par contre ici là pour la somme de est égale 1 1 jusqu'à grant n2 - devenu x x y là on peut faire quelque chose d'intéressant parce qu'en fait là on va avoir moins de mu x x un plus - de mu x x 2 plus - de mu x x 3 puces ainsi de suite jusqu'à moins de mu x x grant n est en fait on peut mettre en facteur moins de mu donc ça là cette partie là je vais changer de couleur cette partie là ici on va pouvoir l'écrire com - 2 on va pouvoir mettre en facteurs - demuth donc c'est moins de mu fois la somme de illégal 1 jusqu'à grant ndx y voilà et puis ici on peut aussi faire quelque chose je vais prendre aussi une autre couleur salah en fait c'est mieux car est plus mieux car est plus lus au carré plus mieux car et il y aura en tout un terme donc finalement ici ça c'est directement n fois muet aux carrières c'est comme si en fait on l'avait écrit de cette manière là hein c'est mieux car et on aurait mis un facteur mieux au carré là dedans puisque c'est mieux car est plus mieux car est plus mieux car et ainsi de suite et on aurait eu la somme de i égal à 1 jusqu'à grant n21 ici puisque à chaque fois on aurait mis un facteur mieux au carré il aurait resté 1 donc on aurait eu une somme de un plus un plus un plus un une fois donc on aurait effectivement finalement une fois eu aux caresses à 7 cette quantité la cette somme là ça fait m voilà donc finalement notre notre numérateur qui est ici on va l'écrire comme ça alors je vais pour reprendre la couleur bleue on va l'écrire comme ça c'est la somme pourri qui va de 1 jusqu'à grant n 2 x idée xxi au carré - deux mille fois la somme des xxi pourri qui va de 1 jusqu à grand peine plus n fois muet au carré alors là on peut voir quelque chose d'autre je vais faire en blanc là cette partie là cette partie là qu est ce que c est ce que on peut la relier à la moyenne celle là puisqu'on avait vu que mu c'était la somme des x y puri qui va de 1 jusqu'à grant n / grands thèmes c'est comme ça qu'on avait défini la moyenne mue donc finalement ça ça veut dire que la somme pourri qui va de 1 jusqu'à grant end si je multiplie tout par n je vais avoir cette expression la somme qui va sommes dxy pourri qui va de 1 jusqu'à n est bien cn fois la moyenne mue donc ça ici ces grands ten fois la moyenne mue donc ça ça nous permet de continuer encore on va réécrire ce premier terme pour lequel je vois pas très bien ce qu'on peut changer donc c'est la somme pourri qui va de 1 jusqu'à ndx y au carré et puis là on va avoir moins de mu fois n fois mis donc en fait on va avoir moins alors je vais l'écrire en blanc ce sera plus clair je vais garder ses couleurs - 2 alors il va y avoir mué fois mis donc c'est à dire muet au carré fois n plus là je reprends le bleu plus n fois mieux au carré alors là je peux évidemment simplifiée salage et moins de mu au carré fois n + n fois mieux au carré donc ça je peux les rassembler ces termes là ça me donne là j'ai moins de -2 n mieux au carré la gn mieux au carré d'enfants touchés - n mu au carré voilà donc là on a quand même fait un grand pas parce que maintenant je vais alors je vais pas tout en haut je vais pas trop monter pour garder la formule de la variance donc je vais la ré écrire ici la variance du coup c'est sigma au carré alors c'est cette ce numéro à tort là qu'on m'a écrit de cette manière là donc ça je vais garder ses couleurs c'est la somme pourri qui va de 1 jusqu'à grand mdx au carré - n fois muet au carré le tout divisé par grant n alors j'ai simplifié je vais descendre un petit peu donc cette partie là qui est ici ça je vais lire et écrire c'est sommes pourris qui va de 1 jusqu'à grant ndx y au carré le tout divisé par grant n et puis cette partie là prendre un violet cette partie là c'est moins n mieux au carré / n donc en fait ça fait moins mu au carré voilà donc j'obtiens une nouvelle formule de la variance de la réécrire propre nom à côté ça sera plus joli en orange donc la variance on peut la calculer aussi de cette manière là c'est la somme des x i o car est pourri qui va de 1 jusqu'à grant n le tout divisé par grant n - la moyenne élevée au carré donc voilà une autre formule de la variance qui est bien utile alors pour pour s'en servir on calcule d'abord le carré de chaque de chaque nom de chaque donnée on fait la somme de tous ces carrés donc on fait la moyenne des carrés des données c'est exactement ça et on soustrait le carré de la moyenne donc c'est la moyenne des carrés des données - la moyenne au carré c'est une formule qui est assez utile un parfois elle est beaucoup plus rapide à utiliser que là que la formule à partir de laquelle on a défini la variance c'est une formule qui est bien pratique mais la première donne quand même plus l'intuition de ce que représente cette variante alors il ya une autre un autre aspect qui est intéressant c'est que en général bon quand on regarde cette formule et l'autre aussi on peut calculer cette variance après avoir calculé la moyenne alors qu'avec cette celles-ci on peut faire différemment puisque si on regarde la moyenne on avait vu que c'était je vais écrites ici ça c'est la moyenne ça la moyenne mue donc en fait si j'écris mu au carré mieux au carré je vais pouvoir l'écrire comme ça c'est la somme de illégal un juste et xi2 égale 1 1 jusqu'à grant n1 dxy pardon élevée au carré / grand tête au carré donc finalement on peut calculer là on peut exprimer la variance de cette manière là c'est la somme de y égal à 1 jusqu à grand-peine dxy au carré / grand taisne - alors la somme des x10 pourri qui va de 1 jusqu à grand peine cette somme-là élevée au carré / trentaine au carré alors ça c'est intéressant bon c'est en général on calcule quand même la moyenne quand on a une distribution statistique mais on n'est pas obligé avec cette formule là on peut d'abord calculer la somme de toutes les données calculer la somme des carrés de toutes les données et puis avec cette formule on calcule directement la variance sans avoir effectivement calculer la moyenne voilà bon l'intérêt de cette vidéo c'était non seulement de donner cette cette formule cette nouvelle formule pour la variance mais c'était surtout de pouvoir pratiquer un peu manipulé un petit peu ccc notation avec ses notations de sommes qui sont quand même très utile et avec lesquels vraiment c'est important d'arriver à travailler