If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Construire un diagramme en boite

Ici, un problème concret où un diagramme en boîte permet d'analyser les données. Prêt pour le construire ? Créés par Sal Khan et Monterey Institute for Technology and Education.

Vous souhaitez rejoindre la discussion ?

  • blobby green style l'avatar de l’utilisateur g G
    Le Q1 n'est-il pas plutôt 3 et le Q3: 11 ? Sur les 2 calculatrices je trouve Q1:3 et Q.
    (1 vote)
    Default Khan Academy avatar l'avatar de l’utilisateur
    • blobby green style l'avatar de l’utilisateur Marie-Gabrielle Denizet
      Hélas, il y un grand flou autour de la définition des quartiles…
      Vous pouvez vérifier vous-même que selon le livre, selon le site, selon la calculatrice ou selon le tableur que vous consultez, vous n’obtiendrez pas les mêmes résultats.
      La définition utilisée en France pour Q1 est :
      la plus petite valeur du caractère étudié telle que 25% (un quart !) de la population ait un caractère dont la valeur est inférieure ou égale à ce premier quartile.
      La définition utilisée aux Etats-Unis pour Q1 est :
      la médiane de la série des valeurs inférieures à la médiane.
      En France Q1 est l'une des valeurs de la série, aux Etats-Unis, Q1 peut ne pas être l'une des valeurs de la série.
      Il faut le savoir, mais il ne faut pas en déduire que cette notion ne tient pas la route. En effet si pour faire découvrir la notion de quartiles, on utilise des séries de petits effectifs, en réalité cette notion n’a de sens précis que pour une série dont l’effectif est élevé et dans ce cas-là la différence entre les résultats est négligeable.
      (1 vote)
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

le propriétaire d'un restaurant souhaitent en savoir plus sur les zones d'où viennent ses clients il décide d'enquêter sur la distance parcourue par sa clientèle pour venir à son restaurant les données recueillies sont les suivantes alors on a toute ses nombreux là en fait ça c'est de ce doit être des kilomètres j'imagine c'est pas des maîtres plutôt des kilomètres qui représente la distance que chaque personne interrogée à parcours pour aller à son restaurant alors il veut ensuite faire un schéma qui l'aidera à comprendre la dispersion des distances la dispersion des distances ça c'est vraiment le mot clé un qui est important est la distance médiane la distance médiane donc ça assez on sait ce que ça veut dire mais le mot de dispersion est vraiment un mot-clé important ici aig quel type de diagrammes devrait-il tracé bombe à cette réponse là elle est assez clair évidemment il doit tracer un diagramme en boîte à moustache bon là on va pas se satisfaire de cette réponse on va on va essayer de le tracer ce diagramme alors déjà on va commencer par déterminer la médiane de cette série alors donc je vais commencer par chercher la plus petite de ces valeurs dont 14 6 3 2 4 1 alors lay lay à ce1 donc ce 1 c'est la plus petite données voilà ensuite on avait vu qu'il y avait eu deux dents car est ce qui est un autre 2 way à 2 2 donc je vais les mettre comme ça 2 2 ensuite il ya 1,3 n'y a pas d'autres deux noms et 1,3 est ce qu'il ya un autre 3 où il ya un autre 3 ici donc on va avoir 1 3 et puis 1-3 ensuite 14,6 à l'orias ce 4 qui est là est ce qu'il ya un autre 4 oui il ya un autre quatre là donc je vais avoir un 4 1 4 ensuite y'a pas de 5 je crois pas n'y a pas de 5 donc il ya après 6 1 6 1 6 6 6 a pas d'autres si ça je crois non ensuite skis un set williams est là donc 1,7 il ya un seul set je pense oui il ya 1,8 donc prendre 1 8 est ce qu'il ya un oeuf non il n'ya pas de 9 alors aprilia indices par contre ça je le bar vingt dix il ya onze voilà voilà 11 est ce qu'il ya un 12 ya pas de 12 il n'y a pas de 13 non plus par contient 14 14 et 1 15 15 il skie 1,16 n'y a pas de 16 après à est par contre il ya ce 1 là que j'avais oublié j'ai pas barré il y avait un ici donc il y avait 2 1 donc je vais le rajouter là que c'est pas une valeur du milieu ça aurait été plus compliqué à écrire alors ensuite je donc ce 1 le bar a ensuite j'ai un vin et puis 1 22 donc j'ai 20 et 22 alors maintenant pour que pour des pour trouver la médiane de cette série de données et non ce qu'il faut faire dont la médiane c'est la valeur qui va partager les données en deux dans deux ensembles de même nombre de même cardinal c'est à dire qu' il va y avoir autant de données avant la médiane plus petite que la médiane et que de donner plus grande que la médiane alors je vais commencer par d'état par compter combien il ya de valeur une 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 et 17 valeurs donc la médiane elle va partager il va y avoir huit valeurs plus petites que la médiane et 8 valeurs plus grande que la médiane donc je vais compter huit valeurs à partir de là plus petite et ensuite la 9e ça sera la médiane alors là il ya 1 2 3 4 5 6 7 8 8 donc ici on a huit donc le 6 qui est là ça c'est la médiane normalement si j'ai bien compté on doit en mal donc huit valeurs ici plus petite que la médiane et doit y en avoir huit plus grandes que la médiane 1 2 3 4 5 6 7 8 voilà ça ça marche donc ici le 6 qui est là c'est bien la médiane de la série de la série de données qui est là alors ça ça va être un des premiers éléments de la de la boîte à moustache ensuite ce qu'il faut dans une boîte à moustache on doit voir l'étendue donc la plus grande valeur la plus petite valeur donc ici ça c'est la plus petite valeur et ça c'est la plus grande valeur et puis la médiane convient de trouver et on doit aussi trouver le premier quartier d'el troisième carte il alors le premier kart il sait la valeur qui va partager la populaire la série de données en deux parties une qui va être 25 2 25% un quart des données et la deuxième partie trois quarts des données et pour le troisième quart titre ça va être inverse il va y avoir trois quarts des données qui vont être plus petit que le troisième carte il est un quart qui vont être plus grande que le deuxième que le troisième carte il pardon est en fait pour faire ça le plus simple c'est de se dire que le premier kart il sait la médiane de cette série de données qui est là je vais essayer maintenant de prendre cette série de données là de trouver la médiane de cette série de données donc si je trouve la médiane de cette série qui est ici en fait jean lève la médiane j'enlève la médiane de notre série de données donc j'ai deux séries plus petite celle là est celle là et la médiane de cette petite c2 cette série extrait ici ça va être le premier quart d'heure est la médiane de cette série là que la série supérieure disons ça va être le troisième carte il alors je vais essayer de calculer la médiane de 7,2 cette série-là donc le premier kart il alors là il ya huit donnait donc comme il ya huit données ya pas de valeur médiane précisément dans les données par contre on va prendre la moyenne arithmétique des deux valeurs centrales de valeur du milieu de ce2 et ce trois quand on regarde ces deux valeurs là effectivement il ya trois valeurs plus petites et 3 à leurs plus grandes on va prendre la moyenne arithmétique de ces deux valeurs là donc c'est le milieu s'est de plus 3 / 2 ça ça fait deux points 5 et ça c'est le premier kart il qu un voilà et de la même manière je vais calculer la médiane de cette deuxième série qui est ici et comme elle a huit valeurs on est exactement dans le même cas il ya huit valeurs aussi donc c'est forcément on a cédé ces deux valeurs du milieu et il va falloir calculer la moyenne arithmétique donc la moyenne arithmétique ses 11 plus 14 / 2 onces +14 ça fait vingt-cinq 25 / 2 ça fait 12,5 donc ça c'est 12,5 c'est le troisième carte il q3 voilà alors ensuite on avait vu qu' il y avait les deux valeurs extrêmes 1 et 22 donc l'étendue on peut calculer l'étendue l'étendue ses 22 la plus grande valeur - la plus petite valeur ses 22 - 1 donc ça fait 21 alors maintenant on va tracer cette boîte à moustache alors tous très souvent l'effet horizontalement on peut très bien les faire à la verticale d'ailleurs c'est ce que je vais faire ici alors vous pouvez tracer une échelle donc voilà et là du coup je vais noté alors on va partir de zéro en bas par exemple ici et puis alors les deux les plus la plus grande des données ses 22 donc on va dire que ça c'est 10 et ça c'est 20 voilà donc ça c'est 5 10 15 20 donc si je continue un peu ici j'ai il faut que j'aille jusqu'à 22 donc ça c'est 25 22 sél a à peu près voilà maintenant je vais me servir de cette échelle pour placer toutes les valeurs que j'ai déterminé ici donc il ya d'abord je prendre la plus petite valeur je la mettre en verre c'est un don qui si c'est ça c'est 2,5 donc sa c2 voilà un ça à peu près ici c'est à peu près ici donc là j'ai la plus petite valeur donc ça va être l'extrémité de la moustache du bas voilà et je vais placer la plus grande valeur qui est 22e j'avais déjà placé donc là ça ça me donne l'extrémité de la moustache duo 1 c'est pour ça que très souvent on l'a mais plutôt à l'horizontale ce que ça ressemble plus à une boîte à moustache du coup là alors que la verticale ça fait pas exactement le même effet mais bon c'est exactement la même chose donc ce que je sais en tout cas c'est que mes valeurs elles vont se répartir entre cette valeur là et cette valeur là donc je vais faire je vais le faire proprement voilà je fais un prêt droit je vais placer les trois autres indications que j'ai laissé à dire les deux quartile et la médiane alors le premier quartile en bleu ces 2,5 donc 2.5 c'est ici donc ça c'est qu un q1 qui est ici et puis la médiane alors j'avais utilisé du viol et la médiane c6 donc ça c'est 7,5 set et l'a donc 6 à peu près l'un ça c'est la médiane pour la note souvent m me voilà ensuite le dernier c'est le troisième quart thil qui lui est égal à 12.5 donc 12,5 c'est entre 15 et le milieu de 15 et 10 donc c'est là à peu près voilà donc on à q3 alors ici entre ces deux valeurs q3 est qu un c'est ce qu'on veut ce qu'on représente par une boîte donc je vais le représenter je vais représenter la boîte ici voilà donc ça finalement ce que la boîte ici en fait elles représentent ces données la 1c les données qui sont situés entre le premier et le troisième carte il donc c'est ces données là c'est ça qu'on représente par une boîte alors je vais je vais assurer à la boîte ça c'est la boîte donc ça représente 50% des données en anglais à 50% des données qui sont là la médiane c'est ce qui va couper partager les données en deux parties de même effectif de même où il y aura autant de données donc ça ça donne une bonne idée graphiquement on voit tout de suite comment sont répartis les données autour de la médiane il y en a une certaine un certain nombre qui sont ici entre le premier et le troisième carte il ça ça fait cinquante pour cent des données puis en a d'autres qui sont plus loin qui ça c'est ce qui est donné par l'étendue donc parler d'eux moustache de la boîte à moustache voilà c'est vraiment un outil visuel pour représenter la dispersion des données autour de la médiane