If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Représentation graphique des données

Voici quelques méthodes pour observer des séries de données. Laquelle préférez-vous ?

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

bonjour dans cette vidéo on va passer en revue un certain nombre de manière de représenter des données alors ici j'ai des données je prends un exemple assez simple avec peu de données en fait on a ces cinq personnes qui ont regardé un film et puis à la suite de ce film on leur a soumis un questionnaire à choix multiples avec 100 questions et donc les nombres qui sont là représentent en fait le nombre de bonnes réponses qu'on donnait chacune de ces personnes ces données ici ce sont des nombres le score obtenu au qcm et ce type de données c'est ce qu'on appelle des données quantitatives puisqu'elles sont représentés par des nombres mais on aurait pu avoir des données complètement différente par exemple on aurait pu avoir des données qui représentent l'opinion des personnes interrogées sur le film qui viennent de voir où vraiment des tas d'autres choses les données peuvent être de nature très différente donc je vais pas trop parler de ça ici dans cette vidéo ce qu'on va faire c'est représenter ces données de plusieurs manières qui peuvent être utiles alors la première façon de faire c'est de représenter les données dans un tableau qui pratiquement ce qui est ici en fait on a deux indications le prénom de la personne et le score obtenu donc on peut représenter ça dans un tableau comme ça alors ici c'est la colonne qui contient le nom des personnes donc la personne qu'on interroge ça ça me donne une première colonne et dans la deuxième colonne je vais mettre le score obtenu tout simplement voilà donc j'obtiens quelque chose comme ça qui est très classique a une manière très classique de représenter les données dans un tableau directement voilà alors ça c'est une manière de faire il y en a d'autres qui sont plus visuelle par exemple on peut faire à partir de ces données ce qu'on appelle un diagramme en bâton diagramme en bâton alors pour faire ça en fait je vais tracer un repère donc j'ai tracé un max comme ça et puis un axe comme ça voilà en ordonner je vais mettre le score le score et ce score il peut aller de 0 à 100 donc la g60 dix vingt trente quarante cinquante 50 60 70 80 90 cents et puis en abscisse ici je vais placer les personnes interrogées leur nom donc je vais commencer déjà je vais avoir emma et marvel la m ici et emma on me dit qu'elle a obtenu 90 alors 90 c'est ici donc ce que je vais faire pour représenter le score des masses et que je vais faire un bâton comme ça deux auteurs 90 voilà alors maintenant je vais mettre milo milo je vais le mettre ici donc ça c'est milo et milo on me dit qu'il a obtenu un score de 95 donc pour ça au dessus de milo je vais faire un bâton qui va jusqu'à 95 ensuite je vais faire la même chose avec camille donc camille je vais la mettre ici il n'ya pas du tout de notion d'échelle donc je vais la mettre je peux la mettre où je veux en fait et le tableau me dit que son score c'est sans donc je vais mettre pour camille un bâton qui va jusqu'à 100 c'est là et voilà je fais comme ça pour kamil je fais exactement la même chose à l'heure lui aussi a obtenu sans réponses justes donc je vais mettre un bâton là donc se bat on la représente le score de kamil et puis enfin j'ai sahara qui a répondu à 80 questions justes donc son score c'est 80 60 70 80 ici donc je vais faire pour sarah un bâton de hauteur 80 ça c'est le score de sarah j'ai créé un diagramme en fait qui représente exactement les mêmes données et on peut utiliser ces deux représentations à peu près de la même manière ici si on veut chercher le score de camille on regarde on cherche qu'a mis dans la colonne personnes et on voit son score dans la colonne score là c'est pareil camille elle est représentée ici et son score ses sens alors il ya d'autres manières de représenter ces données on pourrait d'ailleurs même les représenter plus simplement quitte à perdre un peu d'informations si par exemple on avait voulu donner les scores en respectant l'anonymat donc sans dire qu'ils avaient eu ce score est bien on aurait pu juste lister les scores obtenus que dire tout simplement voilà les scores obtenus bien c'est 90 95 cents encore une fois sans et puis 80 voilà si je représente les données comme ça évidemment je perds une information puisque ici je connais tous les scores obtenus mais en plus je sais qui a eu tel score alors que dans cette liste là j'ai perdu cette information du nom donc je sais quelles sont les scores mais je ne sais pas qui a eu la note en question alors on va voir une autre manière de représenter ces données-là qui s'appelle le diagramme à point tu l'a peut-être déjà vu dans d'autres vidéos on en a déjà parlé diagramme à point en fait ça va consister à regarder plutôt les scop c'est à dire que je vais placer les scores sur un axe comme ça donc ici le plus petit score que j'ai eu c'est 80 g m 80 ici ici je vais m 85 donc je vais aller de 55 ça dépend un peu des données que tu as là je vais mettre 90 et puis 95 et puissant qui est le score maximal et maintenant chaque fois que je rencontre une personne qui a eu ce score là bien je vais mettre un point donc je vais commencer par emma et maëlle a eu 90 donc je vais mettre un point au dessus de 90 ensuite milo a eu 95 donc je vais mettre un point su de 95 ensuite camille a eu 100 camille a eu 100 donc c'est le score maximal je mets un point ici qui représente camille ensuite j'ai kamil qui a eu 100 aussi donc le mettre un autre point ici au dessus de 100 et puis enfin sarah qui est la seule à avoir obtenu 80 je vais mettre un point au dessus de 80 voilà et donc au dessus de 85 ici j'ai rien puisque personne n'a eu 85 et alors il ya une petite remarque on peut faire tout de suite c'est que là j'ai gardé les couleurs donc j'ai gardé en fait l'information nom de la personne que je peux retrouver en repartant de la liste de données ici mais si j'enlève le code couleur donc si je mets des points de tous de la même couleur bien comme tout à l'heure je perds l'information du nom de la perse des personnes qui ont eu un score donné voilà mais en tout cas ici ce qui est intéressant c'est que je peux voir tout de suite combien de personnes ont eu un score donné par exemple la jolie immédiatement qu'une personne a eu 95 et que par contre personne n'a eu 85 alors ce qui est intéressant avec ses différentes manières de représenter les données c'est qu'on peut commencer à se poser des questions intéressantes sur les données on peut par exemple se demander quelle est l'étendue l'étendue des valeurs et l'étendue des valeurs on en a déjà parlé c'est en fait la différence entre la valeur maximale et la valeur minimale donc c'est ce que je peux écrire comme ça l'étendue c'est le maxi la donne est maximale - la donne est minimal mais dans ce tableau on la voit tout de suite le score maximal seissan et le score minimal ses 80 donc ici c'est sans moins 80 ça c'est l'étendue sent moins 80 ce qui est égal à 20 alors ça déjà c'est intéressant ça donne un petit peu l'idée de la dispersion des données alors on peut se poser aussi d'autres questions par exemple on peut se demander combien de personnes ont eu un score un score inférieur à 100 combien de personnes ont eu moins de 100 alors ici on le voit tout de suite il ya et mamie l'eau et sarah donc il y a trois personnes qui ont eu moins de 100 et on peut voir ça ici aussi puisque les gens qui ont eu moins de sens bien c'est ce dont les bat on n'arrive pas jusqu'à 100 donc il ya celui là celui là est celui là ici ça se voit assez rapidement aussi à la frontière de sang est ici donc on va regarder tous ceux qui son avant-centre donc en a ici un ici et un ici avec les données brutes qui sont ici on y arrive aussi les scores inférieurs à 100 c'est celui là celui là est celui-là donc 1 à 3 une autre question qui pourrait être intéressante c'est qu'elle est le score le plus fréquent score le plus fréquent alors là tu vois que le diagramme à points est peut-être un des plus efficaces puisque on voit tout de suite que le score où il ya le plus de points et bien c'est celui là donc le score le plus fréquent c'est 100 et comme tout à l'heure en fait on peut répondre à cette question là à partir de toutes les représentations qu'on a donnée ici par exemple là il suffit de regarder les données ce 90 n'apparaît qu'une fois 95 n'apparaît qu'une fois sans apparaît deux fois et 80 n'apparaît qu'une fois donc le score le plus fréquent et bien c'est 100 puisqu'il apparaît deux fois là on a une barre qui arrive jusqu'à 90 une barre jusqu'à 95 2 bars qui arrive jusqu'à 100 et une jusqu'à 80 donc là aussi ça nous dit que le score le plus fréquent c'est 100 et puis là c'est pareil on a 1 90 1 95 1 80 mais on a deux fois le nombre sans donc là aussi on peut facilement répondre à cette question là voilà ça fait une vidéo un petit peu longue évidemment mais c'était pour te donner un aperçu de différentes façons de représenter des données et dans d'autres vidéos de la can academy on utilisera à ses différentes représentations