If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

Amas dans les diagrammes de dispersion

Pour apprendre ce qu’est un amas dans un nuage de points.

Qu'est-ce qu'un amas dans un nuage de points ?

Parfois, dans un nuage de points, on observe des points regroupés entre eux qui se distinguent des autres points. Ces groupes sont appelés amas (clusters).
Un nuage de points représente la masse de sodium par portion en milligrammes sur l'axe des ordonnées, par rapport aux calories par portion sur l'axe des abscisses. 16 points s'élèvent en diagonale selon un schéma relativement étroit, avec un groupe de 8 points entre (135, 350) et (155, 360) et un autre groupe de 8 points entre (170, 450) et (195, 500). Les deux groupes sont étiquetés d'une couleur différente.
Source des données : Consumer Reports, June 1986, pp. 366-367
On a représenté dans le nuage de points la valeur énergétique et la teneur en sodium de 16 marques de hot dog en 1986. (Un point représente une marque.) On observe deux amas, un à gauche et un à droite.
L'amas à gauche correspond aux marques de hot dog ayant peu de calories et une faible quantité de sodium.
L'amas à droite correspond aux marques de hot dog ayant beaucoup de calories et une forte quantité de sodium.

À vous

Voyons quelques problèmes pour mieux comprendre la notion d'amas.

Problème 1 : Les poissons mâles et femelles

Le Lamprologus callipterus est un poisson tropical qui a la particularité de vivre dans des coquilles d'escargots vides. Le mâle adulte est beaucoup plus grand et gros que la femelle, pesant environ 13 fois plus. Alors que la femelle adulte a une taille maximale de 6 centimètres, celle du mâle est de 15 centimètres.
Parmi les nuages de points suivants, lequel représente les observations sur la taille et la masse d'un groupe d'adultes de Lamprologus callipterus ?
Choisissez une seule réponse :

Problème 2 : Résultats au SAT

La plupart des élèves américains se soumettent au SAT ou "Scholastic Assessment Test"", à la sortie de leur "High School". On a représenté dans le nuage de points la série statistique double du taux de participation au SAT de 2009à2010 et de la moyenne des notes en mathématiques par état américain.
Un nuage de points. Participation au SAT en pourcentage sur l'axe x, et Moyenne des note en mathématiques sur l'axe y. 47 points décroissent en diagonale avec un amas de points entre (3, 615) et (25, 525) et un autre amas de points entre (43, 500) et (93, 500). Les points dans le premier amas sont en vert et dans le second en bleu. Tous les points sont estimés.
Source : National Center for Education Statistics
Il y a un amas d'états à taux de participation les plus faibles et un amas d'états à taux de participation les plus élevés.
Comment interpréter ces amas ?
Choisissez une seule réponse :

Pourquoi existe-t-il des amas dans les données ?

Il n'est pas facile d'expliquer pourquoi on observe des amas dans une série statistique double. Parmi ces trois problèmes concrets, il est possible d'expliquer clairement les amas uniquement dans celui relatif aux poissons.
Si vous avez une théorie expliquant les amas dans l'un des deux autres problèmes, partagez la s’il vous plaît dans les commentaires ci-dessous.

Vous souhaitez rejoindre la discussion ?

  • blobby green style l'avatar de l’utilisateur Guillaume Nicolet
    Concernant le problème des résultats au test SAT, il est possible que dans les Etats avec faible participation et notes en maths élevées, seuls les élèves les plus brillants participent au test, peut être car ils sont très incités à le faire par leurs établissements pour améliorer leurs statistiques.
    (10 votes)
    Default Khan Academy avatar l'avatar de l’utilisateur
    • boggle yellow style l'avatar de l’utilisateur jeanmariepaquet1952
      Il serait intéressant de comparer les résultats des garçons et des filles par Etat en comparant les années 2015 et 2020 et comparer les clusters pour ne pas tirer des conclusions trop rapides.
      On ne parle pas non plus des Etats où il n'y a pas de tests du tout.
      Il serait possible, à cet effet, de créer des variables aléatoires.
      Très satisfait de la réponse susvisée.
      (3 votes)
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.