If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal
Heure actuelle :0:00Durée totale :7:48

Transcription de la vidéo

dans cette vidéo je vais t'expliquer c'est qui qui se passe quand on fait ce qu'on appelle une régression il dit aimer alors je ne vais pas rentrer dans l'explication mathématiques qui y adhérer à la notion de récréation les meilleurs mais plutô t aider à visualiser ce concept et pour ça je vais utiliser excellent comme ça tu auras une petite idée de comment et pourquoi t'en servir si tu vas t'amuser avec nous wat avec la porter à notre table alors qu'on est dit ici le tableau ci-dessous montre le revenu médian annuel des familles en californie dès 1995 à 2002 alors la médiane c'est la faveur qui permet de partager l'ensemble des données en deux parties égales donc le revenu médian c'est le revenu tels que la moitié de la population ici on parle de famille californienne donc la moitié de la population en revenus supérieure au revenu médian et l'autre moitié un revenu inférieure et on nous demande de dge décimée un nuage de points et de déterminer les conditions de la droite 2 régression linéaire quelle est la signification du coefficient directeur et de leur donner à l'origine quel sera le revenu médian annuelle d'une famille californienne en 2010 la première chose à faire c'est de réécrire ses données de façon à ce qu'elle puisse être utilisée par le tableur haïtiennes font partie de l'énoncé donc je vais construire un tableau avec dans cette colonne je vais mettre les années depuis 1900 95 alors chacon dit un peu cette colonne et puis ii je vais mettre le haut revenu mais dix ans la première donnée qu'on a assez pour 1995 donc on recommence zéro allez après 1995 ensuite en à 1996 1997 ecceterra jusqu'à 2002 et au lieu de rentrer 2 3 et 4 excepté rage et laissez la magie des que celle opérée si je sélectionne ses deux premières cellules et si je tire vers le bas eh bien excellent continue ce que j'avais commencé à savoir passer dehors alors peut-être que je pourrais rajouter ici une colonne indicative avec justesse l'année comme ça on voit où on en est donc la première année c'est 1995 ensuite 1996 et pareil je sélectionne les deux premières cellules et je tire vers le bas et voilà comme ça s'inscrivent toutes les années jusqu'à 2002 dans cette colonne par contre je n'étais pas recopier moi-même toutes les données est-ce que tu vois bien que le revenu d'ailleurs que le revenu de 5 30 dollars ne varie pas de façon constante d'année en année autrement dit le taux de variation de revenus par rapport à l'année n'est pas constant alors la 1ère année sfr cinquante-trois mille besson en fête ensuite cinquante-cinq mille 217 cinquante-cinq mille 415 soixante-trois mille ce sens 63 millions 206 soixante-trois mille sept cents 61 et enfin 65000 cette sens 66' et maintenant tu vas voir que quand tu sais que les dés il est très facile de créer à un nuage de points avec excel tout ce que tu dois faire c sélectionné les données ainsi 8 tu vas dans le menu insertion recul soit 6 nuages de points et tu vois ici que tu as le choix entre différents types de nuages de points nous comptons juste assez les points donc je choisis le premier à excellent à placer tous les points pour moi sûres l'accès d le sort de baisser le revenu en dollars et puis surprenant l'accès des plus laxistes ce sens les années à partir de 1995 ici on né en 1995 puisqu'on est erroné après 1995 le revenu médian assez 53' 1807 enfin suite c'est l'année 1996 et le revenu médian ses 55 1217 eq ces terrains acceptera et qui aura marqué tous les points ne sont pas alignés qu'ils suivent les tendances donc on pourrait imaginer une droite ce qui représente 7 tendance c'est l'idée de la régression linéaire quant à nuages de points montre comme ici que les points s'organise autour d'une tendance lignières on cherche à déterminer la droite qui décrira au mieux cet relation linéaire il fit entre les années le revenu médian et bien sûr excellent peut faire ça très facilement ici j'ai des options pour améliorer mon graphique c'est leur salariés hors je sais pas si tu vois très bien on nous montre une droite avec stx ça veut dire que j'aurais une équation en plus de la droite de régression donc si je clique et voilà non seulement la régression linéaire mais aussi l'équation est un peu sa droite alors je vais la déplacer un petit peu pour que tu vois mieux et puis je veux aussi accro dire mon graphique donc l'équation de cet envoi de ces il a été également élu 882 4 3 x + cinquante des 1800 47 tu reconnais le coefficient directeur oui 882 4 3 et leur donner à l'origine cinquante des milles 8 147 leur donner à l origine c ce point là la droite mexique 0 année après 1995 donc en 1995 le revenu médian c 52' 1847 et c'est juste un peu moins que le frère homme revenu médian tu crois bien qu'on est juste en dessous du point ici en effet en 1995 le revenu médian c cinq ans 3807 les points ne sont pas sur la droite mais la droite passe au plus près de tous les points de notre nuage et c'est le principe de la sécrétion linéaire céder minimiser la distance entre les points et la droite en fait c'est plutôt de minimiser le carré de la distance mais j'ai décidé que je ne rentrerai pas dans les détails et mathématiques qu'il ya derrière tout ça et le coefficient directeur mutique chaque année sur la droite y augmente 1882 bien que le 3 alors l'avantagé la régression linéaire c'est qu'on peut utiliser cette équation prédire ce qui va se passer au-delà de notre période d'observation puisque excellent à décimer la relation linéaire la plus proche la relation qui existe entre tous les points de notre nuage on imagine que si on l'utilisé l'équation de cette droite pour déterminer le revenu médian des milices ou du mois une prédiction du revenu médian de 2010 comme cette demande est ici dans l'énoncé alors on sera assez proche de la réalité tendrement tableau je vais continuer jusqu'à 2010 alors même chose je vais tirer mais ces lieux jusqu'à 2010 2010ce et même chose ici et je tire jusqu'à 2017 les cff est assez facile en fête en 2002 en été cette année après 1995 et en 2010 eba on sera quinze années après 1995 et maintenant on a plus qu'à raison de cette équation tandis que sega 15 donc il va être et gaël 1882 la ville de troyes fois 15 il a ajouté être sélectionnée directement la cellulite ici ken ses pas l'ont interpellé mais parfois cette éviter les serveurs de frappe plus 52' 1800 47' jacquet sur entrée et ça me donne la prédiction du revenu médian pour 2010 à savoir 80 1080p ribul 50 donc en 2010 si l'évolution du revenu médian suite la tendance de cette droite eh bien le revenu médian d'une famille californienne sera de 80 milles 80 ans quelque 50 et voilà j'espère que tu auras trouvé ça intéressant de comprendre à quoi servent les modèles linéaires à quoi servent les droites et comment utiliser ces outils pour interpréter des données et même faire des prédictions