If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

L'historique des recherches

Un moteur de recherche est un service qui développe un index du World Wide Web et qui permet aux utilisateurs et utilisatrices de faire des recherches dans cet index. Google est le moteur de recherche le plus populaire, mais il en existe bien d'autres, et comme nous allons le voir, tous les moteurs de recherche ne fonctionnent pas de la même manière en matière de collecte de données.
Aujourd'hui, les moteurs de recherche nous donnent accès à une immense mine d'informations en quelques clics. Il est donc tentant de les utiliser pour trouver toutes les réponses à nos questions.
Un GIF animé montrant trois requêtes en train d'être rédigées dans la barre de recherche : "comment construire un jet ski ?", "les bananes vertes sont-elles toxiques ?, "qu'est-ce qu'un virelangue ?"
Une fois que nous avons entré nos questions et appuyé sur "Rechercher", c'est le moteur qui va décider quoi faire de nos données.

Données collectées

Selon le moteur de recherche que nous utilisons, nos requêtes peuvent être enregistrées dans une base de données et stockées définitivement.
Une requête de recherche seule ne constitue pas vraiment une information privée : beaucoup de gens dans le monde souhaitent probablement savoir comment construire un jet ski. Toutefois, les moteurs de recherche peuvent enregistrer bien plus de données qu'une simple requête : ils peuvent ajouter toutes sortes d'informations qui pourraient potentiellement permettre de vous identifier.
L'enregistrement d'une requête de recherche dans une base de données ressemble à peu près à cela :
RequêteDateHeureAdresse IPAgent utilisateur
Comment construire un jet ski ?11 mars 202011:1449.121.111.73Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1
Si vous utilisez à plusieurs reprises le même moteur de recherche sur le même ordinateur et avec la même connexion Internet (comme beaucoup d'entre nous le font à la maison), vos requêtes contiendront toutes la même adresse IP.
Voici à quoi ressemblent plusieurs requêtes dans une base de données :
RequêteDateHeureAdresse IPAgent utilisateur
"Comment construire un jet ski ?"11 mars 202011:1449.121.111.73Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1
"Brico Dépôt près de Lille"11 mars 202016:0049.121.111.73Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1
"Livraison de pizza pas chère à Paris"12 mars 202021:0749.121.111.73Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1
"Arbre généalogique des Windsor"13 mars 202014:3249.121.111.73Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1
Les requêtes de recherche commencent tout à coup à ressembler bien plus à des données à caractère personnel.
De plus, l'historique des recherches peut aussi contenir un cookie ou même un nom d'utilisateur si vous étiez connecté au site web du navigateur lorsque vous avez soumis votre requête.

Utilisation des données de l'historique des recherches

Stocker vos requêtes et vos données d'identification permet à un moteur de recherche de personnaliser les résultats de votre recherche.
Prenons par exemple la requête de recherche "Python". Si la personne qui rédige cette requête est biologiste et cherche régulièrement des termes associés au domaine de la biologie, le moteur de recherche pourrait afficher ce résultat en première position :
Capture d'écran d'un résultat de recherche menant vers un article Wikipédia sur les Pythonidae, une famille de serpents.
Si la personne à l'origine de cette recherche est spécialisée dans le développement de logiciels et que son historique de recherches regorge de requêtes en lien avec le domaine de la programmation, le moteur de recherche pourrait plutôt afficher ce résultat :
Capture d'écran d'un résultat de recherche menant vers la page d'accueil de python.org, un langage de programmation.
Les programmeurs et programmeuses qui n'aiment pas les serpents apprécieront de pouvoir bénéficier de résultats personnalisés. 🚫🐍
Les moteurs de recherche intègrent fréquemment des publicités aux résultats des recherches, puisque c'est ce qui leur permet de gagner assez d'argent pour continuer à fonctionner gratuitement. Une fois qu'un moteur de recherche commence à collecter l'historique des recherches d'un utilisateur ou d'une utilisatrice, il peut baser les publicités sur davantage de données qu'une simple requête.
Google prend en charge un moteur de recherche mais s'occupe également d'un réseau d'annonces très populaire, qui gère des publicités sur des millions de sites en dehors de Google. Ce réseau d'annonces se sert de l'historique des recherches pour personnaliser les publicités qui apparaissent sur les sites en dehors de Google.
Par exemple, j'ai une fois passé une journée à faire des recherches sur les réseaux de capteurs intelligents pour un article, et je reçois encore des publicités sur les capteurs intelligents, même lorsque je lis un blog sur la mode.
Une annonce recadrée disant : "Remplacez une surveillance inefficace et dépassée par des solutions de surveillance en temps réel, sans fil et intelligentes" à côté d'une image représentant deux appareils.
Partie d'une publicité qui est apparue sur un blog sur la mode (la marque a été coupée).
🤔 Lorsque vous surfez sur un site web et que vous apercevez une publicité qui semble personnalisée, êtes-vous content qu'elle réponde à vos besoins ou furieux qu'on vous connaisse si bien ?

Risques liés à la collecte de l'historique des recherches

Les moteurs de recherche expliquent qu'ils utilisent votre historique de recherche pour personnaliser votre expérience et l'améliorer.
Cependant, toute forme de collecte de données en ligne présente des dangers.
En 2005, la société de services Internet AOL a publié des données "anonymisées" relatives aux recherches effectuées par ses utilisateurs sur une période de trois mois, à destination de chercheurs et chercheuses, afin qu'ils et elles puissent les utiliser. La stratégie d'anonymisation d'AOL a consisté à remplacer dans ces données le nom d'utilisateur par un identifiant numérique. Chaque nom d'utilisateur a été remplacé par le même identifiant numérique. L'équipe de chercheurs a donc pu regrouper les données en fonction des identifiants numériques et voir toutes les requêtes émises par une même personne.
En moins d'une semaine, des journalistes du New York Times ont été capables de déduire l'identité du numéro d'utilisateur 4417749, en examinant ses requêtes et en récoltant la moindre parcelle d'information personnelle.1 L'utilisatrice a été étonnée lorsqu'elle a découvert que toutes ses requêtes de recherche étaient visibles par tous. Elle a déclaré au journaliste : "Mon Dieu, c'est toute ma vie personnelle. Je n'aurais jamais cru que quelqu'un regardait par-dessus mon épaule."

Que peut-on faire ?

Il est tout à fait normal que vous vous sentiez tout à coup hésitant à l'idée d'entrer une requête dans un moteur de recherche. Mais ne vous inquiétez pas, vous n'avez pas besoin de renoncer définitivement aux moteurs de recherche.
Il est d'abord important de savoir quelles données sont stockées par le moteur de recherche et comment celles-ci sont utilisées. Vous pouvez lire la politique de confidentialité du moteur de recherche pour en savoir plus à ce sujet.
Si vous n'aimez pas la méthode employée pour collecter les données, mais que vous souhaitez continuer à utiliser le service, vous pouvez vous rendre dans les paramètres et restreindre ou même désactiver complètement la collecte de données. Tous les moteurs de recherche ne proposent pas de tels paramètres, mais beaucoup finiront par le faire pour satisfaire les personnes qui souhaitent protéger leur vie privée.
Si utiliser un service différent ne vous pose aucun problème, cherchez d'autres solutions, comme DuckDuckGo par exemple. Il s'agit d'un moteur de recherche qui porte un soin particulier à la vie privée : il stocke les requêtes de recherche pour améliorer ses fonctionnalités (correction de l'orthographe...), mais ne stocke pas les adresses IP, les agents utilisateurs, les cookies, ou d'autres informations qui pourraient permettre d'identifier quelqu'un.2
🤔 La lecture de cet article vous donne-t-elle envie de changer votre comportement sur les moteurs de recherche ? Quels seraient les avantages ou les inconvénients de cette nouvelle approche que vous souhaiteriez adopter ? Partagez-les avec nous !

🙋🏽🙋🏻‍♀️🙋🏿‍♂️Vous avez des questions sur ce sujet ? Nous vous répondrons volontiers ! Posez simplement votre question dans l'espace ci-dessous !

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.