Contenu principal
Cours : Sécurité sur Internet > Chapitre 1
Leçon 5: En savoir plus sur la navigation sécuriséeL'historique des recherches
Un moteur de recherche est un service qui développe un index du World Wide Web et qui permet aux utilisateurs et utilisatrices de faire des recherches dans cet index. Google est le moteur de recherche le plus populaire, mais il en existe bien d'autres, et comme nous allons le voir, tous les moteurs de recherche ne fonctionnent pas de la même manière en matière de collecte de données.
Aujourd'hui, les moteurs de recherche nous donnent accès à une immense mine d'informations en quelques clics. Il est donc tentant de les utiliser pour trouver toutes les réponses à nos questions.
Une fois que nous avons entré nos questions et appuyé sur "Rechercher", c'est le moteur qui va décider quoi faire de nos données.
Données collectées
Selon le moteur de recherche que nous utilisons, nos requêtes peuvent être enregistrées dans une base de données et stockées définitivement.
Une requête de recherche seule ne constitue pas vraiment une information privée : beaucoup de gens dans le monde souhaitent probablement savoir comment construire un jet ski. Toutefois, les moteurs de recherche peuvent enregistrer bien plus de données qu'une simple requête : ils peuvent ajouter toutes sortes d'informations qui pourraient potentiellement permettre de vous identifier.
L'enregistrement d'une requête de recherche dans une base de données ressemble à peu près à cela :
Requête | Date | Heure | Adresse IP | Agent utilisateur |
---|---|---|---|---|
Comment construire un jet ski ? | 11 mars 2020 | 11:14 | 49.121.111.73 | Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1 |
Si vous utilisez à plusieurs reprises le même moteur de recherche sur le même ordinateur et avec la même connexion Internet (comme beaucoup d'entre nous le font à la maison), vos requêtes contiendront toutes la même adresse IP.
Voici à quoi ressemblent plusieurs requêtes dans une base de données :
Requête | Date | Heure | Adresse IP | Agent utilisateur |
---|---|---|---|---|
"Comment construire un jet ski ?" | 11 mars 2020 | 11:14 | 49.121.111.73 | Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1 |
"Brico Dépôt près de Lille" | 11 mars 2020 | 16:00 | 49.121.111.73 | Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1 |
"Livraison de pizza pas chère à Paris" | 12 mars 2020 | 21:07 | 49.121.111.73 | Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1 |
"Arbre généalogique des Windsor" | 13 mars 2020 | 14:32 | 49.121.111.73 | Mozilla/5.0 (Windows NT 5.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1 |
Les requêtes de recherche commencent tout à coup à ressembler bien plus à des données à caractère personnel.
De plus, l'historique des recherches peut aussi contenir un cookie ou même un nom d'utilisateur si vous étiez connecté au site web du navigateur lorsque vous avez soumis votre requête.
Utilisation des données de l'historique des recherches
Stocker vos requêtes et vos données d'identification permet à un moteur de recherche de personnaliser les résultats de votre recherche.
Prenons par exemple la requête de recherche "Python". Si la personne qui rédige cette requête est biologiste et cherche régulièrement des termes associés au domaine de la biologie, le moteur de recherche pourrait afficher ce résultat en première position :
Si la personne à l'origine de cette recherche est spécialisée dans le développement de logiciels et que son historique de recherches regorge de requêtes en lien avec le domaine de la programmation, le moteur de recherche pourrait plutôt afficher ce résultat :
Les programmeurs et programmeuses qui n'aiment pas les serpents apprécieront de pouvoir bénéficier de résultats personnalisés. 🚫🐍
Les moteurs de recherche intègrent fréquemment des publicités aux résultats des recherches, puisque c'est ce qui leur permet de gagner assez d'argent pour continuer à fonctionner gratuitement. Une fois qu'un moteur de recherche commence à collecter l'historique des recherches d'un utilisateur ou d'une utilisatrice, il peut baser les publicités sur davantage de données qu'une simple requête.
Google prend en charge un moteur de recherche mais s'occupe également d'un réseau d'annonces très populaire, qui gère des publicités sur des millions de sites en dehors de Google. Ce réseau d'annonces se sert de l'historique des recherches pour personnaliser les publicités qui apparaissent sur les sites en dehors de Google.
Par exemple, j'ai une fois passé une journée à faire des recherches sur les réseaux de capteurs intelligents pour un article, et je reçois encore des publicités sur les capteurs intelligents, même lorsque je lis un blog sur la mode.
🤔 Lorsque vous surfez sur un site web et que vous apercevez une publicité qui semble personnalisée, êtes-vous content qu'elle réponde à vos besoins ou furieux qu'on vous connaisse si bien ?
Risques liés à la collecte de l'historique des recherches
Les moteurs de recherche expliquent qu'ils utilisent votre historique de recherche pour personnaliser votre expérience et l'améliorer.
Cependant, toute forme de collecte de données en ligne présente des dangers.
En 2005, la société de services Internet AOL a publié des données "anonymisées" relatives aux recherches effectuées par ses utilisateurs sur une période de trois mois, à destination de chercheurs et chercheuses, afin qu'ils et elles puissent les utiliser. La stratégie d'anonymisation d'AOL a consisté à remplacer dans ces données le nom d'utilisateur par un identifiant numérique. Chaque nom d'utilisateur a été remplacé par le même identifiant numérique. L'équipe de chercheurs a donc pu regrouper les données en fonction des identifiants numériques et voir toutes les requêtes émises par une même personne.
En moins d'une semaine, des journalistes du New York Times ont été capables de déduire l'identité du numéro d'utilisateur 4417749, en examinant ses requêtes et en récoltant la moindre parcelle d'information personnelle. L'utilisatrice a été étonnée lorsqu'elle a découvert que toutes ses requêtes de recherche étaient visibles par tous. Elle a déclaré au journaliste : "Mon Dieu, c'est toute ma vie personnelle. Je n'aurais jamais cru que quelqu'un regardait par-dessus mon épaule."
Que peut-on faire ?
Il est tout à fait normal que vous vous sentiez tout à coup hésitant à l'idée d'entrer une requête dans un moteur de recherche. Mais ne vous inquiétez pas, vous n'avez pas besoin de renoncer définitivement aux moteurs de recherche.
Il est d'abord important de savoir quelles données sont stockées par le moteur de recherche et comment celles-ci sont utilisées. Vous pouvez lire la politique de confidentialité du moteur de recherche pour en savoir plus à ce sujet.
Si vous n'aimez pas la méthode employée pour collecter les données, mais que vous souhaitez continuer à utiliser le service, vous pouvez vous rendre dans les paramètres et restreindre ou même désactiver complètement la collecte de données. Tous les moteurs de recherche ne proposent pas de tels paramètres, mais beaucoup finiront par le faire pour satisfaire les personnes qui souhaitent protéger leur vie privée.
Si utiliser un service différent ne vous pose aucun problème, cherchez d'autres solutions, comme DuckDuckGo par exemple. Il s'agit d'un moteur de recherche qui porte un soin particulier à la vie privée : il stocke les requêtes de recherche pour améliorer ses fonctionnalités (correction de l'orthographe...), mais ne stocke pas les adresses IP, les agents utilisateurs, les cookies, ou d'autres informations qui pourraient permettre d'identifier quelqu'un.
🤔 La lecture de cet article vous donne-t-elle envie de changer votre comportement sur les moteurs de recherche ? Quels seraient les avantages ou les inconvénients de cette nouvelle approche que vous souhaiteriez adopter ? Partagez-les avec nous !
🙋🏽🙋🏻♀️🙋🏿♂️Vous avez des questions sur ce sujet ? Nous vous répondrons volontiers ! Posez simplement votre question dans l'espace ci-dessous !
Vous souhaitez rejoindre la discussion ?
Pas encore de posts.