Mai 2002 : Article extrait du monde
 

 

L'anonymat des internautes a fait long feu. Une batterie de moyens techniques permet aujourd'hui à certains acteurs du réseau d'établir - avec plus ou moins de précision - l'identité ou le profil des adeptes du surf sur Internet. Du simple "cookie" au "spyware", en passant par la conservation des données de connexion par les fournisseurs d'accès, les nouveaux canons de la navigation sur le réseau font le bonheur des forces de l'ordre ou des sites marchands et suscitent la colère des associations de défense de la vie privée.

Vendredi 29 mars 2002, celles-ci ont obtenu de DoubleClick, le leader mondial de la publicité en ligne, qu'il détruise une part des informations personnelles collectées sur les sites faisant appel à ses services. La société américaine n'en est pas à ses premiers démêlés avec des associations comme l'EPIC (Electronic Privacy Information Center) ou l'EFF (Electronic Frontier Foundation). Sous leur pression, DoubleClick avait déjà dû renoncer en 1999 à croiser ses fichiers avec ceux d'Abacus, l'entreprise de marketing direct qu'elle venait d'acquérir.

"Sur Internet, on perd le face-à-face avec le client, explique Laurent Hénault, directeur Europe du Sud de Brio Software, un éditeur de logiciels d'analyse de données. Il est donc naturel de chercher à pallier ce manque." La plupart des sites stockent ainsi sur l'ordinateur de leurs internautes un "cookie". Lors de visites ultérieures sur le site, ce fichier, sorte de code-barre informatique, est lu par le serveur et permet l'identification du visiteur grâce aux données personnelles communiquées lors de l'enregistrement : nom, âge, catégorie socio-professionnelle, etc. Dans ce cas, le "profilage" s'opère sur la base du volontariat et s'inscrit dans une relation établie entre un client et une société.

Mais il n'en va pas toujours ainsi. Des données personnelles sont souvent collectées et stockées à l'insu des internautes. Trois éléments techniques sont au centre de ce que Jean-Marc Dinant, chercheur au Centre de recherche informatique et droit (Crid) de l'université de Namur (Belgique), appelle le"traitement invisible de l'information". "Les trois facteurs qui interviennent, explique-t-il, sont le cookie, le "bavardage" du navigateur et l'hyperlien invisible." Lorsqu'un navigateur (Internet Explorer ou Netscape, par exemple) se connecte à un site, il "bavarde" avec le serveur, lui livrant, explique M. Dinant, "des informations sur la langue de l'utilisateur, son environnement informatique, et surtout la page référente, c'est-à-dire la page d'où il vient. Si cette page est un moteur de recherche, les mots-clés de la dernière requête sont également transmis".

L'hyperlien invisible permet, lui, de rediriger la connexion d'un site vers un autre sans que l'internaute en soit averti. Les bannières de publicité, par exemple, sont généralement stockées sur les serveurs de régies publicitaires. Apparemment connecté à un seul site, l'internaute est en réalité en relation avec deux serveurs qui peuvent chacun lui attribuer un cookie. Les grandes régies publicitaires en ligne comptant de très nombreux sites dans leur portefeuille peuvent ainsi "profiler" les internautes à leur insu, en listant les mots-clés les plus souvent recherchés par un individu, les sites qu'il visite le plus souvent, pour en déduire les bannières sur lesquelles il cliquera avec une plus grande probabilité.

Certaines sociétés, notamment en France, se sont engouffrées sur le marché des services de "profilage". Avec des moyens toujours plus sophistiqués. Profile for you, par exemple, a placé des marqueurs sur les pages de quelque 11 500 sites partenaires. Lorsque l'internaute se connecte sur l'une de ces pages, le marqueur, un programme Java, envoie à Profile for you l'adresse de la page visitée et les informations sur l'internaute contenues dans le cookie. Ensuite, Profile for you procède à une analyse sémantique de cette page (par occurrence de mots-clés dans les titres et le corps du texte), ce qui enrichit le profil de l'internaute stocké dans les bases de données de la société. Cela permet de mettre en lumière les centres d'intérêt de l'internaute classés dans une arborescence de trois niveaux comportant 800 branches différentes. La société assure détenir le profil d'environ un tiers des internautes français.

"En premier niveau d'analyse, tel internaute sera profilé comme ayant 70 % d'intérêt pour la Bourse en ligne, 20 % pour le sport et 10 % pour l'immobilier. En deuxième niveau, les thèmes des pages Web qu'il visite permettront de le classer par exemple à 80 % passionné par les forums de discussion boursiers. Au final, nous pourrons dire que l'internaute en question a, par exemple, 90 % de chances d'être un jeune cadre entre 25 et 35 ans susceptible d'être intéressé par des offres de PEA", explique Fabrice Wilthien, statisticien chez Profile for you.

Ces méthodes de profilage commercial restent toutefois sommaires au regard du pouvoir des forces de l'ordre de perquisitionner, sur commission rogatoire, les fournisseurs d'accès à Internet. En France, la loi contraint ceux-ci à conserver les données de connexion de leurs clients pendant un an. Un délai pendant lequel tous les parcours dans le cyberespace restent enregistrés et tenus à la disposition de la justice en cas d'enquête. Selon M. Dinant, l'arrivée du protocole IPv6 (Le Monde du 23 mars), qui multipliera le nombre d'adresses des machines se connectant à Internet, ne fera qu'amplifier la tendance d'une Toile sous surveillance.

L'adresse IP ne sera plus en effet attribuée aléatoirement par le fournisseur d'accès mais sera constituée, pour une part, du numéro de série de l'ordinateur. A chaque machine sera affecté un identifiant unique, qui pourra être croisé avec d'autres données comportementales. Les promoteurs d'IPv6 assurent que cette particularité du nouveau protocole n'est pas destinée à renforcer la surveillance. Citant un proverbe basque, Jean-Marc Dinant leur rétorque pourtant que "l'arbre tombe toujours du côté où il penche".

Auteurs de l'article Cécile Ducourtieux et Stéphane Foucart