Aller au contenu

Cookies, tracking et pubs ciblées


unCaillou

Messages recommandés

Salut à tous,

Je cherche à comprendre comment fonctionne la publicité ciblée, la gestion des cookies et le suivi des utilisateurs sur internet, de façon précise et technique. J'ai cherché sur le web et personne n'explique en détail son fonctionnement.

On sait que les serveurs web posent des cookies sur notre ordinateur et qu'ils sont cloisonnés par nom de domaine. Ils ne lisent un cookie que s'ils en sont l'auteur, et ce cookie est détruit si sa date est dépassée ou si l'utilisateur l'efface.

EXEMPLE: je consulte un article sur actugeniale.fr :

  • Le site crée des cookies accessibles en lecture/écriture par lui seul, pour gérer la session, les préférences d'affichage. Quand il répond à mon navigateur, le serveur web écrit dans les entêtes http les infos que le navigateur doit conserver en tant que cookie. Mon navigateur renvoie ces infos à chaque requête http sur le serveur actugeniale.fr pour que ces réponses me soit adaptées. => cookie normal
  • Sur la même page, pour afficher une publicité, il y a une requête http vers la régie de pub ad.jaimelapub.com qui pose elle aussi des cookies accessibles en lecture/écriture par elle seule. => cookie tiers
  • Toujours sur cette page, il y a une autre requête http vers un service de tracking d.click.com pour avoir des stats de navigation, pour construire mon parcours de navigation. Idem, il pose son petit cookie, généralement un numéro pour m'identifier. => cookie tiers, tracking cookie

QUESTIONS:

1. Comment ad.jaimelapub.com et d.click.com savent que je suis sur actugeniale.fr en train de lire cet article précis ?

2. Un script sur actugeniale.fr peut-il donner un de ses propres cookies à ad.jaimelapub.com ou d.click.com et casser ainsi la règle de cloisonnement par nom de domaine ?

3. Comment un serveur peut-il construire le profil de navigation d'un internaute sur d'autres sites que le sien ? :mad2:

Comment Google+, Adsense, Facebook, etc... arrivent-ils à connaitre toutes mes pages visitées, puisque le postulat de base est que chacun ne communique qu'avec moi et que chacun ne lit que ses propres cookies ?

Si des connaisseurs poeuvent expliquer en détail comment tout ça s'articule, ça serait sympa, merci à vous ! :yes:

LES COOKIES VISUELLEMENT:

Une requête Navigateur -> Serveur avec cookies déjà sur le pc donc envoyés au serveur :

GET http://www.actugeniale.fr HTTP/1.1  Accept : text/html  If-Modified-Since : Saturday, 17-January-2012 19:18:51 GMT  User-Agent : Mozilla/5.0 (compatible; MSIE 8.0; Windows 95)Cookie: pdesign=12; session_id=6874165d68068a4e21; secure=true

Une réponse Serveur -> Navigateur avec écriture de cookie sur mon pc :

HTTP/1.1 200 OKAccept-Ranges: bytesCache-Control: max-age=60Content-Type: text/html; charset=ISO-8859-1Date: Fri, 30 Nov 2012 12:22:18 GMTLast-Modified: Fri, 30 Nov 2012 12:20:24 GMTServer: Apache/2.0.54 (Debian GNU/Linux) DAV/2 SVN/1.1.4Content-Length: 300754Set-Cookie: pdesign=12; session_id=6874165d68068a4e21; secure=true

:inpactitude2:"si tu sais pas demande, si tu sais partage" donc je demande... :transpi:

Lien vers le commentaire
Partager sur d’autres sites

Salut,

Comme le dit nemesis pour ta première question, le site que tu consultes a un accord avec la ou les régies publicitaires qui affichent les bandeaux et autres encarts, et c'est de cette manière que la régie publicitaire sait que tu es en train de consulter le site hôte, dans ton cas actugeniale.fr.

Ensuite, voilà comment ça se passe : il s'agit comme je l'ai écrit de régies publicitaires, donc la plupart du temps elles sont présentes sur de très nombreux sites, et comme chaque site leur dit "j'ai tel utilisateur et/ou telle ip qui se connecte chez moi", ils peuvent déterminer ton profil de navigation, le but étant bien évidemment de te proposer des publicités en rapport avec tes centres d'intérêt. Pour autant, un site A ne peut pas voir les cookies d'un site B (en tout cas à ma connaissance).

Les réseaux sociaux sont très liés au secteur de la publicité, puisque c'est bien là leur intérêt économique : inciter les internautes à raconter leur vie, ce qu'ils aiment, leurs informations personnelles, pour ensuite les revendre aux régies publicitaires. Sans ça, Facebook par exemple n'aurait pas autant de valeur.

Si tu as un compte Facebook, tu auras sans doute remarqué que sans un paramétrage contraire de ta part, tu as le module FB qui s'affiche sur beaucoup de sites que tu visites (les chaînes de TV, les sites d'actu, les portails, etc). Ca aussi, ça rentre dans le tracking, d'une manière assez similaire au système de la publicité.

Exemple vécu : il y a quelques années, je cherchais un appareil photo et je me suis renseigné via un site dont je ne me souviens plus de l'adresse, et ensuite j'avais des publicités sur l'appareil photo qui m'intéressait (très précisément, pour le coup) sur des sites aussi variés que "Yahoo" ou "Le Journal du Geek".

Lien vers le commentaire
Partager sur d’autres sites

Merci pour vos réponses.

il donne dans les cookies l'url de la page que tu visites

Mais comment puisqu'ils ne peuvent pas s'échanger et lire leurs cookies mutuellement ?

Concrêtement, c'est quoi le procédé ?

le site que tu consultes a un accord avec la ou les régies publicitaires qui affichent les bandeaux et autres encarts, et c'est de cette manière que la régie publicitaire sait que tu es en train de consulter le site hôte

Qui se concrétise comment ?

Quand je fait la requête sur ad.jaimelapub.com pour recevoir l'encart de pub, je ne peux PAS envoyer un cookie relatif au site hôte.

Donc comment elle sait qui est le site hôte ? techniquement l'information elle passe par où ? avec quel cookie ?

Tout le monde comprend bien que les sites s'échangent leurs données pour suivre au mieux l'internaute.

Je souhaite ici comprendre comment cela se concrétise en terme de requête de fichier, urls et cookies.

Encore merci pour votre éclairage !

Lien vers le commentaire
Partager sur d’autres sites

le site que tu consultes a un accord avec la ou les régies publicitaires qui affichent les bandeaux et autres encarts, et c'est de cette manière que la régie publicitaire sait que tu es en train de consulter le site hôte

Qui se concrétise comment ?

Quand je fait la requête sur ad.jaimelapub.com pour recevoir l'encart de pub, je ne peux PAS envoyer un cookie relatif au site hôte.

Donc comment elle sait qui est le site hôte ? techniquement l'information elle passe par où ? avec quel cookie ?

Tout le monde comprend bien que les sites s'échangent leurs données pour suivre au mieux l'internaute.

Je souhaite ici comprendre comment cela se concrétise en terme de requête de fichier, urls et cookies.

Encore merci pour votre éclairage !

Je ne connais pas les détails techniques sur leurs échanges, mais je présume que ça se fait côté serveur, et là rien ne leur empêche d'établir une communication entre leurs SI respectifs, ou même très basiquement, le site hôte peut très bien - par le biais d'une simple requête HTTP, pas besoin de plus - envoyer en direct les infos te concernant à la régie publicitaire, qui en fait ce qu'elle en veut.

Je n'ai jamais eu à implémenter des fonctionnalités de ce type donc pour le côté technique ce ne sont que des idées, les premiers trucs qui me passent par la tête.

Lien vers le commentaire
Partager sur d’autres sites

Ok merci titou190, donc après des recherches j'ai trouvé un semblant d'explication technique :

Le site hôte (actugeniale.fr ) peut transmettre au site de tracking (d.click.com) le nom de la page actuelle visitée de 2 façons :

  • avec le referer : un élément d'une page web, même si récupéré d'un serveur d'un autre domaine, a comme referer la page qui le demande (cad la page affichée, la page hôte quoi). On peut désactiver cette fonction dans notre navigateur.
  • en paramètre dans l'URL comme tu l'as dit. Par exemple : htttp://d.click.com?ref=78542-economie/scandale:dsk_a_ken_laurence_parisot⊂=actugeniale_fr_reuters. Et là y a pas d'option dans le navigateur pour empêcher cette transmission, il faut une extension du genre ghostery ou autre (genre filtres adblock vie privée) qui pourront bloquer ces requêtes.

Après, effectivement ils peuvent s'interconnecter entre-eux s'il veulent mais c'est lourd, surtout pour le site hôte qui délègue ce système de tracking à des tiers avec des simples URL justement pour pas s'en occuper lui-même côté serveur.

Et en théorie donc le système de cookies reste bien cloisonné: chaque domaine a ses propres cookies. Donc techniquement le site hôte ne sait pas quels autres sites j'ai visité, même si tous les sites utilisent d.click.com, seul ce dernier a la vue complète sur ma navigation (après il donne/vend ces infos bien sûr).

Bon en pratique il y a des astuces pour voler des cookies, mais c'est un autre débat :transpi:

Voila, à ce que j'ai compris...

Plus d'infos : http://en.wikipedia.org/wiki/Web_bug

http://fr.wikipedia....9#Vol_de_cookie

Lien vers le commentaire
Partager sur d’autres sites

Salut à tous,

Donc techniquement le site hôte ne sait pas quels autres sites j'ai visité, même si tous les sites utilisent d.click.com, seul ce dernier a la vue complète sur ma navigation (après il donne/vend ces infos bien sûr).

Lorsqu'on suit un lien, non seulement l'URL de la page en cours sera transmise au site (ou page) destination, mais l'URL destination est également transmise au site en cours avant de le quitter; c'est ce qui permet au serveur HTTP du site en cours de fermer la session utilisateur (et autres...) si l'URL est de type externe (vers un autre site).

C'est ce que j'avais appris il y a quelques années. :fumer:

Cà s'applique au moins aux serveurs web en JSP qui marchent avec des "jsessionid" (qu'on voit certaines fois apparaitre dans l'URL d'un lien).

Pour les curieux (ou ceux qui croient encore qu'on est anonyme sur le net), il y a la démo ludique Vos traces sur le site de la CNIL qui donne un bon aperçu des données transmises. :reflechis:

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...