Aller au contenu

Les prix pour un comparateur


Messages recommandés

J'ai un ancien collègue qui a bossé chez kelkoo.com. Il m'avait expliqué que ça marchait sur le principe d'un aspirateur de site, et avec des expressions régulières il récupérait le prix en fonction de l'architecture du site. Par exemple, pour un site donné, les prix étaient toujours entre des balises <div id="prix"></div>, donc il parsait le contenu html de la page, récupérait le prix et l'injectait dans sa base de données.

Maintenant, je sais pas si ça se fait encore comme ça.

Lien vers le commentaire
Partager sur d’autres sites

La technique de l'aspirateur de site, aka scraping, est une solution certes naïve mais qui fonctionne très bien. Elle pose néanmoins le problème de la mise à jour des données, l'obligation d'analyser le contenu des pages et de redéfinir la façon de reconnaitre le contenu pour chaque nouveau site et site mis à jour. Surtout si le code utilisé pour afficher un article contient trop peu d'éléments sémantiques.

J'ose imaginer qu'aujourd'hui, la plupart du temps, on utilise des API pour que la correspondance site comparatif <-> site marchant soit toujours à jour tout en coutant moins cher. Bien évidemment, ça doit impliquer un accord entre le comparateur et le fournisseur de données, vu qu'il y a des choses à installer chez lui.

Après, à savoir s'il y a une façon à peu près normalisée de faire ou si tout le monde a sa propre API...

Lien vers le commentaire
Partager sur d’autres sites

merci pour toute ces réponses

pour vous expliquer plus en détails pourquoi j'ai demandé cela c'est que j'ai un projet de groupe dans mon école d'ingénieur et l'entreprise partenaire veut que mon équipe créer un comparateur de site et étant celui qui code le php je voulais savoir si les prix étaient facilement récupérable

merci beaucoup tout le monde :p

si d'autres avis, réponses vous viennent n'hésitez pas ;)

Lien vers le commentaire
Partager sur d’autres sites

J'ose imaginer qu'aujourd'hui, la plupart du temps, on utilise des API pour que la correspondance site comparatif <-> site marchant soit toujours à jour tout en coutant moins cher. Bien évidemment, ça doit impliquer un accord entre le comparateur et le fournisseur de données, vu qu'il y a des choses à installer chez lui.

Après, à savoir s'il y a une façon à peu près normalisée de faire ou si tout le monde a sa propre API...

Généralement cela se fait via des flux XML, SOAP ou des webservices :smack:

Lien vers le commentaire
Partager sur d’autres sites

  • 3 semaines après...

Je suis justement en train de travailler sur un site de cet ordre.

Les prix que je veux récupéré provenant de petit site, rarement mis à jour et donc l'architecture ne change presque jamais, j'ai choisi la méthode de l'aspiration.

Certes chaque site est différent mais une fois mis en place les fonctions de découpages et d'affichage correspondant aux différentes tarification des sites, il suffit d'adapter les valeurs et ce n'est pas forcément long.

Je pense aussi ajouter une fonction de détection des changements dans les pages aspirés. Ainsi je pourrai éventuellement désactivé le site modifié dans le comparateur et être averti rapidement pour au moins vérifier que tout est en ordre.

Ceci dit, si tu travailles avec de gros sites dont les prix changes régulièrement, je pense que cette méthode est à éviter car à mon avis trop sensible au changement.

Bon courage.

Lien vers le commentaire
Partager sur d’autres sites

  • 1 an après...

Bon je sais que c'est un vieux topic :oops: , mais je pense qu'il est intéressant et que ca pourrait intéresser de savoir comment c'est géré.

Donc ca serait effectivement bien d'avoir une réponse de la part du gérant de PrixDuNet (en effet je crois bien que c'est Kenji), par exemple. Je pense bien que c'est par accès à une base de données, mais plus de détails de la part de personnes connaissant le vrai fonctionnement seraient super bien venus!

:smack:

Lien vers le commentaire
Partager sur d’autres sites

Le gérant n'est pas développeur du site :p;)http://www.pcinpact.com/apropos.php

En gros Teuf & T'oeuch sont les gérants de la société qui emploie notamment kenji pour le développement.

Pour ce qui est de la question posée ici, les données (produits, caractéristiques associées, prix, ...) sont fournies par AchetezFacile (groupe Clubic = M6).

Après les moyens techniques mis en place pour la transmission de ces données ne sont pas forcément "communicables" ... et d'ailleurs ça ne vous aidera pas mieux pour utiliser PdN :p

PS : il vaut mieux poser ce genre de questions directement aux INtéressés (MP / email), plutôt que dans cette section. D'autre part, la section Vie INpactienne serait peut être plus adéquate.

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...