mikemowgli Posté(e) le 16 octobre 2006 Partager Posté(e) le 16 octobre 2006 Bonjour à tous. Ceci se situe à cheval entre la programmation et la création web. Mais comme cela relève plus du C++, j'ai choisi cette section. Je cherche à récupérer l'objet DOM que forme Gecko après avoir analysé une page web avec son parser. Sous Mozilla, il existe le DOM inspector. C'est une extension qui fournit l'arbre DOM d'une page. Cela me conviendrait s'il était possible d'obtenir simplement l'objet DOM sans lancer de browser et ainsi pouvoir mettre sur pieds une solution qui ne nécessite pas d'interface graphique. L'objectif serait de fournir, par exemple, un millier d'url et de récupérer une millier de DOM object via le parser html (ou xml, ou tous les parseurs nécessaires) de gecko. Je ne sais pas s'il faut s'attarder sur la programmation XPCOM ou s'il faut attaquer direct le C++, donc à un niveau plus bas que xpcom. Je ne sais pas s'il faut recompiler tout mozilla (ou tout firefox) pour obtenir ce que je désire. Avez-vous des pistes. Tout élément de réponse (orienté windows ou linux) est susceptible de m'intéresser. Merci PS: peut être connaissez vous des endroits meilleur pour poser cette question. Je l'ai en tous cas posée sur le newsgroup mozilla.dev.tech.dom et je n'ai pas eu de réponse. Lien vers le commentaire Partager sur d’autres sites More sharing options...
lorinc Posté(e) le 17 octobre 2006 Partager Posté(e) le 17 octobre 2006 tu as zieuté les sources de gecko ? veux-tu forcément du parser de gecko, sinon, il existe bien des parser xml. regarde du côté de TinyXML ( http://www.grinninglizard.com/tinyxmldocs/index.html ) qui te sors le DOM. Lien vers le commentaire Partager sur d’autres sites More sharing options...
Messages recommandés
Archivé
Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.