Jump to content

récupérer l'objet DOM de gecko


Recommended Posts

Bonjour à tous.

Ceci se situe à cheval entre la programmation et la création web. Mais comme cela relève plus du C++, j'ai choisi cette section.

Je cherche à récupérer l'objet DOM que forme Gecko après avoir analysé une page web avec son parser.

Sous Mozilla, il existe le DOM inspector. C'est une extension qui fournit l'arbre DOM d'une page. Cela me conviendrait s'il était possible d'obtenir simplement l'objet DOM sans lancer de browser et ainsi pouvoir mettre sur pieds une solution qui ne nécessite pas d'interface graphique. L'objectif serait de fournir, par exemple, un millier d'url et de récupérer une millier de DOM object via le parser html (ou xml, ou tous les parseurs nécessaires) de gecko.

Je ne sais pas s'il faut s'attarder sur la programmation XPCOM ou s'il faut attaquer direct le C++, donc à un niveau plus bas que xpcom. Je ne sais pas s'il faut recompiler tout mozilla (ou tout firefox) pour obtenir ce que je désire.

Avez-vous des pistes.

Tout élément de réponse (orienté windows ou linux) est susceptible de m'intéresser.

Merci

PS: peut être connaissez vous des endroits meilleur pour poser cette question. Je l'ai en tous cas posée sur le newsgroup mozilla.dev.tech.dom et je n'ai pas eu de réponse.

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Create New...