récupérer l'objet DOM de gecko

Posté(e) le 16 octobre 200619 a

Bonjour à tous.

Ceci se situe à cheval entre la programmation et la création web. Mais comme cela relève plus du C++, j'ai choisi cette section.

Je cherche à récupérer l'objet DOM que forme Gecko après avoir analysé une page web avec son parser.

Sous Mozilla, il existe le DOM inspector. C'est une extension qui fournit l'arbre DOM d'une page. Cela me conviendrait s'il était possible d'obtenir simplement l'objet DOM sans lancer de browser et ainsi pouvoir mettre sur pieds une solution qui ne nécessite pas d'interface graphique. L'objectif serait de fournir, par exemple, un millier d'url et de récupérer une millier de DOM object via le parser html (ou xml, ou tous les parseurs nécessaires) de gecko.

Je ne sais pas s'il faut s'attarder sur la programmation XPCOM ou s'il faut attaquer direct le C++, donc à un niveau plus bas que xpcom. Je ne sais pas s'il faut recompiler tout mozilla (ou tout firefox) pour obtenir ce que je désire.

Avez-vous des pistes.

Tout élément de réponse (orienté windows ou linux) est susceptible de m'intéresser.

Merci

PS: peut être connaissez vous des endroits meilleur pour poser cette question. Je l'ai en tous cas posée sur le newsgroup mozilla.dev.tech.dom et je n'ai pas eu de réponse.

Citer

Posté(e) le 17 octobre 200619 a

tu as zieuté les sources de gecko ?

veux-tu forcément du parser de gecko, sinon, il existe bien des parser xml.

regarde du côté de TinyXML ( http://www.grinninglizard.com/tinyxmldocs/index.html ) qui te sors le DOM.

Citer

Connexion

récupérer l'objet DOM de gecko

Featured Replies

Archivé

Account

Navigation

Rechercher

Configure browser push notifications

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)