Jump to content
latlanh

Google c'est has been

Publications recommandées

Bonjour,

je cherche a créé un moteur de recherche inter entreprise.

Je m'entend, le besoin est de faire une recherche de texte entre une 20aine de sites web contenant des SharePoint, des forum, des sites vitrines...

Sans avoir les sources des dis site.

Auriez vous une idée d'un outil ou d'un framework pour faire ca?

 

Merci beaucoup !!

Partager cette publication


Link to post
Share on other sites

Je ne sais pas si ça conviendrait, mais il y avait un indexeur dans les années 1995 qui existe encore aujourd'hui (actualisé heureusement) : Copernic.

Je possède une licence de 1996 et une autre de 2017 :transpi:

Partager cette publication


Link to post
Share on other sites

Ouai sauf que dans mon cas c'est vraiment des sites web, pas accès aux sources ni à la bdd...

Partager cette publication


Link to post
Share on other sites

C'est un outil de scraping qu'il te faudrait pour ça non ? Je n'en connais pas particulièrement, mais en cherchant un peu ça à l'air de se trouver facilement.

Partager cette publication


Link to post
Share on other sites
Il y a 20 minutes, cadegenere a écrit :

C'est un outil de scraping qu'il te faudrait pour ça non ? Je n'en connais pas particulièrement, mais en cherchant un peu ça à l'air de se trouver facilement.

Pas sur car le but c'est vraiment d'avoir un google like sur ces sites !^^

Partager cette publication


Link to post
Share on other sites

Ben justement, je pense que la solution c'est de scraper tes sites, et ensuite d'indexer ce resultat (je pense qu'au format csv ou xml c'est plus facile à développer un "indexeur" non ?)

Partager cette publication


Link to post
Share on other sites

Veuillez vous connecter pour commenter

Vous serez en mesure de laisser un commentaire après vous être connecté



Se connecter dès maintenant

×