Aller au contenu

Google c'est has been

Featured Replies

Posté(e)

Bonjour,

je cherche a créé un moteur de recherche inter entreprise.

Je m'entend, le besoin est de faire une recherche de texte entre une 20aine de sites web contenant des SharePoint, des forum, des sites vitrines...

Sans avoir les sources des dis site.

Auriez vous une idée d'un outil ou d'un framework pour faire ca?

 

Merci beaucoup !!

Posté(e)

Je ne sais pas si ça conviendrait, mais il y avait un indexeur dans les années 1995 qui existe encore aujourd'hui (actualisé heureusement) : Copernic.

Je possède une licence de 1996 et une autre de 2017 :transpi:

Posté(e)
  • Auteur

Ouai sauf que dans mon cas c'est vraiment des sites web, pas accès aux sources ni à la bdd...

Posté(e)

C'est un outil de scraping qu'il te faudrait pour ça non ? Je n'en connais pas particulièrement, mais en cherchant un peu ça à l'air de se trouver facilement.

Posté(e)
  • Auteur
Il y a 20 minutes, cadegenere a écrit :

C'est un outil de scraping qu'il te faudrait pour ça non ? Je n'en connais pas particulièrement, mais en cherchant un peu ça à l'air de se trouver facilement.

Pas sur car le but c'est vraiment d'avoir un google like sur ces sites !^^

Posté(e)

Ben justement, je pense que la solution c'est de scraper tes sites, et ensuite d'indexer ce resultat (je pense qu'au format csv ou xml c'est plus facile à développer un "indexeur" non ?)

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.