latlanh Posted February 12, 2018 Share Posted February 12, 2018 Bonjour, je cherche a créé un moteur de recherche inter entreprise. Je m'entend, le besoin est de faire une recherche de texte entre une 20aine de sites web contenant des SharePoint, des forum, des sites vitrines... Sans avoir les sources des dis site. Auriez vous une idée d'un outil ou d'un framework pour faire ca? Merci beaucoup !! Link to comment Share on other sites More sharing options...
Aloyse57 Posted February 13, 2018 Share Posted February 13, 2018 Je ne sais pas si ça conviendrait, mais il y avait un indexeur dans les années 1995 qui existe encore aujourd'hui (actualisé heureusement) : Copernic. Je possède une licence de 1996 et une autre de 2017 Link to comment Share on other sites More sharing options...
latlanh Posted February 13, 2018 Author Share Posted February 13, 2018 Ouai sauf que dans mon cas c'est vraiment des sites web, pas accès aux sources ni à la bdd... Link to comment Share on other sites More sharing options...
cadegenere Posted February 13, 2018 Share Posted February 13, 2018 C'est un outil de scraping qu'il te faudrait pour ça non ? Je n'en connais pas particulièrement, mais en cherchant un peu ça à l'air de se trouver facilement. Link to comment Share on other sites More sharing options...
latlanh Posted February 13, 2018 Author Share Posted February 13, 2018 Il y a 20 minutes, cadegenere a écrit : C'est un outil de scraping qu'il te faudrait pour ça non ? Je n'en connais pas particulièrement, mais en cherchant un peu ça à l'air de se trouver facilement. Pas sur car le but c'est vraiment d'avoir un google like sur ces sites !^^ Link to comment Share on other sites More sharing options...
cadegenere Posted February 13, 2018 Share Posted February 13, 2018 Ben justement, je pense que la solution c'est de scraper tes sites, et ensuite d'indexer ce resultat (je pense qu'au format csv ou xml c'est plus facile à développer un "indexeur" non ?) Link to comment Share on other sites More sharing options...
Recommended Posts
Archived
This topic is now archived and is closed to further replies.