Aller au contenu

CBIR et RAO


Schpountz42

Messages recommandés

Salut à tous,

Je lance un appel pour savoir si certains d'entre vous connaitraient la recherche d'images par le contenue et les réponse d'appel d'offres.

Mon équipe et moi devons (pour notre fin de Master) répondre à un appel d'offres proposé par EADS sur un prototype d'interrogation et de recherche d'images...

Bon ok c'est un peu vague, mais nous n'avons pas encore le cahier des charges, seulement une présentation du sujet en diapo.

Je me demandais donc si vous pouviez me donner des voix à suivre sur ces domaines. A la fois pour la manipulation de contenue d'images mais aussi pour la réponse d'appel d'offres.

Conseils, liens... tout est le bienvenue car nous sommes déjà en recherche de docs mais le sujet n'a pas l'air très courant.

Nous sommes en concurrence avec d'autres équipes de mon master pour gagner la maitrise d'œuvre (qui s'occupera ensuite de diriger les autres équipes dans le projet) si grâce à vous je gagne la MOE, je vous promets de prendre un abo de 2 ans :love:

Merci d'avance les INpactiens.

Note : J'ai placé ce sujet dans la partie Web car le projet est censé être un moteur de recherche, mais je ne suis pas sûr que ca soit sa place...

Lien vers le commentaire
Partager sur d’autres sites

Ah voilà qui est intéressant !

Dans le CBIR, on distingue principalement trois types de paradigmes (tirés d'un papier de Smeulders de la fin des 90s) :

- la recherche de cible

- la recherche interactive

- la recherche de catégorie

Dans la recherche de cible, l'utilisateur est intéressé par une image en particulier, par exemple la photo du poulpe désignant l'espagne vainqueur contre l'allemagne dans la coupe du monde. La collection d'image peut contenir n'importe quelle altération de cette photo (noir et blanc, cropée, effet mirroir, bruit, etc), et le but est de retrouver ces copies (on parle de duplicate search) dans la base.

Dans la recherche interactive, l'objet de la recherche n'est pas connu et est plutôt flou. L'utilisateur l'affine par interaction avec le système : il indique quelles sont les images qui lui plaisent, et le système se met à jour pour lui en présenter de nouvelles.

Dans la recherche de catégories, l'utilisateur est intéressé par une catégorie sémantique particulière, par exemple les voitureS.

C'est très important de déterminer le type de recherche sur lequel porte l'appel, car cela détermine totalement les outils mis en oeuvre par la suite.

Quelque soit le type de recherche, un moteur CBIR fonctionne en deux parties :

- Une partie offline qui consiste en plein de prétraitement et de mise en forme des données

- Une partie online, qui consiste à répondre à la requête de l'utilisateur.

Dans la partie offline, on distingue trois parties en général :

- l'extraction de caractéristiques visuelles

- la construction de signatures qui vont permettre de représenter les image par les caractéristiques extraites

- l'indexation des signatures afin de faciliter la recherche dans la base

La partie online dépend du type de recherche, dans les cas 1 et 3, il s'agit souvent de trois étapes :

- la construction d'une signature requête

- l'intérogation de la base afin de récupérer les signatures (donc les images) correspondant à la requête (similaire à la requête)

- l'affichage des résultats, c'est à dire un tri

Dans le cas interactif, on rajoute en plus une étape, qu'on appel bouclage de pertinence, qui consiste à faire annoter des résultats à l'utilisateur, afin d'affiner la requête. On itère donc entre les trois étapes décrites précédemment et l'étape d'annotation.

Les points clés une fois qu'on a déterminé le type de recherche, c'est :

1° le type de caractéristiques (quelle description :points d'intérêts, régions, globale, quelle information : couleur, texture, contour, forme, etc)

2° le type de signature (un vecteur, une liste de vecteur, un sac de vecteur, etc)

3° le type de requête (recherche par similarité, fonction de classification, fonction de ranking, apprentissage interactif, etc)

Si tu veux de la doc pour te mettre dans le bain, le mieux est de lire le papier de Smeulders : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.136.4303

Il commence a être un peu vieux, mais c'est un super point d'entrée. Si tu veux de la biblio plus récente (mais plus spécialisée) par la suite, je peux t'en donner ;)

:yes:

Lien vers le commentaire
Partager sur d’autres sites

Salut Lorinc,

je fais partie de l'équipe de Schpountz42 et je suis chargé de récupérer un max de donnée sur la gestion (manipulation) de contenu d'image.

Merci pour ces infos fort utiles, notamment en ce qui concerne les 3 types de paradigmes.

(pour l'instant le sujet est laissé, exprès, vague. Nous sommes dans une phase de recherche "générale" afin de comprendre ce qui se cache dans le monde mystérieux et fantastique des "CBIR")

Il y a bien quelques infos sur la toile. Mais les données accessibles restent un peu trop générales à mon sens.

(les grandes lignes, la formule de maths qui va bien mais on sait pas trop ce qu'elle permet de faire exactement)

Histoire de "bien se mettre dans le bain", je vais jeter un ptit coup d'œil au "papier de Smeulders" que tu nous as gentiment partagé.

On aura peut-être, voire certainement besoin de tes services prochainement (peut-être des biblios plus spécialisées, ou si tu connais des outils

open source qui permettent de manipuler des contenues d'images ....)

Mais ne mettons pas la charrue avant les bœufs, Avant il faudra que l'on ait + de précisions sur le sujet du projet.

Merci bien :chinois:

Lien vers le commentaire
Partager sur d’autres sites

ton domaine de recherche... donc dès que j'ai le cahier des charges, je te chope à plein temps!!! :iloveyou: :iloveyou: :iloveyou:

Je veux pas te mettre la pression, mais tout notre avenir dépend de toi!!! :-D :copain: :inpactforce:

(Je suis à la limite de la Titiatitude...)

N'oublions pas, si tu me fais gagner la MOE, je prend un abo de 2 ans et tu participes donc aux finances de PCI :transpi:

Juste par curiosité, quelqu'un sait ce que WebLab permet avec les CBIR?

Comme le montre la présentation, c'est conseiller de l'utiliser (mais pas imposer si vous avez mieux à me proposer..).

On a déjà commencé à regarder ce que WebLab permet, mais c'est ÉNORME et on aura pas le temps de voir tout ce qu'il permet...

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...