Aller au contenu


Photo
- - - - -

Reconnaissance visuelle


  • Veuillez vous connecter pour répondre
6 réponses à ce sujet

#1 teledistant

teledistant

    Nouveau membre

  • Membres
  • 9 messages

Posté 11 février 2018 - 04:13

Bonjour,

 

à votre connaissance l'algorithme de reconnaissance visuelle le plus avancé à ce jour est-il capable de reconnaître une forme apprise à partir d'une seule image la contenant complètement, et cela indépendament de sa taille, même si ça doit mener à un défilement de l'image sur le champ de vision pour arriver à la perception de la forme entière, exactement comme l'homme et capable de le faire :ignat_02: ?



#2 Jekert

Jekert

    Auteur

  • Modérateur
  • Pip
  • 227 messages
  • Gender:Male

Posté 12 février 2018 - 12:07

Salut,

 

Tu peux regarder du coté de YOLO (You Only Look Once) ou de TensorFlow (voir utiliser TensorFlow for Poets)


Mon blog  ------  101robotics.com

Ouvrage    -----  Guide pour débuter avec Arduino

Ancien Blog  --  Journal d'un Arduinaute


#3 maximusk

maximusk

    Habitué

  • Membres
  • PipPip
  • 304 messages
  • Gender:Male
  • Location:Le Mans

Posté 12 février 2018 - 05:39

Ça dépend de ce que tu veux dire par "une seule image la contenant complètement", j'ai un peu de mal à comprendre.
Mais si c'est bien ce que je pense (enregistrer une image propre, comme la couverture d'un livre, et pouvoir ensuite repérer la couverture de ce livre dans n'importe quel environnement) alors oui c'est possible. SIFT le fait, ORB, SURF, et pas mal d'autres aussi.

#4 Oliver17

Oliver17

    Pilier du forum

  • Modérateur
  • PipPipPipPipPip
  • 2 758 messages
  • Gender:Male
  • Interests:Glenn

Posté 12 février 2018 - 05:54


signature_01.png -->

 

Mon Tipeee
 


#5 teledistant

teledistant

    Nouveau membre

  • Membres
  • 9 messages

Posté 13 février 2018 - 08:01

Re,

 

Yolo, TensorFlow et R-CNN si j'ai bien compris redimensionnent des parties d'intérêt de l'image pour ensuite les faire passer dans un réseau neuronal convolutif, j'ai l'impréssion que ces méthodes ne diffèrent pas beaucoup des CNN simples où il est nécessaire de redimensionner manuellement les images.

 

L'algorithme SIFT et d'autres basés dessus d'après ce que j'en ai compris ne supporte pas forcément bien les distorsions marqué de l'image et aurait des problèmes de généralisation des objets donc problème de classification.

 

Ça dépend de ce que tu veux dire par "une seule image la contenant complètement", j'ai un peu de mal à comprendre.
Mais si c'est bien ce que je pense (enregistrer une image propre, comme la couverture d'un livre, et pouvoir ensuite repérer la couverture de ce livre dans n'importe quel environnement) alors oui c'est possible. SIFT le fait, ORB, SURF, et pas mal d'autres aussi.

 

Par exemple je donne en entrée de l'algorithme une unique image d'un objet à reconnaître, ensuite j'agrandis l'image de telle façon que l'image ne puisse pas complètement être perçu par le champ de vision de l'algorithme de sorte que l'algorithme s'il veut s'assurer avec une bonne fiabilité que l'image est celle qu'il a apprise va devoir faire défiler l'image d'un endroit à un autre qui déterminera de lui même. L'algortihme n'a en conséquence pas toute l'information en une fois mais va devoir faire des liens dans le temps et l'espace pour reconnaître l'image.

 

Ce que je reproche principalement aux CNN c'est qu'ils considèrent deux objets identiques mais de tailles différentes présentés en entrée comme deux objets complètement différents en sortie. A priori le SIFT n'a pas ce défaut mais en contreparti perd tous les avantages du CNN.



#6 teledistant

teledistant

    Nouveau membre

  • Membres
  • 9 messages

Posté 13 février 2018 - 01:11

Ceci adapté à un algorithme informatique serait plutôt intéressant https://ac.els-cdn.c...424bd50fb312750à " Translation and scale invariance"...



#7 R1D1

R1D1

    Modérateur et Membre passionné

  • Modérateur
  • PipPipPipPip
  • 1 211 messages
  • Gender:Male
  • Location:Autriche

Posté 13 février 2018 - 11:37

Ce que je reproche principalement aux CNN c'est qu'ils considèrent deux objets identiques mais de tailles différentes présentés en entrée comme deux objets complètement différents en sortie. A priori le SIFT n'a pas ce défaut mais en contreparti perd tous les avantages du CNN.


https://arxiv.org/abs/1411.6369
https://www.quora.co...ariant-to-scale
https://www.scienced...031320316301224
R1D1 - Calculo Sed Ergo Sum -- en ce moment, M.A.R.C.E.L.
Avatar tiré du site bottlebot




1 utilisateur(s) li(sen)t ce sujet

0 members, 1 guests, 0 anonymous users