Reconnaissance visuelle

#1 teledistant

Nouveau membre

Membres
9 messages

Posté 11 fÃ©vrier 2018 - 04:13

Bonjour,

à votre connaissance l'algorithme de reconnaissance visuelle le plus avancé à ce jour est-il capable de reconnaître une forme apprise à partir d'une seule image la contenant complètement, et cela indépendament de sa taille, même si ça doit mener à un défilement de l'image sur le champ de vision pour arriver à la perception de la forme entière, exactement comme l'homme et capable de le faire :ignat_02: ?

Retour en haut

#2 Jekert

Auteur

Modérateur
227 messages

Gender:Male

Posté 12 fÃ©vrier 2018 - 12:07

Salut,

Tu peux regarder du coté de YOLO (You Only Look Once) ou de TensorFlow (voir utiliser TensorFlow for Poets)

Mon blog ------ 101robotics.com

Ouvrage ----- Guide pour débuter avec Arduino

Ancien Blog -- Journal d'un Arduinaute

Retour en haut

#3 maximusk

Habitué

Membres
304 messages

Gender:Male
Location:Le Mans

Posté 12 fÃ©vrier 2018 - 05:39

Ça dépend de ce que tu veux dire par "une seule image la contenant complètement", j'ai un peu de mal à comprendre.
Mais si c'est bien ce que je pense (enregistrer une image propre, comme la couverture d'un livre, et pouvoir ensuite repérer la couverture de ce livre dans n'importe quel environnement) alors oui c'est possible. SIFT le fait, ORB, SURF, et pas mal d'autres aussi.

Retour en haut

#4 Oliver17

Pilier du forum

Modérateur
2â€¯758 messages

Gender:Male
Interests:Glenn

Posté 12 fÃ©vrier 2018 - 05:54

-->

Mon Tipeee

Retour en haut

#5 teledistant

Nouveau membre

Membres
9 messages

Posté 13 fÃ©vrier 2018 - 08:01

Re,

Yolo, TensorFlow et R-CNN si j'ai bien compris redimensionnent des parties d'intérêt de l'image pour ensuite les faire passer dans un réseau neuronal convolutif, j'ai l'impréssion que ces méthodes ne diffèrent pas beaucoup des CNN simples où il est nécessaire de redimensionner manuellement les images.

L'algorithme SIFT et d'autres basés dessus d'après ce que j'en ai compris ne supporte pas forcément bien les distorsions marqué de l'image et aurait des problèmes de généralisation des objets donc problème de classification.

Ça dépend de ce que tu veux dire par "une seule image la contenant complètement", j'ai un peu de mal à comprendre.
Mais si c'est bien ce que je pense (enregistrer une image propre, comme la couverture d'un livre, et pouvoir ensuite repérer la couverture de ce livre dans n'importe quel environnement) alors oui c'est possible. SIFT le fait, ORB, SURF, et pas mal d'autres aussi.

Par exemple je donne en entrée de l'algorithme une unique image d'un objet à reconnaître, ensuite j'agrandis l'image de telle façon que l'image ne puisse pas complètement être perçu par le champ de vision de l'algorithme de sorte que l'algorithme s'il veut s'assurer avec une bonne fiabilité que l'image est celle qu'il a apprise va devoir faire défiler l'image d'un endroit à un autre qui déterminera de lui même. L'algortihme n'a en conséquence pas toute l'information en une fois mais va devoir faire des liens dans le temps et l'espace pour reconnaître l'image.

Ce que je reproche principalement aux CNN c'est qu'ils considèrent deux objets identiques mais de tailles différentes présentés en entrée comme deux objets complètement différents en sortie. A priori le SIFT n'a pas ce défaut mais en contreparti perd tous les avantages du CNN.

Retour en haut

#6 teledistant

Nouveau membre

Membres
9 messages

Ceci adapté à un algorithme informatique serait plutôt intéressant https://ac.els-cdn.c...424bd50fb312750à " Translation and scale invariance"...

Retour en haut

#7 R1D1

Modérateur et Membre passionné

Modérateur
1â€¯212 messages

Gender:Male
Location:Autriche

Ce que je reproche principalement aux CNN c'est qu'ils considèrent deux objets identiques mais de tailles différentes présentés en entrée comme deux objets complètement différents en sortie. A priori le SIFT n'a pas ce défaut mais en contreparti perd tous les avantages du CNN.

https://arxiv.org/abs/1411.6369
https://www.quora.co...ariant-to-scale
https://www.scienced...031320316301224

R1D1 - Calculo Sed Ergo Sum -- en ce moment, M.A.R.C.E.L.
Avatar tiré du site bottlebot

Retour en haut

#1 teledistant

#2 Jekert

#3 maximusk

#4 Oliver17

#5 teledistant

#6 teledistant

#7 R1D1

0 utilisateur(s) li(sen)t ce sujet

Connexion