1. Reconnaissance d'activités humaines par un robot humanoïde à partir de séquences vidéo
- Author
-
Mounim A. El Yacoubi, Huilong He, Fabien Roualdes, Mouna Selmi, Bernadette Dorizzi, Département Electronique et Physique (EPH), Institut Mines-Télécom [Paris] (IMT)-Télécom SudParis (TSP), Traitement de l'Information Pour Images et Communications (TIPIC-SAMOVAR), Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux (SAMOVAR), Institut Mines-Télécom [Paris] (IMT)-Télécom SudParis (TSP)-Institut Mines-Télécom [Paris] (IMT)-Télécom SudParis (TSP), Centre National de la Recherche Scientifique (CNRS), and Télécom SudParis & Institut Mines-Télécom Business School, Médiathèque
- Subjects
Apprentissage statistique ,Traitement d’images ,Activités humaines quotidiennes ,Robotique ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,[SPI.SIGNAL] Engineering Sciences [physics]/Signal and Image processing ,Reconnaissance par la vision - Abstract
National audience; Nous présentons dans ce papier, un système de vision, intégré dans le robot Nao pour la reconnaissance d'activités humaines réalisées par une personne dans des conditions réelles. Contrairement à une caméra fixe, le robot considéré peut filmer les activités à des endroits différents, ce qui implique qu'il doit opérer dans des conditions plus complexes, relativement aux fonds de scènes, aux conditions d'éclairage, aux angles de vues, et aux distances du robot par rapport à la personne. Le système développé est fondé sur l'extraction de trajectoires de points d'intérêt spatio-temporels uniformément et densément échantillonnés sur la scène, et l'encodage de ceux-ci par des histogrammes de gradients sur des volumes définis par leurs trajectoires. La représentation ainsi obtenue est ensuite transformée en un " sac de mots " (Bag of Words) qui est ensuite classifié par un SVM (Support Vector Machines). Ce système a été implémenté dans le robot Nao et testé dans des conditions réelles en considérant onze activités humaines. Les performances obtenues sont satisfaisantes dans l'ensemble, spécialement au regard des contraintes d'implémentation et de ressources de calcul