Ten, Alexandr, STAR, ABES, Flowing Epigenetic Robots and Systems (Flowers), Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Université de Bordeaux, Pierre-Yves Oudeyer, and Jacqueline Gottlieb
Intrinsic motivation – the desire to do things for their inherent joy and pleasure – has received its first share of scientific attention over 70years ago, ever since we saw monkeys solving puzzles for free. Since then, research on intrinsic motivation has been steadily gaining momentum. We have come to understand, in the context of learning and discovery, that intrinsic motivation (namely, intrinsically motivated information-seeking) is foundational for the biological and technological success of our species. But where does intrinsic motivation to learn and seek information come from? Today, with the thriving synergy between perpetually advancing fields of psychology, neuroscience, and computer science, we are well positioned to investigate this question. The Learning Progress Hypothesis (LPH) proposes that humans are motivated by feelings of and/or beliefs about progress in knowledge (including progress in competence). In artificial learners, progressbased intrinsic motivation enables autonomous exploration of the environment (including the agent’s own body), resulting in better performance, more efficient learning, and richer skill sets. Due to similar computational challenges facing artificial and biological learners, researchers have proposed that progress-based intrinsic motivation might have evolved in humans to help us transition from babies with few skills and little knowledge to knowledgeable grownups capable of performing many sophisticated tasks. The Learning Progress Hypothesis (LPH) is attractive, not only because it is consistent with several studies of human curiosity, but also because it resonates with existing theories on metacognitive self-regulation in learning. However, the LPH has not been extensively studied using behavioral experimentation.This thesis provides an empirical examination of the LPH. We introduce a novel experimental paradigm where participants explore multiple learning activities, some easy, others difficult. The activities involve guessing the binary category of randomly presented stimuli. To let their intrinsic motivation shine, we did not provide any material incentives encouraging specific behaviors or strategies – we simply observed which activities people engaged in and how their knowledge about these activities unfolded over time. We present statistical analyses and a computational model that support the LPH.This thesis also suggests ideas for future investigations into progressbased motivation. These ideas are inspired by a pilot study in which we asked participants to practice a naturalistic sensorimotor skill (a video game) over the course of 3 sessions spanning 5 days. [...]We conclude the thesis with an extended discussion of our findings, where we examine some limitations of our experiments and propose promising future steps. In summary, we believe the behavioral paradigms introduced in this thesis should be reused to not only replicate our results, but also to advance the scientific research of intrinsically motivated information-seeking., La motivation intrinsèque - le désir de faire les choses pour la joie et le plaisir inhérent qu’ils procurent - a suscité l’intérêt des chercheurs pour la première fois il y a plus de 70 ans, en voyant des singes résoudre des énigmes gratuitement. Depuis, la recherche sur la motivation intrinsèque n’a cessé de prendre de l’ampleur. Dans le contexte de l’apprentissage et des comportements de découverte, il est aujourd’hui entendu , que la motivation intrinsèque (c’est-à-dire la recherche intrinsèquement motivée d’informations) est fondamentale au progrès biologique et technologique de notre espèce. Mais d’où vient la motivation intrinsèque pour apprendre et pour rechercher des informations ? Aujourd’hui, avec la synergie florissante entre les domaines en constante évolution de la psychologie, des neurosciences et de l’informatique, nous sommes en capacité d’étudier cette question.L’hypothèse de progrès d’apprentissage (Learning Progress Hypothesis,ou LPH en anglais) propose que les humains sont motivés par leurs sentiments et/ou croyances relatifs à leurs progrès de connaissances (y compris les progrès dans les compétences). Chez les apprenants artificiels, la motivation intrinsèque basée sur le progrès d’apprentissage permet une exploration autonome de l’environnement (y compris le propre corps de l’agent), ce qui se traduit par de meilleures performances, un apprentissage plus efficace et un ensemble de compétences plus riches. En raison des défis informatiques similaires auxquels sont confrontés les apprenants artificiels et biologiques, des chercheurs ont proposé que la motivation intrinsèque basée sur le progrès ait pu évoluer chez l’Homme, pour nous aider à passer de bébés avec peu de compétences et peu de connaissances, à des adultes bien informés capables d’effectuer de nombreuses tâches sophistiquées. La LPH est attrayante, non seulement parce qu’elle est cohérente avec plusieurs études sur la curiosité humaine, mais aussi parce qu’elle résonne avec les théories existantes sur l’autorégulation métacognitive dans l’apprentissage. Cependant, la LPH n’a pas été largement étayée par l’expérimentation comportementale. Cette thèse propose un examen empirique de la LPH. Nous introduisons un nouveau paradigme expérimental où les participants explorent plusieurs activités d’apprentissage, certaines faciles, d’autres difficiles. Les activités consistent à deviner la catégorie binaire de stimuli présentés au hasard. Pour laisser briller leur motivation intrinsèque, nous n’avons fourni aucune incitation matérielle encourageant des comportements ou des stratégies spécifiques - nous avons simplement observé dans quelles activités les personnes s’engageaient et comment leurs connaissances sur ces activités se développaient au fil du temps. Nous présentons des analyses statistiques et un modèle de calcul prenant en charge la LPH.[...]. Nous concluons la thèse par une discussion approfondie de nos résultats, où nous examinons certaines limites de nos expériences et proposons des étapes futures prometteuses. En résumé, nous pensons que les paradigmes comportementaux introduits dans cette thèse devraient être réutilisés non seulement pour reproduire nos résultats,mais aussi pour faire avancer la recherche scientifique sur la recherche d’informations intrinsèquement motivée.