Back to Search Start Over

De l'importance des actions : assignation de crédit et interprétabilité pour l'apprentissage par renforcement

Authors :
Ferret, Johan
Inria Lille - Nord Europe
Institut National de Recherche en Informatique et en Automatique (Inria)
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL)
Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)
Université de Lille
Philippe Preux
Olivier Pietquin
Source :
Artificial Intelligence [cs.AI]. Université de Lille, 2022. English. ⟨NNT : 2022ULILB018⟩
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

This thesis, written for the qualification of Doctor of Philosophy in Computer Science, studies the question of the individual importance of actions in sequential decision-making, through the lens of Reinforcement Learning, and with diverse applications.An important finding of this work is that two seemingly different open problems in Reinforcement Learning, namely the credit assignment problem and explainability, have partial solutions that involve similar tools that can all be viewed as the estimation of particular forms of action importance.Several algorithms that suit different forms of action importance are proposed and studied from a theoretical point of view, empirically, or both.; Cette thèse, écrite pour l'obtention du doctorat en Informatique, étudie la question de l'importance individuelle des actions dans la prise de décision séquentielle, via le prisme de l'Apprentissage par Renforcement, avec diverses applications.Une découverte importante de ce travail est que deux problèmes ouverts en apparence distincts en Apprentissage par Renforcement, à savoir le problème d'assignation de crédit et l'interprétabilité, ont des solutions partielles qui impliquent des outils communs qui peuvent être vus comme des estimations de formes particulières d'importance des actions.Des algorithmes qui correspondent à des formes distinctes d'importance des actions sont proposées et étudiées empiriquement, d'un point de vue plus théorique, ou les deux.

Details

Language :
English
Database :
OpenAIRE
Journal :
Artificial Intelligence [cs.AI]. Université de Lille, 2022. English. ⟨NNT : 2022ULILB018⟩
Accession number :
edsair.dedup.wf.001..3be651b89465c9fb86259dd60f7f6ab4