1. Multicriteria reinforcement learning based on a russian doll method for network routing
- Author
-
Alain Petrowski, Ilham Benyahia, Sebastien Houcke, Farouk Aissanou, Télécom Bretagne, Bibliothèque, Département Réseaux et Services Multimédia Mobiles (RS2M), Institut Mines-Télécom [Paris] (IMT)-Télécom SudParis (TSP), Laboratoire de recherche en sécurité informatique (LRSI), Université du Québec en Outaouais (UQO), Lab-STICC_TB_CACS_COM, Laboratoire des sciences et techniques de l'information, de la communication et de la connaissance (UMR 3192) (Lab-STICC), Université européenne de Bretagne - European University of Brittany (UEB)-Université de Bretagne Sud (UBS)-Université de Brest (UBO)-Institut Brestois du Numérique et des Mathématiques (IBNM), Université de Brest (UBO)-Télécom Bretagne-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS)-Université européenne de Bretagne - European University of Brittany (UEB)-Université de Bretagne Sud (UBS)-Université de Brest (UBO)-Institut Brestois du Numérique et des Mathématiques (IBNM), Université de Brest (UBO)-Télécom Bretagne-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS), Département Signal et Communications (SC), Université européenne de Bretagne - European University of Brittany (UEB)-Télécom Bretagne-Institut Mines-Télécom [Paris] (IMT), Département Réseaux et Services Multimédia Mobiles ( RS2M ), Institut Mines-Télécom [Paris]-Télécom SudParis ( TSP ), Laboratoire de recherche en sécurité informatique ( LRSI ), Université du Québec en Outaouais ( UQO ), Laboratoire des sciences et techniques de l'information, de la communication et de la connaissance (UMR 3192) ( Lab-STICC ), Université européenne de Bretagne ( UEB ) -Université de Bretagne Sud ( UBS ) -Université de Brest ( UBO ) -Télécom Bretagne-Institut Brestois du Numérique et des Mathématiques ( IBNM ), Université de Brest ( UBO ) -Institut Mines-Télécom [Paris]-Centre National de la Recherche Scientifique ( CNRS ) -Université européenne de Bretagne ( UEB ) -Université de Bretagne Sud ( UBS ) -Université de Brest ( UBO ) -Télécom Bretagne-Institut Brestois du Numérique et des Mathématiques ( IBNM ), Université de Brest ( UBO ) -Institut Mines-Télécom [Paris]-Centre National de la Recherche Scientifique ( CNRS ), Département Signal et Communications ( SC ), and Université européenne de Bretagne ( UEB ) -Télécom Bretagne-Institut Mines-Télécom [Paris]
- Subjects
Mathematical optimization ,Computer science ,Wireless ad hoc network ,business.industry ,Pareto principle ,Mobile computing ,020206 networking & telecommunications ,02 engineering and technology ,[ SPI.SIGNAL ] Engineering Sciences [physics]/Signal and Image processing ,16. Peace & justice ,Multiple-criteria decision analysis ,IDMA ,Multi-objective optimization ,Chebyshev distance ,Russian doll routing ,0202 electrical engineering, electronic engineering, information engineering ,Reinforcement learning ,020201 artificial intelligence & image processing ,Minification ,Artificial intelligence ,business ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,Routing ,[SPI.SIGNAL] Engineering Sciences [physics]/Signal and Image processing - Abstract
International audience; The routing in communication networks is typically a multicriteria decision making (MCDM) problem. However, setting the parameters of most used MCDM methods to fit the preferences of a decision maker is often a difficult task. A Russian doll method able to choose the best multicriteria solution according to a context defined beforehand is proposed. This context is given by a set of nested boxes in the criteria space, the shapes of which can be established from objective facts such as technical standards, technical specifications, etc. This kind of method is well suited for self-adaptive systems because it is designed to be able to give pertinent results without interaction with a decision maker, whatever the Pareto front. The Russian doll multicriteria decision method is used with a reinforcement learning to optimize the routing in a mobile ad-hoc network. The results on a case study show that the routing can be finely controlled because of the possibility to include as much parameters as desired to adjust the search of the best solution on Pareto fronts a priori unknown. These results are clearly better than those obtained with the optimization of a weighted sum or the minimization of a Chebyshev distance to a reference point.
- Published
- 2010