Back to Search Start Over

Bandits manchots avec échantillonnage de Thompson pour des recommandations multiples suivant un modèle fondé sur les positions

Authors :
Gauthier, Camille-Sovanneary
Gaudel, Romaric
Fromont, Elisa
Large Scale Collaborative Data Mining (LACODAM)
Inria Rennes – Bretagne Atlantique
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7)
Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Université de Bretagne Sud (UBS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1)
Université de Rennes (UNIV-RENNES)-CentraleSupélec-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Bretagne Sud (UBS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)
Centre de Recherche en Économie et Statistique (CREST)
Ecole Nationale de la Statistique et de l'Analyse de l'Information [Bruz] (ENSAI)-École polytechnique (X)-École Nationale de la Statistique et de l'Administration Économique (ENSAE Paris)-Centre National de la Recherche Scientifique (CNRS)
Ecole Nationale de la Statistique et de l'Analyse de l'Information [Bruz] (ENSAI)
Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Source :
CAp 2020-Conférence sur l'Apprentissage automatique, CAp 2020-Conférence sur l'Apprentissage automatique, Jun 2020, Vannes, France. pp.1-2
Publication Year :
2020
Publisher :
HAL CCSD, 2020.

Abstract

International audience; Les systèmes de recommandation en ligne ont pour but de proposer les produits les plus intéressantsaux positions adéquates sur une page internet. Nous présentons un nouvel algorithme, PB-MHB, permettant de faire des recommandations multiples en ligne en suivant un modèle fondé sur les positions. Cet algorithme s’appuie sur le principe des bandits manchots et utilise un échantillonnage de Thompson couplé avec un algorithme de Metropolis-Hastings pour tirer les paramètres des lois probabilistes utilisées, ce qui n’avait jamais été fait dans le contexte d’un modèle basé positions. Notre méthode ne nécessite pas d’avoir en paramètre les probabilités de vue des utilisateurs sur chaque position de la page Web, comme cela est usuellement le cas pour les algorithmes répondant à ce type d’interaction. Celles-ci sont d’ailleurs en pratique difficile à obtenir a priori. Les expériences faites sur des données simulées et sur des données issues de bases de données réelles (KDD-CUP2012 et Yandex) montrent que notre méthode, avec moins d’information, fournit de meilleurs recommandations que l’état de l’art.

Details

Language :
English
Database :
OpenAIRE
Journal :
CAp 2020-Conférence sur l'Apprentissage automatique, CAp 2020-Conférence sur l'Apprentissage automatique, Jun 2020, Vannes, France. pp.1-2
Accession number :
edsair.dedup.wf.001..525e043fb21acccb299d6fe29b5396a9