Back to Search Start Over

PAC-Bayesian High Dimensional Bipartite Ranking

Authors :
Sylvain Robbiano
Benjamin Guedj
MOdel for Data Analysis and Learning (MODAL)
Inria Lille - Nord Europe
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Paul Painlevé - UMR 8524 (LPP)
Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Evaluation des technologies de santé et des pratiques médicales - ULR 2694 (METRICS)
Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-École polytechnique universitaire de Lille (Polytech Lille)-Université de Lille, Sciences et Technologies
Department of Statistical Science
University College of London [London] (UCL)
CNRS
Université de Lille
Laboratoire Paul Painlevé [LPP]
Laboratoire Paul Painlevé (LPP)
Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Sciences et Technologies-Inria Lille - Nord Europe
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Evaluation des technologies de santé et des pratiques médicales - ULR 2694 (METRICS)
Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-École polytechnique universitaire de Lille (Polytech Lille)
Source :
Journal of Statistical Planning and Inference, Journal of Statistical Planning and Inference, Elsevier, 2018, ⟨10.1016/j.jspi.2017.10.010⟩, Journal of Statistical Planning and Inference, 2018, ⟨10.1016/j.jspi.2017.10.010⟩
Publication Year :
2018
Publisher :
HAL CCSD, 2018.

Abstract

International audience; This paper is devoted to the bipartite ranking problem, a classical statistical learning task, in a high dimensional setting. We propose a scoring and ranking strategy based on the PAC-Bayesian approach. We consider nonlinear additive scoring functions, and we derive non-asymptotic risk bounds under a sparsity assumption. In particular, oracle inequalities in probability holding under a margin condition assess the performance of our procedure, and prove its minimax optimality. An MCMC-flavored algorithm is proposed to implement our method, along with its behavior on synthetic and real-life datasets.

Details

Language :
English
ISSN :
03783758 and 18731171
Database :
OpenAIRE
Journal :
Journal of Statistical Planning and Inference, Journal of Statistical Planning and Inference, Elsevier, 2018, ⟨10.1016/j.jspi.2017.10.010⟩, Journal of Statistical Planning and Inference, 2018, ⟨10.1016/j.jspi.2017.10.010⟩
Accession number :
edsair.doi.dedup.....31c1b433a6419ab60d61003275184ae8
Full Text :
https://doi.org/10.1016/j.jspi.2017.10.010⟩