1. Sparse representation and multiple testing procedures : application to metabolimics
- Author
-
Tardivel, Patrick, ToxAlim (ToxAlim), Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Ecole d'Ingénieurs de Purpan (INPT - EI Purpan), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Recherche Agronomique (INRA), Université Paul Sabatier - Toulouse III, Didier Concordet, Rémi Servien, Institut National de la Recherche Agronomique (INRA)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Ecole Nationale Vétérinaire de Toulouse (ENVT), Université Fédérale Toulouse Midi-Pyrénées-Ecole d'Ingénieurs de Purpan (INPT - EI Purpan), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées, Université Toulouse III - Paul Sabatier, and Didier CONCORDET et Rémi SERVIEN
- Subjects
Quantification of metabolites ,Minimisation de la norme l1 ,[MATH.MATH-RT]Mathematics [math]/Representation Theory [math.RT] ,[SDV]Life Sciences [q-bio] ,Identification de métabolites ,Sparsest representation ,Tuning parameter ,Minimisation de la "norme" l alpha ,Procédure de tests multiples ,Procédure de tests multiples, FWER, Estimateur lasso, Paramètre de régularisation, Minimisation de la norme l1, Minimisation de la "norme"l apha, Minimisation de la "norme l0, Représentation parcimonieuse, Résonance magnétique nucléaire, Identification de métabolites, Quantification de métabolites ,Nuclear magnetic resonance ,Alpha minimization ,Minimisation de la "norme" l0 ,Familywise error rate ,Résonance magnétique nucléaire ,Multiple testing procedure ,FWER ,Lasso Estimator ,Quantification de métabolites ,Paramètre de régularisation ,Identification of metabolites ,Représentation parcimonieuse ,Estimateur lasso ,these ,Basis pursuit - Abstract
Let Y be a Gaussian vector distributed according to N (m,sigma²Idn) and X a matrix of dimension n x p with Y observed, m unknown, sigma and X known. In the linear model, m is assumed to be a linear combination of the columns of X In small dimension, when n ≥ p and ker (X) = 0, there exists a unique parameter Beta* such that m = X Beta*; then we can rewrite Y = Beta* + Epsilon. In the small-dimensional linear Gaussian model framework, we construct a new multiple testing procedure controlling the FWER to test the null hypotheses Beta*i = 0 for i belongs to [[1,p]]. This procedure is applied in metabolomics through the freeware ASICS available online. ASICS allows to identify and to qualify metabolites via the analyse of RMN spectra. In high dimension, when n < p we have ker (X) ≠ 0 consequently the parameter Beta* described above is no longer unique. In the noiseless case when Sigma = 0, implying thus Y = m, we show that the solutions of the linear system of equation Y = X Beta having a minimal number of non-zero components are obtained via the lalpha with alpha small enough.; Considérons un vecteur gaussien Y de loi N (m,sigma²Idn) et X une matrice de dimension n x p avec Y observé, m inconnu, Sigma et X connus. Dans le cadre du modèle linéaire, m est supposé être une combinaison linéaire des colonnes de X. En petite dimension, lorsque n ≥ p et que ker (X) = 0, il existe alors un unique paramètre Beta* tel que m = X Beta* ; on peut alors réécrire Y sous la forme Y = X Beta* + Epsilon. Dans le cadre du modèle linéaire gaussien en petite dimension, nous construisons une nouvelle procédure de tests multiples contrôlant le FWER pour tester les hypothèses nulles Beta*i = 0 pour i appartient à [[1,p]]. Cette procédure est appliquée en métabolomique au travers du programme ASICS qui est disponible en ligne. ASICS permet d'identifier et de quantifier les métabolites via l'analyse des spectres RMN. En grande dimension, lorsque n < p on a ker (X) ≠ 0, ainsi le paramètre Beta* décrit précédemment n'est pas unique. Dans le cas non bruité lorsque Sigma = 0, impliquant que Y = m, nous montrons que les solutions du système linéaire d'équations Y = X Beta avant un nombre de composantes non nulles minimales s'obtiennent via la minimisation de la "norme" lAlpha avec Alpha suffisamment petit.
- Published
- 2017