38 results on '"Anne-Laure Fougères"'
Search Results
2. Evaluating probabilistic forecasts of extremes using continuous ranked probability score distributions
- Author
-
Maxime Taillardat, Anne-Laure Fougères, Philippe Naveau, Raphaël de Fondeville, Centre national de recherches météorologiques (CNRM), Institut national des sciences de l'Univers (INSU - CNRS)-Observatoire Midi-Pyrénées (OMP), Institut de Recherche pour le Développement (IRD)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Météo-France -Institut de Recherche pour le Développement (IRD)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Météo-France -Centre National de la Recherche Scientifique (CNRS), Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), Laboratoire des Sciences du Climat et de l'Environnement [Gif-sur-Yvette] (LSCE), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Extrèmes : Statistiques, Impacts et Régionalisation (ESTIMR), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Ecole Polytechnique Fédérale de Lausanne (EPFL), ANR-20-CE40-0025,T-REX,nouveaux challenges pour la prédiction des extremes et sa validation(2020), ANR-19-CE46-0011,MeLODy,Bridging geohysics and MachinE Learning for the modeling, simulation and reconstruction of Ocean DYnamics(2019), ANR-10-LABX-0070,MILYON,Community of mathematics and fundamental computer science in Lyon(2010), ANR-11-IDEX-0007,Avenir L.S.E.,PROJET AVENIR LYON SAINT-ETIENNE(2011), European Project: 824158,H2020-EU.1.4. - EXCELLENT SCIENCE - Research Infrastructures ,EoCoE-II(2019), Météo-France, Department of Earth Sciences [Swiss Federal Institute of Technology - ETH Zürich] (D-ERDW), Eidgenössische Technische Hochschule - Swiss Federal Institute of Technology [Zürich] (ETH Zürich), and CMCS-EPFL (CMCS-EPFL)
- Subjects
FOS: Computer and information sciences ,Mathematics - Statistics Theory ,Machine Learning (stat.ML) ,Statistics Theory (math.ST) ,CRPS ,Scoring rules ,[STAT.OT]Statistics [stat]/Other Statistics [stat.ML] ,Statistics - Applications ,Methodology (stat.ME) ,Extreme events ,Probabilistic forecasting ,Calibration ,Verification ,Statistics - Machine Learning ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,FOS: Mathematics ,Applications (stat.AP) ,Business and International Management ,[SDU.ENVI]Sciences of the Universe [physics]/Continental interfaces, environment ,Statistics - Methodology ,[SDU.OCEAN]Sciences of the Universe [physics]/Ocean, Atmosphere ,[STAT.AP]Statistics [stat]/Applications [stat.AP] ,[SDE]Environmental Sciences ,ensemble forecasts ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] - Abstract
Verifying probabilistic forecasts for extreme events is a highly active research area because popular media and public opinions are naturally focused on extreme events, and biased conclusions are readily made. In this context, classical verification methods tailored for extreme events, such as thresholded and weighted scoring rules, have undesirable properties that cannot be mitigated, and the well-known continuous ranked probability score (CRPS) is no exception. In this paper, we define a formal framework for assessing the behavior of forecast evaluation procedures with respect to extreme events, which we use to demonstrate that assessment based on the expectation of a proper score is not suitable for extremes. Alternatively, we propose studying the properties of the CRPS as a random variable by using extreme value theory to address extreme event verification. An index is introduced to compare calibrated forecasts, which summarizes the ability of probabilistic forecasts for predicting extremes. The strengths and limitations of this method are discussed using both theoretical arguments and simulations., International Journal of Forecasting, 39 (3), ISSN:0169-2070, ISSN:1872-8200
- Published
- 2023
- Full Text
- View/download PDF
3. Multivariate Archimax copulas.
- Author
-
Arthur Charpentier, Anne-Laure Fougères, Christian Genest, and Johanna Neslehová
- Published
- 2014
- Full Text
- View/download PDF
4. Dense classes of multivariate extreme value distributions.
- Author
-
Anne-Laure Fougères, Cécile Mercadier, and John P. Nolan
- Published
- 2013
- Full Text
- View/download PDF
5. Risk Measures and Multivariate Extensions of Breiman's Theorem.
- Author
-
Anne-Laure Fougères and Cécile Mercadier
- Published
- 2012
- Full Text
- View/download PDF
6. Pitting Corrosion: Comparison of Treatments With Extreme-Value-Distributed Responses.
- Author
-
Anne-Laure Fougères, Sture Holm, and Holger Rootzén
- Published
- 2006
- Full Text
- View/download PDF
7. Forest-Based and Semiparametric Methods for the Postprocessing of Rainfall Ensemble Forecasting
- Author
-
Anne-Laure Fougères, Maxime Taillardat, Philippe Naveau, Olivier Mestre, Météo France, Centre national de recherches météorologiques (CNRM), Institut national des sciences de l'Univers (INSU - CNRS)-Météo France-Centre National de la Recherche Scientifique (CNRS), Laboratoire des Sciences du Climat et de l'Environnement [Gif-sur-Yvette] (LSCE), Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Extrèmes : Statistiques, Impacts et Régionalisation (ESTIMR), Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Météo-France Direction Interrégionale Sud-Est (DIRSE), Météo-France, Institut national des sciences de l'Univers (INSU - CNRS)-Observatoire Midi-Pyrénées (OMP), Institut de Recherche pour le Développement (IRD)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Météo-France -Institut de Recherche pour le Développement (IRD)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Météo-France -Centre National de la Recherche Scientifique (CNRS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Institut Camille Jordan (ICJ), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), and Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[SDU.OCEAN]Sciences of the Universe [physics]/Ocean, Atmosphere ,extreme events ,[STAT.AP]Statistics [stat]/Applications [stat.AP] ,Atmospheric Science ,010504 meteorology & atmospheric sciences ,Ensemble forecasting ,Meteorology ,rainfall ,Extreme events ,non-parametric statistical post-processing ,01 natural sciences ,010104 statistics & probability ,[STAT.ML]Statistics [stat]/Machine Learning [stat.ML] ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,13. Climate action ,Range (statistics) ,Environmental science ,Precipitation ,ensemble forecast ,0101 mathematics ,0105 earth and related environmental sciences - Abstract
Published version is accepted in Weather and Forecasting, DOI: 10.1175/WAF-D-18-0149.1; International audience; To satisfy a wide range of end-users, rainfall ensemble forecasts have to be skillful for both low precipitation and extreme events. We introduce local statistical post-processing methods based on Quantile Regression Forests and Gradient Forests with a semi-parametric extension for heavy-tailed distributions. These hybrid methods make use of the forest-based outputs to fit a parametric distribution that is suitable to model jointly low, medium, and heavy rainfall intensities. Our goal is to improve ensemble quality and value for all rainfall intensities. The proposed methods are applied to daily 51-h forecasts of 6-h accumulated precipitation from 2012 to 2015 over France using the Météo-France ensemble prediction system called PEARP. They are verified with a cross validation strategy and compete favorably with state-of-the-art methods like Analog Ensemble or Ensemble Model Output Statistics. Our methods do not assume any parametric links between the variable to calibrate and possible covariates. They do not require any variable selection step, and can make use of more than 60 predictors available such as summary statistics on the raw ensemble, deterministic forecasts of other parameters of interest, or probabilities of convective rainfall. In addition to improvements in overall performance, hybrid forest-based procedures produced the largest skill improvements for forecasting heavy rainfall events.
- Published
- 2019
- Full Text
- View/download PDF
8. Slightly more births at full moon
- Author
-
Frédéric Chambat, Anne-Laure Fougères, Alexandre Elyildirim, Laboratoire de Géologie de Lyon - Terre, Planètes, Environnement (LGL-TPE), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut national des sciences de l'Univers (INSU - CNRS)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), and Polytech Lyon
- Subjects
General Mathematics ,Astronomy ,[MATH]Mathematics [math] ,Mathematics ,Full moon - Abstract
International audience
- Published
- 2021
- Full Text
- View/download PDF
9. Inference for Archimax copulas
- Author
-
Johanna Nešlehová, Anne-Laure Fougères, Simon Chatelain, Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Department of Mathematics and Statistics [Montréal], McGill University = Université McGill [Montréal, Canada], and ANR-10-LABX-0070,MILYON,Community of mathematics and fundamental computer science in Lyon(2010)
- Subjects
Statistics and Probability ,Pure mathematics ,60G70 ,Copula (linguistics) ,Type (model theory) ,01 natural sciences ,010104 statistics & probability ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,0502 economics and business ,62G05 ,Copulas ,0101 mathematics ,62G20 ,050205 econometrics ,Mathematics ,empirical processes ,Generator (category theory) ,05 social sciences ,Tail dependence ,Estimator ,MSC 2010 subject classifications: Primary 62H12, 62G05, 62G20, 62G32 ,secondary 60G70 ,multivariate extremes ,Moment (mathematics) ,subasymptotic modeling ,13. Climate action ,62H12 ,Statistics, Probability and Uncertainty ,Parametric family ,Maxima ,62G32 - Abstract
Archimax copula models can account for any type of asymptotic dependence between extremes and at the same time capture joint risks at medium levels. An Archimax copula is characterized by two functional parameters: the stable tail dependence function $\ell $, and the Archimedean generator $\psi $ which distorts the extreme-value dependence structure. This article develops semiparametric inference for Archimax copulas: a nonparametric estimator of $\ell $ and a moment-based estimator of $\psi $ assuming the latter belongs to a parametric family. Conditions under which $\psi $ and $\ell $ are identifiable are derived. The asymptotic behavior of the estimators is then established under broad regularity conditions; performance in small samples is assessed through a comprehensive simulation study. The Archimax copula model with the Clayton generator is then used to analyze monthly rainfall maxima at three stations in French Brittany. The model is seen to fit the data very well, both in the lower and in the upper tail. The nonparametric estimator of $\ell $ reveals asymmetric extremal dependence between the stations, which reflects heavy precipitation patterns in the area. Technical proofs, simulation results and $\mathsf{R}$ code are provided in the Online Supplement.
- Published
- 2020
- Full Text
- View/download PDF
10. Modeling extreme rainfall A comparative study of spatial extreme value models
- Author
-
Cécile Mercadier, Quentin Sebille, Anne-Laure Fougères, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Probabilités, statistique, physique mathématique (PSPM), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), and Fougères, Anne-Laure
- Subjects
Statistics and Probability ,010504 meteorology & atmospheric sciences ,extreme value theory ,Computer science ,max-stable processes ,Bivariate analysis ,Management, Monitoring, Policy and Law ,01 natural sciences ,010104 statistics & probability ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Statistics ,spatial prediction ,Econometrics ,Precipitation ,0101 mathematics ,Computers in Earth Sciences ,Extreme value theory ,Classification 2010:60G70 ,62G32 ,62H11 ,62P12 ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,0105 earth and related environmental sciences ,Estimation ,hierarchical models ,Extreme events ,Data set ,13. Climate action ,Marginal distribution ,Focus (optics) ,Spatial modeling of extreme events ,precipitation data - Abstract
International audience; In this paper, focus is done on spatial models for extreme events and on their respective efficiency regarding the estimation of two risk measures: one extrapolating marginal distributions and one summarizing the spatial bivariate dependence of extremes. A wide comparison is performed on an innovative simulation plan that has been specifically designed from a daily precipitation data set. The objective of this paper is twofold: firstly, pointing out the inherent properties of each model, and secondly, advising users on how to choose the model depending on the specific type of risk.
- Published
- 2017
11. Risk Measures and Multivariate Extensions of Breiman's Theorem
- Author
-
Cécile Mercadier, Anne-Laure Fougères, Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), and ANR-08-BLAN-0314,AST&Risk(2008)
- Subjects
Statistics and Probability ,Multivariate statistics ,Ruin probability ,General Mathematics ,dependent risk ,Time horizon ,Discrete-time model ,62P05 ,62G32 ,01 natural sciences ,Measure (mathematics) ,value at risk ,010104 statistics & probability ,Multivariate regular variation ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,0502 economics and business ,Statistics ,Capital requirement ,Probability mass function ,Discrete time model ,0101 mathematics ,Mathematics ,050208 finance ,Value-at-Risk ,05 social sciences ,Dependent risks ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Ruin theory ,Discrete time and continuous time ,91B30 ,Statistics, Probability and Uncertainty ,Mathematical economics ,Value at risk - Abstract
International audience; Modeling insurance risks is a task that received an increasing attention because of Solvency Capital Requirements. The ruin probability has become a standard risk measure to assess regulatory capital. In this paper we focus on discrete time models for nite time horizon. Several results are available in the literature allowing to calibrate the ruin probability by means of the sum of the tail probabilities of individual claim amounts. The aim of this work is to obtain asymptotics for such probabilities under multivariate regularly variation and, more precisely, to derive them from Breiman's Theorem extensions. We thus exhibit new situations where the ruin probability admits computable equivalents. Consequences are also derived in terms of the Value-at-Risk.
- Published
- 2012
- Full Text
- View/download PDF
12. Propriétés psychométriques des versions françaises des échelles d’hyperactivité de Wender (WURS) et de l’Échelle de déficit d’attention de Brown (ADD)
- Author
-
Jean Adès, Lucia Romo, Anne-Laure Fougères, S. Marquez, A. Excoffier, Cindy Legauffre, Nathalie Cheze, Caroline Dubertret, and S. Mille
- Subjects
Item analysis ,Validation test ,Construct validity ,030227 psychiatry ,03 medical and health sciences ,Psychiatry and Mental health ,Analisis factorial ,0302 clinical medicine ,Arts and Humanities (miscellaneous) ,Convergent validity ,Internal consistency ,Psychology ,Humanities ,030217 neurology & neurosurgery - Abstract
Resume L’objectif de cette etude est d’analyser la structure factorielle et les proprietes psychometriques de deux instruments d’evaluation du trouble deficit d’attention/hyperactivite (TDA/H). Le premier instrument d’evaluation est l’Echelle d’hyperactivite durant l’enfance de Wender (WURS) qui permet l’autoevaluation retrospective durant l’enfance du trouble a l’âge de sept ans ; le second instrument est l’Echelle de deficit d’attention (ADD) de Brown pour adultes, qui permet une autoevaluation des troubles des fonctions executives a l’âge adulte. Ces deux echelles ont ete soumises a un processus de retrotraduction pour l’adaptation francaise. Nous avons etudie les proprietes de ces echelles sur un echantillon de 259 patients repartis en trois groupes : patients alcoolodependants, patients deprimes et personnes issues de la population generale.
- Published
- 2010
- Full Text
- View/download PDF
13. Limit Conditional Distributions for Bivariate Vectors with Polar Representation
- Author
-
Anne-Laure Fougères, Philippe Soulier, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), Modélisation aléatoire de Paris X (MODAL'X), Université Paris Nanterre (UPN), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), and Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Statistics and Probability ,Conditional excess probability ,Multivariate random variable ,Mathematics - Statistics Theory ,Statistics Theory (math.ST) ,01 natural sciences ,$\Gamma$-varying tail ,010104 statistics & probability ,Gumbel distribution ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Joint probability distribution ,FOS: Mathematics ,conditional extreme-value mo\-del ,Applied mathematics ,0101 mathematics ,Extreme value theory ,Mathematics ,Applied Mathematics ,elliptic distributions ,Probability (math.PR) ,010102 general mathematics ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Conditional probability distribution ,Geometric distribution ,[MATH.MATH-PR]Mathematics [math]/Probability [math.PR] ,second order correction ,conditional extreme-value model ,Modeling and Simulation ,Generalized extreme value distribution ,asymptotic independence ,Elliptical distribution ,Mathematics - Probability ,second order correction. Conditional excess probability - Abstract
We investigate conditions for the existence of the limiting conditional distribution of a bivariate random vector when one component becomes large. We revisit the existing literature on the topic, and present some new sufficient conditions. We concentrate on the case where the conditioning variable belongs to the maximum domain of attraction of the Gumbel law, and we study geometric conditions on the joint distribution of the vector. We show that these conditions are of a local nature and imply asymptotic independence when both variables belong to the domain of attraction of an extreme value distribution. The new model we introduce can also be useful to simulate bivariate random vectors with a given limiting conditional distribution.
- Published
- 2010
- Full Text
- View/download PDF
14. On the Tail Behavior of Sums of Dependent Risks
- Author
-
Anne-Laure Fougères, Philippe Barbe, Christian Genest, and Abdelmoumene, Amina
- Subjects
Discrete mathematics ,Economics and Econometrics ,Pure mathematics ,Multivariate statistics ,Common distribution ,Accounting ,Finance ,Mathematics ,Copula (probability theory) - Abstract
The tail behavior of sums of dependent risks was considered by Wüthrich (2003) and by Alink et al. (2004, 2005) in the case where the variables are exchangeable and connected through an Archimedean copula model. It is shown here how their result can be extended to a broader class of dependence structures using multivariate extreme-value theory. An explicit form is given for the asymptotic probability of extremal events, and the behavior of the latter is studied as a function of the indices of regular variation of both the copula and the common distribution of the risks.
- Published
- 2006
- Full Text
- View/download PDF
15. Extreme behaviour for bivariate elliptical distributions
- Author
-
Kilani Ghoudi, Anne-Laure Fougères, and Belkacem Abdous
- Subjects
Statistics and Probability ,Mathematical analysis ,Statistics ,Tail dependence ,Bivariate analysis ,Conditional probability distribution ,Statistics, Probability and Uncertainty ,Elliptical distribution ,Mathematics - Abstract
The authors examine the asymptotic behaviour of conditional threshold exceedance probabilities for an elliptically distributed pair (X, Y) of random variables. More precisely, they investigate the limiting behaviour of the conditional distribution of Y given that X becomes extreme. They show that this behaviour differs between regularly and rapidly varying tails. Le comportement extreme des lois elliptiques bivariees: Les auteurs s'interessent au comportement asymptotique de probabilites conditionnelles de depassement d'un seuil pour une paire (X, Y) de variables aleatoires de loi elliptique. Plus precisement, ils etudient le comportement limite de la loi conditionnelle de Y sachant que X devient extrěme. ns montrent que ce comportement difere suivant que les queues de la loi sont a variations regulieres ou rapides.
- Published
- 2005
- Full Text
- View/download PDF
16. Some Asymptotic Results for the Number of Generalized Records
- Author
-
Anne-Laure Fougères, Fabrice Gamboa, and Clémentine Prieur
- Subjects
Statistics and Probability ,Exchangeable random variables ,Discrete mathematics ,Rank (linear algebra) ,Economics, Econometrics and Finance (miscellaneous) ,Applied mathematics ,Large deviations theory ,Engineering (miscellaneous) ,Triangular array ,Statistic ,Mathematics ,Central limit theorem ,Rank correlation - Abstract
In this paper, we study asymptotic properties (large deviations and functional central limit theorem) of generalized record processes built on a triangular array of continuous and exchangeable random variables. As an application of these results, the links with the Kendall's rank correlation statistic are studied and testing exchangeability is discussed.
- Published
- 2005
- Full Text
- View/download PDF
17. Bias correction in multivariate extremes
- Author
-
Cécile Mercadier, Laurens de Haan, Anne-Laure Fougères, Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Department of Economics, Faculty of Economics, Erasmus University Rotterdam, Erasmus university, FCT/PTDC/MAT/112770/2009 (Portugal), ANR-08-BLAN-0314,AST&Risk(2008), Fougères, Anne-Laure, and - AST&Risk2008 - ANR-08-BLAN-0314 - BLANC - VALID
- Subjects
Statistics and Probability ,Multivariate statistics ,60G70 ,tail dependence ,Structure (category theory) ,Mathematics - Statistics Theory ,Statistics Theory (math.ST) ,Multivariate extreme value theory ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,60F05 ,FOS: Mathematics ,Applied mathematics ,Bias correction ,62G05 ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,62G20 ,Mathematics ,MSC 2010 : Primary 62G32, 62G05, 62G20 ,secondary 60F05, 60G70 ,[STAT.TH] Statistics [stat]/Statistics Theory [stat.TH] ,Univariate ,Tail dependence ,Estimator ,Extremal dependence ,Function (mathematics) ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,bias correction ,threshold choice ,Statistics, Probability and Uncertainty ,62G32 - Abstract
The estimation of the extremal dependence structure is spoiled by the impact of the bias, which increases with the number of observations used for the estimation. Already known in the univariate setting, the bias correction procedure is studied in this paper under the multivariate framework. New families of estimators of the stable tail dependence function are obtained. They are asymptotically unbiased versions of the empirical estimator introduced by Huang [Statistics of bivariate extremes (1992) Erasmus Univ.]. Since the new estimators have a regular behavior with respect to the number of observations, it is possible to deduce aggregated versions so that the choice of the threshold is substantially simplified. An extensive simulation study is provided as well as an application on real data., Comment: Published at http://dx.doi.org/10.1214/14-AOS1305 in the Annals of Statistics (http://www.imstat.org/aos/) by the Institute of Mathematical Statistics (http://www.imstat.org)
- Published
- 2015
18. [Untitled]
- Author
-
Anne-Laure Fougères and Philippe Capéraà
- Subjects
Statistics and Probability ,Economics, Econometrics and Finance (miscellaneous) ,Monte Carlo method ,Nonparametric statistics ,Estimator ,Bivariate analysis ,Joint probability distribution ,Statistics ,Consistent estimator ,Generalized extreme value distribution ,Statistical physics ,Extreme value theory ,Engineering (miscellaneous) ,Mathematics - Abstract
Several threshold methods have been proposed for the purpose of estimating a bivariate extreme value distribution from a sample of data whose distribution is only in its domain of attraction. An integrated view of these methods is presented which leads to the introduction of a new asymptotically consistent estimator of the dependence function characterizing the extreme dependence structure. Through Monte Carlo simulations, the new estimator is also shown to do as well as its competitors and to outperform them in cases of weak dependence. To the authors' knowledge, this is the first time that the small-sample behavior of nonparametric bivariate threshold methods has ever been investigated.
- Published
- 2000
- Full Text
- View/download PDF
19. A nonparametric estimation procedure for bivariate extreme value copulas
- Author
-
Anne-Laure Fougères, Christian Genest, and Philippe Capéraà
- Subjects
Statistics and Probability ,Applied Mathematics ,General Mathematics ,Nonparametric statistics ,Estimator ,Trimmed estimator ,Agricultural and Biological Sciences (miscellaneous) ,Efficient estimator ,Minimum-variance unbiased estimator ,Bias of an estimator ,Stein's unbiased risk estimate ,Statistics ,Generalized extreme value distribution ,Statistics, Probability and Uncertainty ,General Agricultural and Biological Sciences ,Mathematics - Abstract
SUMMARY A bivariate extreme value distribution with fixed marginals is generated by a onedimensional map called a dependence function. This paper proposes a new nonparametric estimator of this function. Its asymptotic properties are examined, and its small-sample behaviour is compared to that of other rank-based and likelihood-based procedures. The new estimator is shown to be uniformly, strongly convergent and asymptotically unbiased. Through simulations, it is also seen to perform reasonably well against the maximum likelihood estimator based on the correct model and to have smaller L1, L2 and L,, errors than any existing nonparametric alternative. The n' consistency of the proposed estimator leads to nonparametric estimation of Tawn's (1988) dependence measure that may be used to test independence in small samples.
- Published
- 1997
- Full Text
- View/download PDF
20. Estimation de densités unimodales
- Author
-
Anne-Laure Fougères
- Subjects
Statistics and Probability ,Kernel (statistics) ,Statistics ,Kernel density estimation ,Estimator ,Applied mathematics ,Probability density function ,Monotonic function ,Statistics, Probability and Uncertainty ,Nonparametric density estimation ,Mathematics - Abstract
This paper proposes a new nonparametric unimodal estimator of a unimodal probability density function, in the case where the mode is known. The classical solution to this problem is the maximum-likelihood estimator under monotonicity constraint, considered by Grenander (1956). Our approach is based on a unimodal rearrangement of the kernel estimator of the density. Asymptotic properties of this estimator are studied, and its small-sample behaviour is examined through simulations. Cet article propose un nouvel estimateur non parametrique unimodal d'une densite de probabilite unimodale de mode connu. La solution la plus classique de ce probleme est l'estimateur du maximum de vraisemblance sous contrainte de monotonie, considere par Grenander (1956). L'approche que nous envisageons est fondee sur un rearrangement unimodal de l'estimateur a noyau de la densite. Nous etudions les proprietes asymptotiques de cet estimateur et examinons, a l'aide de simulations, son comportement pour de petites tailles d'echantillons.
- Published
- 1997
- Full Text
- View/download PDF
21. Bayesian Model Averaging for multivariate extremes
- Author
-
Anne-Laure Fougères, Anne Sabourin, Philippe Naveau, Laboratoire des Sciences du Climat et de l'Environnement [Gif-sur-Yvette] (LSCE), Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Extrèmes : Statistiques, Impacts et Régionalisation (ESTIMR), Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), EU-FP7 ACQWA (www.acqwa.ch), PEPER-GIS project, MIRACCLE-GICC, Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Institut Camille Jordan (ICJ), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), and Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Statistics and Probability ,Unit sphere ,Multivariate statistics ,010504 meteorology & atmospheric sciences ,Spectral measure ,Economics, Econometrics and Finance (miscellaneous) ,Bayesian model averaging ,Inference ,Marginal model ,Bayesian inference ,01 natural sciences ,Multivariate extremes ,010104 statistics & probability ,Econometrics ,0101 mathematics ,62F07, 62F15, 62H20, 62H05, 62P12 ,Extreme value theory ,Parametric equation ,Engineering (miscellaneous) ,Parametric modelling ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] ,0105 earth and related environmental sciences ,Parametric statistics ,Mathematics - Abstract
International audience; The main framework of multivariate extreme value theory is well-known in terms of probability, but inference and model choice remain an active research field. Theoretically, an angular measure on the positive quadrant of the unit sphere can describe the dependence among very high values, but no parametric form can entirely capture it. The practitioner often makes an assertive choice and arbitrarily fits a specific parametric angular measure on the data. Another statistician could come up with another model and a completely different estimate. This leads to the problem of how to merge the two different fitted angular measures. One natural way around this issue is to weigh them according to the marginal model likelihoods. This strategy, the so-called Bayesian Model Averaging (BMA), has been extensively studied in various context, but (to our knowledge) it has never been adapted to angular measures. The main goal of this article is to etermine if the BMA approach can offer an added value when analyzing extreme values.
- Published
- 2013
- Full Text
- View/download PDF
22. Tailweight with respect to the mode for unimodal distributions
- Author
-
Michel Meste, Jean Averous, and Anne-Laure Fougères
- Subjects
Statistics and Probability ,Mathematical optimization ,Skewness ,Mode (statistics) ,Statistical physics ,Statistics, Probability and Uncertainty ,Concentration function ,Mathematics - Abstract
Location, spread, skewness and tailweight are studied for unimodal distributions by means of mode-based concepts. The Levy concentration function and notions related to it are playing an important part.
- Published
- 1996
- Full Text
- View/download PDF
23. Estimation of bivariate excess probabilities for elliptical models
- Author
-
Philippe Soulier, Anne-Laure Fougères, Belkacem Abdous, Kilani Ghoudi, Département de médecine sociale et préventive (DMPS), Université Laval [Québec] (ULaval), Modélisation aléatoire de Paris X (MODAL'X), Université Paris Nanterre (UPN), College of Business and Economics Statistics Department (CBE STAT), and United Arab Emirates University (UAEU)
- Subjects
Statistics and Probability ,Conditional excess probability ,Multivariate random variable ,elliptic law ,Mathematics - Statistics Theory ,Context (language use) ,Statistics Theory (math.ST) ,Bivariate analysis ,01 natural sciences ,Combinatorics ,010104 statistics & probability ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,FOS: Mathematics ,rapidly varying tails ,0101 mathematics ,Mathematics ,Event (probability theory) ,010102 general mathematics ,Order (ring theory) ,AMS 62G32, 60G70 ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Quantile function ,16. Peace & justice ,financial contagion ,asymptotic independence - Abstract
Let $(X,Y)$ be a random vector whose conditional excess probability $\theta(x,y):=P(Y\leq y | X>x)$ is of interest. Estimating this kind of probability is a delicate problem as soon as $x$ tends to be large, since the conditioning event becomes an extreme set. Assume that $(X,Y)$ is elliptically distributed, with a rapidly varying radial component. In this paper, three statistical procedures are proposed to estimate $\theta(x,y)$ for fixed $x,y$, with $x$ large. They respectively make use of an approximation result of Abdous et al. (cf. Canad. J. Statist. 33 (2005) 317--334, Theorem 1), a new second order refinement of Abdous et al.'s Theorem 1, and a non-approximating method. The estimation of the conditional quantile function $\theta(x,\cdot)^{\leftarrow}$ for large fixed $x$ is also addressed and these methods are compared via simulations. An illustration in the financial context is also given., Comment: Published in at http://dx.doi.org/10.3150/08-BEJ140 the Bernoulli (http://isi.cbs.nl/bernoulli/) by the International Statistical Institute/Bernoulli Society (http://isi.cbs.nl/BS/bshome.htm)
- Published
- 2008
- Full Text
- View/download PDF
24. Estimation of conditional laws given an extreme component
- Author
-
Anne-Laure Fougères, Philippe Soulier, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS), Modélisation aléatoire de Paris X (MODAL'X), Université Paris Nanterre (UPN), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), and Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Statistics and Probability ,Multivariate random variable ,60F05 62E10 62E20 62G32 ,010102 general mathematics ,Economics, Econometrics and Finance (miscellaneous) ,Estimator ,Asymptotic distribution ,Mathematics - Statistics Theory ,Conditional probability distribution ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Statistics Theory (math.ST) ,Quantile function ,01 natural sciences ,010104 statistics & probability ,non parametric estimation ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,FOS: Mathematics ,Applied mathematics ,Conditional limit distribution ,0101 mathematics ,Extreme value theory ,Engineering (miscellaneous) ,Event (probability theory) ,Mathematics ,Central limit theorem - Abstract
Let $(X,Y)$ be a bivariate random vector. The estimation of a probability of the form $P(Y\leq y \mid X >t) $ is challenging when $t$ is large, and a fruitful approach consists in studying, if it exists, the limiting conditional distribution of the random vector $(X,Y)$, suitably normalized, given that $X$ is large. There already exists a wide literature on bivariate models for which this limiting distribution exists. In this paper, a statistical analysis of this problem is done. Estimators of the limiting distribution (which is assumed to exist) and the normalizing functions are provided, as well as an estimator of the conditional quantile function when the conditioning event is extreme. Consistency of the estimators is proved and a functional central limit theorem for the estimator of the limiting distribution is obtained. The small sample behavior of the estimator of the conditional quantile function is illustrated through simulations., 32 pages, 5 figure
- Published
- 2008
- Full Text
- View/download PDF
25. Models for dependent extremes using stable mixtures
- Author
-
John P. Nolan, Holger Rootzén, Anne-Laure Fougères, Modélisation aléatoire de Paris X (MODAL'X), Université Paris Nanterre (UPN), Department of Mathematics and Statistics, American University, Department of Mathematical Sciences, Chalmers University of Technology [Göteborg]-University of Gothenburg (GU), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), and Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
FOS: Computer and information sciences ,Statistics and Probability ,Multivariate statistics ,Scale (ratio) ,pitting corrosion ,positive stable variables ,Mathematics - Statistics Theory ,Statistics Theory (math.ST) ,Logistic distribution ,max-stable ,01 natural sciences ,Interpretation (model theory) ,Methodology (stat.ME) ,010104 statistics & probability ,Gumbel distribution ,Computer Science::Systems and Control ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,0502 economics and business ,FOS: Mathematics ,Statistical physics ,0101 mathematics ,Extreme value theory ,Mixing (physics) ,Statistics - Methodology ,Mathematics ,050210 logistics & transportation ,05 social sciences ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Conditional probability distribution ,random effect ,Statistics, Probability and Uncertainty ,Maxima ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] ,multivariate extreme value distribution - Abstract
International audience; This paper unifies and extends results on a class of multivariate Extreme Value (EV) models studied by Hougaard, Crowder, and Tawn. In these models both unconditional and conditional distributions are EV, and all lower-dimensional marginals and maxima belong to the class. This leads to substantial economies of understanding, analysis and prediction. One interpretation of the models is as size mixtures of EV distributions, where the mixing is by positive stable distributions. A second interpretation is as exponential-stable location mixtures (for Gumbel) or as power-stable scale mixtures (for non-Gumbel EV distributions). A third interpretation is through a Peaks over Thresholds model with a positive stable intensity. The mixing variables are used as a modeling tool and for better understanding and model checking. We study extreme value analogues of components of variance models, and new time series, spatial, and continuous parameter models for extreme values. The results are applied to data from a pitting corrosion investigation.
- Published
- 2007
- Full Text
- View/download PDF
26. Limit properties of the monotone rearrangement for density and regression function estimation
- Author
-
Anne-Laure Fougères, Dragi Anevski, Centre for Mathematical Sciences Lund Institute of Technology Lund University, Lund University [Lund], Probabilités, statistique, physique mathématique (PSPM), Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), and Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Statistics and Probability ,Pointwise ,Stationary process ,010102 general mathematics ,Sorting ,Estimator ,Monotonic function ,Mathematics - Statistics Theory ,Density estimation ,dependence ,Statistics Theory (math.ST) ,01 natural sciences ,010104 statistics & probability ,Monotone polygon ,monotone rearrangement ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,density estimation ,62E20, 62G07 ,FOS: Mathematics ,Applied mathematics ,Regression function estimation ,Limit distributions ,Limit (mathematics) ,0101 mathematics ,Mathematics - Abstract
International audience; The monotone rearrrangement algorithm was introduced by Hardy, Littlewood and Pólya as a sorting device for functions. Assuming that x is a monotone function and that an estimate x n of x is given, consider the monotone rearrangementˆxrearrangementˆ rearrangementˆx n of x n. This new estimator is shown to be uniformly consistent as soon as x n is. Under suitable assumptions, pointwise limit distribution results forˆxforˆ forˆx n are obtained. The framework is general and allows for weakly dependent and long range dependent stationary data. Applications in monotone density and regression function estimation are detailed. Asymptotics for rearrangement estimators with vanishing derivatives are also obtained in these two contexts.
- Published
- 2007
- Full Text
- View/download PDF
27. Bivariate Distributions with Given Extreme Value Attractor
- Author
-
Philippe Capéraà, Christian Genest, and Anne-Laure Fougères
- Subjects
Statistics and Probability ,Class (set theory) ,Numerical Analysis ,Mathematical analysis ,Structure (category theory) ,02 engineering and technology ,Bivariate analysis ,Archimedean copulas, bivariate threshold method, dependence functions, domains of attraction, extreme value distributions ,01 natural sciences ,010104 statistics & probability ,Joint probability distribution ,Attractor ,Dependence function ,0202 electrical engineering, electronic engineering, information engineering ,Generalized extreme value distribution ,Applied mathematics ,020201 artificial intelligence & image processing ,0101 mathematics ,Statistics, Probability and Uncertainty ,Extreme value theory ,Mathematics - Abstract
A new class of bivariate distributions is introduced and studied, which encompasses Archimedean copulas and extreme value distributions as special cases. Its dependence structure is described, its maximum and minimum attractors are determined, and an algorithm is given for generating observations from any member of this class. It is also shown how it is possible to construct distributions in this family with a predetermined extreme value attractor. This construction is used to study via simulation the small-sample behavior of a bivariate threshold method suggested by H. Joe, R. L. Smith, and I. Weissman (1992, J. Roy. Statist. Soc. Ser. B54, 171–183) for estimating the joint distribution of extremes of two random variates.
- Full Text
- View/download PDF
28. Mélanges bayésiens de modèles d'extrêmes multivariés : application à la prédétermination régionale des crues avec données incomplètes
- Author
-
Anne Sabourin, STAR, ABES, Département Traitement du Signal et des Images (TSI), Télécom ParisTech-Centre National de la Recherche Scientifique (CNRS), Université Claude Bernard - Lyon I, Anne-Laure Fougères(fougeres@math.univ-lyon1.fr), Anne-Laure Fougères, and Philippe Naveau
- Subjects
Predetermination of floods ,[STAT.AP]Statistics [stat]/Applications [stat.AP] ,Data augmentation ,MCMC sampling ,Augmentation de données ,Bayesian model averaging ,Extrêmes multivariés ,[MATH.MATH-GM] Mathematics [math]/General Mathematics [math.GM] ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Prédétermination des crues ,Multivariate extremes ,dépassements de seuil ,Méthodes de Monte-Carlo ,Modèles de mélanges ,[MATH.MATH-GM]Mathematics [math]/General Mathematics [math.GM] ,mélanges de Dirichlet ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Threshold excesses ,Dirichlet mixtures ,Dépassement de seuil ,Mixture models ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] ,predetermination of floods ,modèles de mélange ,échantillonnage MCMC - Abstract
Uni-variate extreme value theory extends to the multivariate case but the absence of a natural parametric framework for the joint distribution of extremes complexifies inferential matters. Available non parametric estimators of the dependence structure do not come with tractable uncertainty intervals for problems of dimension greater than three. However, uncertainty estimation is all the more important for applied purposes that data scarcity is a recurrent issue, particularly in the field of hydrology. The purpose of this thesis is to develop modeling tools for the dependence structure between extremes, in a Bayesian framework that allows uncertainty assessment. Chapter 2 explores the properties of the model obtained by combining existing ones, in a Bayesian Model Averaging framework. A semi-parametric Dirichlet mixture model is studied next : a new parametrization is introduced, in order to relax a moments constraint which characterizes the dependence structure. The re-parametrization significantly improves convergence and mixing properties of the reversible-jump algorithm used to sample the posterior. The last chapter is motivated by an hydrological application, which consists in estimating the dependence structure of floods recorded at four neighboring stations, in the ‘Gardons’ region, southern France, using historical data. The latter increase the sample size but most of them are censored. The lack of explicit expression for the likelihood in the Dirichlet mixture model is handled by using a data augmentation framework, La théorie statistique univariée des valeurs extrêmes se généralise au cas multivarié mais l'absence d'un cadre paramétrique naturel complique l'inférence de la loi jointe des extrêmes. Les marges d'erreur associée aux estimateurs non paramétriques de la structure de dépendance sont difficilement accessibles à partir de la dimension trois. Cependant, quantifier l'incertitude est d'autant plus important pour les applications que le problème de la rareté des données extrêmes est récurrent, en particulier en hydrologie. L'objet de cette thèse est de développer des modèles de dépendance entre extrêmes, dans un cadre bayésien permettant de représenter l'incertitude. Le chapitre 2 explore les propriétés des modèles obtenus en combinant des modèles paramétriques existants, par mélange bayésien (Bayesian Model Averaging BMA). Un modèle semi-paramétrique de mélange de Dirichlet est étudié au chapitre suivant : une nouvelle paramétrisation est introduite afin de s'affranchir d'une contrainte de moments caractéristique de la structure de dépendance et de faciliter l'échantillonnage de la loi à posteriori. Le chapitre 4 est motivé par une application hydrologique : il s'agit d'estimer la structure de dépendance spatiale des crues extrêmes dans la région cévenole des Gardons en utilisant des données historiques enregistrées en quatre points. Les données anciennes augmentent la taille de l'échantillon mais beaucoup de ces données sont censurées. Une méthode d'augmentation de données est introduite, dans le cadre du mélange de Dirichlet, palliant l'absence d'expression explicite de la vraisemblance censurée. Les conclusions et perspectives sont discutées au chapitre 5
- Published
- 2013
29. Modélisation de la dépendance entre pré-extrêmes
- Author
-
Chatelain, Simon, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Université de Lyon, McGill university (Montréal, Canada), Anne-Laure Fougères, and Johanna G. Nešlehová
- Subjects
Copules Archimax ,Extremes ,Dependence modeling ,Clustering ,Inférence semiparametrique ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Empirical processes ,Archimax copulas ,Extrêmes ,Copulas ,Modélisation de la dépendence ,Semi parametric inference ,Copules ,Processus empiriques - Abstract
In various applications in environmental sciences, finance, insurance or risk management, joint extremal behavior between random variables is of particular interest. For example, this plays a central role in assessing risks of natural disasters. Misspecification of the dependence between random variables can lead to substantial underestimation of risk, especially at extreme levels. This thesis develops inference techniques for Archimax copulas. These copula models can account for any type of asymptotic dependence between extremes and at the same time capture joint risks at medium levels. An Archimax copula is characterized by two functional parameters, the stable tail dependence function (stdf), and the Archimedean generator which acts as a distortion of the extreme-value dependence model. Conditions under which the generator and the stdf are identifiable are derived so that a semiparametric approach for inference can be developed. Two nonparametric estimators of the stdf and a moment-based estimator of the generator, which assumes that the latter belongs to a parametric family, are proposed. The asymptotic behavior of the estimators is then established under broad regularity conditions; performance in small samples is assessed through a comprehensive simulation study. In the second part of the thesis, Archimax copulas are generalized to a clustered constructions in order to bring in more flexibility, which is needed in practical applications. The extremal behavior of this new dependence model is derived herein. Finally, the methodology proposed herein is illustrated on precipitation data. First, a trivariate Archimax copula is used to analyze monthly rainfall maxima at three stations in French Brittany. The model is seen to fit the data very well, both in the lower and in the upper tail. The nonparametric estimator of the stdf reveals asymmetric extremal dependence between the stations, which reflects heavy precipitation patterns in the area. An application of the clustered Archimax model to a precipitation dataset containing 155 stations is then presented, where groups of asymptotically dependent stations are determined via a specifically tailored clustering algorithm. Finally, possible ways to model inter cluster dependence are discussed; Le comportement extrême joint entre variables aléatoires revêt un intérêt particulier dans de nombreuses applications des sciences de l’environnement, de la finance, de l’assurance ou encore de la gestion du risque. Par exemple, ce comportement joue un rôle central dans l’évaluation des risques de catastrophes naturelles. Une erreur de spécification de la dépendance entre des variables aléatoires peut engendrer une sous-estimation dangereuse du risque, en particulier au niveau extrême. Le premier objectif de cette thèse est de développer des techniques d’inférence pour les copules Archimax. Ces modèles de dépendance peuvent capturer tout type de dépendance asymptotique entre les extrêmes et, de manière simultanée, modéliser les risques joints au niveau moyen. Une copule Archimax est caractérisée par ses deux paramètres fonctionnels, la fonction de dépendance caudale stable et le générateur Archimédien qui agit comme une distorsion affectant le régime de dépendance extrême. Des conditions sont dérivées afin que le générateur et la fonction caudale soient identifiables, de sorte qu’une approche d’inférence semi-paramétrique puisse être développée. Deux estimateurs non paramétriques de la fonction caudale et un estimateur du générateur basé sur les moments, supposant que ce dernier appartient à une famille paramétrique, sont avancés. Le comportement asymptotique de ces estimateurs est ensuite établi sous des hypothèses de régularité non restrictives et la performance en échantillon fini est évaluée par le biais d’une étude de simulation. Une construction hiérarchique (ou en “clusters”) qui généralise les copules Archimax est proposée afin d’apporter davantage de flexibilité, la rendant plus adaptée aux applications pratiques. Le comportement extrême de ce nouveau modèle de dépendance est ensuite étudié, ce qui engendre un nouvelle manière de construire des fonctions de dépendance caudale stable. La copule Archimax est ensuite utilisée pour analyser les maxima mensuels de précipitations, observées à trois stations météorologiques en Bretagne. Le modèle semble très bien ajusté aux données, aussi bien aux précipitations faibles qu’aux précipitationsfortes. L’estimateur non paramétrique de la fonction caudale révèle une dépendance extrême asymétrique entre les stations, ce qui reflète le déplacement des orages dans la région. Une application du modèle Archimax hiérarchique à un jeu de données de précipitations contenant 155 stations est ensuite présentée, dans laquelle des groupes de stations asymptotiquement dépendantes sont déterminés via un algorithme de “clustering” spécifiquement adapté au modèle. Enfin, de possibles méthodes pour modéliser la dépendance inter-cluster sont évoquées
- Published
- 2019
30. Modeling the dependence of pre-asymptotic extremes
- Author
-
Chatelain, Simon, STAR, ABES, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Université de Lyon, McGill university (Montréal, Canada), Anne-Laure Fougères, and Johanna G. Nešlehová
- Subjects
Copules Archimax ,Extremes ,Dependence modeling ,Clustering ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Inférence semiparametrique ,Empirical processes ,Archimax copulas ,Extrêmes ,Copulas ,Modélisation de la dépendence ,Semi parametric inference ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,Copules ,Processus empiriques - Abstract
In various applications in environmental sciences, finance, insurance or risk management, joint extremal behavior between random variables is of particular interest. For example, this plays a central role in assessing risks of natural disasters. Misspecification of the dependence between random variables can lead to substantial underestimation of risk, especially at extreme levels. This thesis develops inference techniques for Archimax copulas. These copula models can account for any type of asymptotic dependence between extremes and at the same time capture joint risks at medium levels. An Archimax copula is characterized by two functional parameters, the stable tail dependence function (stdf), and the Archimedean generator which acts as a distortion of the extreme-value dependence model. Conditions under which the generator and the stdf are identifiable are derived so that a semiparametric approach for inference can be developed. Two nonparametric estimators of the stdf and a moment-based estimator of the generator, which assumes that the latter belongs to a parametric family, are proposed. The asymptotic behavior of the estimators is then established under broad regularity conditions; performance in small samples is assessed through a comprehensive simulation study. In the second part of the thesis, Archimax copulas are generalized to a clustered constructions in order to bring in more flexibility, which is needed in practical applications. The extremal behavior of this new dependence model is derived herein. Finally, the methodology proposed herein is illustrated on precipitation data. First, a trivariate Archimax copula is used to analyze monthly rainfall maxima at three stations in French Brittany. The model is seen to fit the data very well, both in the lower and in the upper tail. The nonparametric estimator of the stdf reveals asymmetric extremal dependence between the stations, which reflects heavy precipitation patterns in the area. An application of the clustered Archimax model to a precipitation dataset containing 155 stations is then presented, where groups of asymptotically dependent stations are determined via a specifically tailored clustering algorithm. Finally, possible ways to model inter cluster dependence are discussed, Le comportement extrême joint entre variables aléatoires revêt un intérêt particulier dans de nombreuses applications des sciences de l’environnement, de la finance, de l’assurance ou encore de la gestion du risque. Par exemple, ce comportement joue un rôle central dans l’évaluation des risques de catastrophes naturelles. Une erreur de spécification de la dépendance entre des variables aléatoires peut engendrer une sous-estimation dangereuse du risque, en particulier au niveau extrême. Le premier objectif de cette thèse est de développer des techniques d’inférence pour les copules Archimax. Ces modèles de dépendance peuvent capturer tout type de dépendance asymptotique entre les extrêmes et, de manière simultanée, modéliser les risques joints au niveau moyen. Une copule Archimax est caractérisée par ses deux paramètres fonctionnels, la fonction de dépendance caudale stable et le générateur Archimédien qui agit comme une distorsion affectant le régime de dépendance extrême. Des conditions sont dérivées afin que le générateur et la fonction caudale soient identifiables, de sorte qu’une approche d’inférence semi-paramétrique puisse être développée. Deux estimateurs non paramétriques de la fonction caudale et un estimateur du générateur basé sur les moments, supposant que ce dernier appartient à une famille paramétrique, sont avancés. Le comportement asymptotique de ces estimateurs est ensuite établi sous des hypothèses de régularité non restrictives et la performance en échantillon fini est évaluée par le biais d’une étude de simulation. Une construction hiérarchique (ou en “clusters”) qui généralise les copules Archimax est proposée afin d’apporter davantage de flexibilité, la rendant plus adaptée aux applications pratiques. Le comportement extrême de ce nouveau modèle de dépendance est ensuite étudié, ce qui engendre un nouvelle manière de construire des fonctions de dépendance caudale stable. La copule Archimax est ensuite utilisée pour analyser les maxima mensuels de précipitations, observées à trois stations météorologiques en Bretagne. Le modèle semble très bien ajusté aux données, aussi bien aux précipitations faibles qu’aux précipitationsfortes. L’estimateur non paramétrique de la fonction caudale révèle une dépendance extrême asymétrique entre les stations, ce qui reflète le déplacement des orages dans la région. Une application du modèle Archimax hiérarchique à un jeu de données de précipitations contenant 155 stations est ensuite présentée, dans laquelle des groupes de stations asymptotiquement dépendantes sont déterminés via un algorithme de “clustering” spécifiquement adapté au modèle. Enfin, de possibles méthodes pour modéliser la dépendance inter-cluster sont évoquées
- Published
- 2019
31. From stochastic modelling of gene expression to inference of regulatory networks
- Author
-
Herbach, Ulysse, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Laboratoire de biologie et modélisation de la cellule (LBMC UMR 5239), Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Institut National de la Santé et de la Recherche Médicale (INSERM), Multi-scale modelling of cell dynamics : application to hematopoiesis (DRACULA), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de génétique et de physiologie moléculaire et cellulaire (CGPhiMC), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)-Centre National de la Recherche Scientifique (CNRS), Probabilités, statistique, physique mathématique (PSPM), Université de Lyon, Thibault Espinasse, Anne-Laure Fougères, and Olivier Gandrillon
- Subjects
Hidden Markov random fields ,Processus de Markov déterministes par morceaux ,Expression stochastique des gènes ,Chemical reaction networks ,Gene network inference ,Poisson representation ,Champs de Markov cachés ,Single-cell data ,[SDV.BBM.MN]Life Sciences [q-bio]/Biochemistry, Molecular Biology/Molecular Networks [q-bio.MN] ,Données de cellules uniques ,[SDV.BIBS]Life Sciences [q-bio]/Quantitative Methods [q-bio.QM] ,Représentation de Poisson ,Stochastic gene expression ,Réseaux de réactions chimiques ,[MATH]Mathematics [math] ,Piecewise-deterministic Markov processes ,Inférence de réseaux de gènes - Abstract
Gene expression in cells has long been only observable through averaged quantities over cell populations. The recent development of single-cell transcriptomics has enabled gene expression to be measured in individual cells: it turns out that even in an isogenic population, the molecular variability can be very important. In particular, an average description is not sufficient to account for cell differentiation. In this thesis, we are interested in the emergence of such cell decision-making from underlying gene regulatory networks, which we would like to infer from data. The starting point is the construction of a stochastic gene network model that is able to explain the data using physical arguments. Genes are then seen as an interacting particle system that happens to be a piecewise-deterministic Markov process, and our aim is to derive a tractable statistical model from its invariant distribution. We present two approaches: the first one is a popular self-consistent field approximation, for which we obtain a concentration result, and the second one is based on an analytically tractable particular case, which provides a hidden Markov random field with interesting properties.; L'expression des gènes dans les cellules a longtemps été observable uniquement à travers des quantités moyennes mesurées sur des populations. L'arrivée des techniques « single-cell » permet aujourd'hui de mesurer des niveaux d'ARN et de protéines dans des cellules individuelles : il s'avère que même dans une population de génome identique, la variabilité entre les cellules est parfois très forte. En particulier, une description moyenne est insuffisante pour étudier la différenciation cellulaire, c'est-à-dire la façon dont les cellules souches effectuent des choix de spécialisation. Dans cette thèse, on s'intéresse à l'émergence de tels choix à partir de réseaux de régulation sous-jacents entre les gènes, que l'on souhaiterait pouvoir inférer à partir de données. Le point de départ est la construction d'un modèle stochastique de réseau de gènes capable de reproduire les observations à partir d'arguments physiques. Les gènes sont alors décrits comme un système de particules en interaction qui se trouve être un processus de Markov déterministe par morceaux, et l'on cherche à obtenir un modèle statistique à partir de sa loi invariante. Nous présentons deux approches : la première correspond à une approximation de champ auto-cohérent assez populaire en physique, pour laquelle nous obtenons un résultat de concentration, et la deuxième se base sur un cas particulier que l'on sait résoudre explicitement, ce qui aboutit à un champ de Markov caché aux propriétés intéressantes.
- Published
- 2018
32. Non-parametric Methods of post-processing for Ensemble Forecasting
- Author
-
Taillardat, Maxime, Laboratoire des Sciences du Climat et de l'Environnement [Gif-sur-Yvette] (LSCE), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Université Paris Saclay (COmUE), Philippe Naveau, Anne-Laure Fougères, Olivier Mestre, and Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)
- Subjects
Statistics ,Verification ,Vérification ,[SDU.STU]Sciences of the Universe [physics]/Earth Sciences ,Ensemble forecasting ,Random forests ,Extreme events ,Événements extrêmes ,Régression quantile ,Meteorology ,Quantile regression ,Statistiques ,Forêts aléatoires ,Prévision d'ensemble ,Météorologie - Abstract
In numerical weather prediction, ensemble forecasts systems have become an essential tool to quantifyforecast uncertainty and to provide probabilistic forecasts. Unfortunately, these models are not perfect and a simultaneouscorrection of their bias and their dispersion is needed.This thesis presents new statistical post-processing methods for ensemble forecasting. These are based onrandom forests algorithms, which are non-parametric.Contrary to state of the art procedures, random forests can take into account non-linear features of atmospheric states. They easily allowthe addition of covariables (such as other weather variables, seasonal or geographic predictors) by a self-selection of the mostuseful predictors for the regression. Moreover, we do not make assumptions on the distribution of the variable of interest. This new approachoutperforms the existing methods for variables such as surface temperature and wind speed.For variables well-known to be tricky to calibrate, such as six-hours accumulated rainfall, hybrid versions of our techniqueshave been created. We show that these versions (and our original methods) are better than existing ones. Especially, they provideadded value for extreme precipitations.The last part of this thesis deals with the verification of ensemble forecasts for extreme events. We have shown several properties ofthe Continuous Ranked Probability Score (CRPS) for extreme values. We have also defined a new index combining the CRPS and the extremevalue theory, whose consistency is investigated on both simulations and real cases.The contributions of this work are intended to be inserted into the forecasting and verification chain at Météo-France.; En prévision numérique du temps, les modèles de prévision d'ensemble sont devenus un outil incontournable pour quantifier l'incertitude des prévisions et fournir des prévisions probabilistes. Malheureusement, ces modèles ne sont pas parfaits et une correction simultanée de leur biais et de leur dispersion est nécessaire.Cette thèse présente de nouvelles méthodes de post-traitement statistique des prévisions d'ensemble. Celles-ci ont pour particularité d'être basées sur les forêts aléatoires.Contrairement à la plupart des techniques usuelles, ces méthodes non-paramétriques permettent de prendre en compte la dynamique non-linéaire de l'atmosphère.Elles permettent aussi d'ajouter des covariables (autres variables météorologiques, variables temporelles, géographiques...) facilement et sélectionnent elles-mêmes les prédicteurs les plus utiles dans la régression. De plus, nous ne faisons aucune hypothèse sur la distribution de la variable à traiter. Cette nouvelle approche surpasse les méthodes existantes pour des variables telles que la température et la vitesse du vent.Pour des variables reconnues comme difficiles à calibrer, telles que les précipitations sexti-horaires, des versions hybrides de nos techniques ont été créées. Nous montrons que ces versions hybrides (ainsi que nos versions originales) sont meilleures que les méthodes existantes. Elles amènent notamment une véritable valeur ajoutée pour les pluies extrêmes.La dernière partie de cette thèse concerne l'évaluation des prévisions d'ensemble pour les événements extrêmes. Nous avons montré quelques propriétés concernant le Continuous Ranked Probability Score (CRPS) pour les valeurs extrêmes. Nous avons aussi défini une nouvelle mesure combinant le CRPS et la théorie des valeurs extrêmes, dont nous examinons la cohérence sur une simulation ainsi que dans un cadre opérationnel.Les résultats de ce travail sont destinés à être insérés au sein de la chaîne de prévision et de vérification à Météo-France.
- Published
- 2017
33. Approches pénalisées et autres développements statistiques pour l'épidémiologie
- Author
-
VIALLON, Vivian, Unité Mixte de Recherche Epidémiologique et de Surveillance Transport Travail Environnement (UMRESTTE UMR T9405), Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut Français des Sciences et Technologies des Transports, de l'Aménagement et des Réseaux (IFSTTAR), Université Claude Bernard Lyon 1, and Anne-Laure Fougères
- Subjects
STATISTICAL ,EPIDEMIOLOGIE ,STATISTIQUE ,EPIDEMIOLOGY ,INFERENCE ,[SDV.SPEE]Life Sciences [q-bio]/Santé publique et épidémiologie ,APPROCHE PENALISEE ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] ,INFERENCE CAUSALE - Abstract
This documents summarizes my recent works in statistics, biostatistics and epidemiology. I have mostly devoted my attention on penalized approaches, in particular to jointly estimate regression models on stratified data. More recently, I have started to study causality.; Mes travaux portent principalement sur des développements statistiques théoriques, méthodologiques ou appliqués, en lien avec des problématiques rencontrées en épidémiologie et en recherche biomédicale. Les questions soulevées dans ces domaines d'application s'interprètent souvent comme un problème de sélection de variables. Celui-ci est des plus classiques en statistique, et des approches dérivées de critères pénalisés sont connues pour le résoudre sous certaines hypothèses. Sous des modèles paramétriques, ces approches encouragent des structures particulières dans le vecteur des paramètres telles que la parcimonie ou l'égalité de certaines composantes, etc. Une part importante de mes recherches porte sur des résultats généraux pour les approches pénalisées par la norme L1 des paramètres ou des dérivées de cette norme. Nous avons notamment développé une méthode de présélection qui permet l'élimination a priori de covariables dans les problèmes de type lasso. L'objectif des méthodes de présélection est de travailler avec des matrices de taille plus faible afin d'accélérer la résolution numérique du lasso, ou de pouvoir tout simplement le résoudre dans les cas où la matrice originale est trop grande. Notre approche était la première à bénéficier de la propriété suivante : les covariables éliminées n'auraient de toute façon pas figuré dans le support de la solution du lasso et notre approche ne modifie donc pas cette solution. Je me suis par ailleurs intéressé aux propriétés asymptotiques des estimateurs dérivés du fused lasso généralisé dans les modèles linéaires généralisés. Le fused lasso généralisé est particulièrement adapté lorsque les covariables d'un modèle de régression sont naturellement organisées en réseau (protéines, gènes, etc.), et s'il est raisonnable d'attendre de covariables connectées dans le réseau qu'elles partagent des effets similaires sur la variable d'intérêt. Le fused lasso généralisé repose sur un graphe qui décrit le réseau (et donc la structure attendue dans le vecteur des paramètres), et nous avons étudié les propriétés des estimateurs du fused lasso généralisé en fonction de l'adéquation entre ce graphe et la véritable structure du vecteur des paramètres du modèle de régression. Par la suite, nous avons étendu le fused lasso généralisé au contexte des modèles non linéaires à effets mixtes, qui sont utilisés en pharmacocinétique pour modéliser les concentrations de médicament dans le sang au cours du temps, en fonction de paramètres individuels inconnus (volume sanguin, taux d'absorption, etc.). Je me suis également intéressé au contexte spécifique des données stratifiées. Dans ce contexte, la question principale est de déterminer si le niveau d'association entre deux variables est identique chez tous les individus d'une population ou si au contraire il varie à travers des sous-groupes prédéfinis de cette population (ou strates). Le fused lasso généralisé est adapté à ce contexte, mais souffre de certaines limites. J'ai travaillé au développement d'une nouvelle approche, et étudié ses propriétés théoriques, reposant sur une pénalité spécialement adaptée à l'identification des hétérogénéités entre les paramètres de modèles de régression définis dans différentes strates. Outre les modèles de régression, je me suis intéressé aux approches pénalisées dans le cadre de l'estimation des modèles graphiques binaires, qui permettent l'étude des relations d'indépendance conditionnelle parmi un ensemble de variables binaires. Enfin, les études épidémiologiques soulèvent le plus souvent la question de l'inférence des effets causaux des facteurs de risque étudiés, et je me suis dernièrement intéressé à l'application des principes de l'inférence causale en épidémiologie du risque routier.
- Published
- 2016
34. Penalized approaches and other statistical methods in epidemiology
- Author
-
VIALLON, Vivian, Cadic, Ifsttar, Unité Mixte de Recherche Epidémiologique et de Surveillance Transport Travail Environnement (UMRESTTE UMR T9405), Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut Français des Sciences et Technologies des Transports, de l'Aménagement et des Réseaux (IFSTTAR), Université Claude Bernard Lyon 1, and Anne-Laure Fougères
- Subjects
STATISTICAL ,EPIDEMIOLOGIE ,[STAT.ME] Statistics [stat]/Methodology [stat.ME] ,[SDV.SPEE] Life Sciences [q-bio]/Santé publique et épidémiologie ,STATISTIQUE ,EPIDEMIOLOGY ,[SDV.SPEE]Life Sciences [q-bio]/Santé publique et épidémiologie ,INFERENCE ,APPROCHE PENALISEE ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] ,INFERENCE CAUSALE - Abstract
This documents summarizes my recent works in statistics, biostatistics and epidemiology. I have mostly devoted my attention on penalized approaches, in particular to jointly estimate regression models on stratified data. More recently, I have started to study causality., Mes travaux portent principalement sur des développements statistiques théoriques, méthodologiques ou appliqués, en lien avec des problématiques rencontrées en épidémiologie et en recherche biomédicale. Les questions soulevées dans ces domaines d'application s'interprètent souvent comme un problème de sélection de variables. Celui-ci est des plus classiques en statistique, et des approches dérivées de critères pénalisés sont connues pour le résoudre sous certaines hypothèses. Sous des modèles paramétriques, ces approches encouragent des structures particulières dans le vecteur des paramètres telles que la parcimonie ou l'égalité de certaines composantes, etc. Une part importante de mes recherches porte sur des résultats généraux pour les approches pénalisées par la norme L1 des paramètres ou des dérivées de cette norme. Nous avons notamment développé une méthode de présélection qui permet l'élimination a priori de covariables dans les problèmes de type lasso. L'objectif des méthodes de présélection est de travailler avec des matrices de taille plus faible afin d'accélérer la résolution numérique du lasso, ou de pouvoir tout simplement le résoudre dans les cas où la matrice originale est trop grande. Notre approche était la première à bénéficier de la propriété suivante : les covariables éliminées n'auraient de toute façon pas figuré dans le support de la solution du lasso et notre approche ne modifie donc pas cette solution. Je me suis par ailleurs intéressé aux propriétés asymptotiques des estimateurs dérivés du fused lasso généralisé dans les modèles linéaires généralisés. Le fused lasso généralisé est particulièrement adapté lorsque les covariables d'un modèle de régression sont naturellement organisées en réseau (protéines, gènes, etc.), et s'il est raisonnable d'attendre de covariables connectées dans le réseau qu'elles partagent des effets similaires sur la variable d'intérêt. Le fused lasso généralisé repose sur un graphe qui décrit le réseau (et donc la structure attendue dans le vecteur des paramètres), et nous avons étudié les propriétés des estimateurs du fused lasso généralisé en fonction de l'adéquation entre ce graphe et la véritable structure du vecteur des paramètres du modèle de régression. Par la suite, nous avons étendu le fused lasso généralisé au contexte des modèles non linéaires à effets mixtes, qui sont utilisés en pharmacocinétique pour modéliser les concentrations de médicament dans le sang au cours du temps, en fonction de paramètres individuels inconnus (volume sanguin, taux d'absorption, etc.). Je me suis également intéressé au contexte spécifique des données stratifiées. Dans ce contexte, la question principale est de déterminer si le niveau d'association entre deux variables est identique chez tous les individus d'une population ou si au contraire il varie à travers des sous-groupes prédéfinis de cette population (ou strates). Le fused lasso généralisé est adapté à ce contexte, mais souffre de certaines limites. J'ai travaillé au développement d'une nouvelle approche, et étudié ses propriétés théoriques, reposant sur une pénalité spécialement adaptée à l'identification des hétérogénéités entre les paramètres de modèles de régression définis dans différentes strates. Outre les modèles de régression, je me suis intéressé aux approches pénalisées dans le cadre de l'estimation des modèles graphiques binaires, qui permettent l'étude des relations d'indépendance conditionnelle parmi un ensemble de variables binaires. Enfin, les études épidémiologiques soulèvent le plus souvent la question de l'inférence des effets causaux des facteurs de risque étudiés, et je me suis dernièrement intéressé à l'application des principes de l'inférence causale en épidémiologie du risque routier.
- Published
- 2016
35. Modélisation spatiale de valeurs extrêmes : application à l'étude de précipitations en France
- Author
-
Sebille, Quentin, STAR, ABES, Institut Camille Jordan [Villeurbanne] ( ICJ ), École Centrale de Lyon ( ECL ), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 ( UCBL ), Université de Lyon-Institut National des Sciences Appliquées de Lyon ( INSA Lyon ), Université de Lyon-Institut National des Sciences Appliquées ( INSA ) -Institut National des Sciences Appliquées ( INSA ) -Université Jean Monnet [Saint-Étienne] ( UJM ) -Centre National de la Recherche Scientifique ( CNRS ), Université de Lyon, Anne-Laure Fougères, Cécile Mercadier, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), and Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[MATH.MATH-PR]Mathematics [math]/Probability [math.PR] ,[MATH.MATH-PR] Mathematics [math]/Probability [math.PR] ,Extreme precipitation ,Processus spatiaux ,Extreme values ,Spatial processes ,Précipitations extrêmes ,Risk measures ,Mesures de risque ,[ MATH.MATH-PR ] Mathematics [math]/Probability [math.PR] ,Valeurs extrêmes - Abstract
Extreme precipitation in France are responsible for flooding events that cause people's deaths and billions of euros in material damage. Measuring the risk associated to these rare meteorological events is possible thanks to the extreme value theory which allows the estimation of such catastrophic scenarios. This thesis focus on three risk measures involving joint probabilities and spatial prediction methods related to geostatistics.In a first time, several spatial models for extreme values built on annual maxima are evaluated in a comparative study in the form of an article. This comparison is performed using simulated data from real annual maxima of precipitation in France. It is also based on two criteria linked to risk measures: the hundred years return level and the extremal coefficient. One particular model is presented in details: the one of Reich and Shaby (2012). This model is implemented under a R package entirely dedicated to its estimation and simulation procedures.In a second time, exceedances of spatial daily data are modelled in order to estimate a conditional failure probability. Several estimators of this measure are proposed, based on the one hand on parametric methods involving Pareto processes and on the other hand on non parametric approaches. The temporal dependence in extremes is also considered with care when estimating this probability.Along this thesis, the methods are applied on daily data of precipitation in France, Les précipitations extrêmes en France sont responsables de phénomènes d'inondations entraînant la perte de vies humaines et des millions d'euros en dégâts matériels. Mesurer le risque associé à ces événements météorologiques rares fait appel à la théorie statistique des valeurs extrêmes, qui propose plusieurs approches permettant d'évaluer des scénarios catastrophes. Cette thèse s'intéresse en particulier à trois mesures de risque faisant intervenir à la fois des lois de probabilité jointes et des méthodes de prédiction spatiale liées à la géostatistique.Dans un premier temps, plusieurs modèles spatiaux de valeurs extrêmes construits sur des données de maxima annuels sont évalués dans une étude comparative sous la forme d'un article. La comparaison des méthodes est menée en se servant de simulations construites à partir de données réelles de maxima annuels de précipitations en France et porte sur des critères liés aux deux mesures de risque que sont le niveau de retour centennal et le coefficient extrémal.Un modèle en particulier, le processus max-stable et hiérarchique de Reich et Shaby (2012) est étudié en détail et fait l'objet d'une implémentation sous la forme d'un package R dédié à la simulation et à l'estimation par cette méthode.Dans un second temps, les données journalières dépassant un seuil élevé sont modélisées dans un cadre spatial dans le but d'estimer une probabilité d'échec conditionnelle. Plusieurs estimateurs de cette mesure sont proposés en se concentrant d'une part sur des méthodes paramétriques liées aux processus Pareto et d'autre part sur deux approches non paramétriques. Les méthodes sont construites de sorte que la dépendance temporelle observable dans les valeurs journalière soit prise en compte lors de l'estimation.Tout au long de la thèse, les méthodes développées sont appliquées sur des données journalières de précipitations en France
- Published
- 2016
36. Sequential Monte Carlo methods and likelihoods for inference of context-dependent evolutionary models
- Author
-
Huet , Alexis, Institut Camille Jordan [Villeurbanne] ( ICJ ), École Centrale de Lyon ( ECL ), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 ( UCBL ), Université de Lyon-Institut National des Sciences Appliquées de Lyon ( INSA Lyon ), Université de Lyon-Institut National des Sciences Appliquées ( INSA ) -Institut National des Sciences Appliquées ( INSA ) -Université Jean Monnet [Saint-Étienne] ( UJM ) -Centre National de la Recherche Scientifique ( CNRS ), Université Claude Bernard - Lyon I, Anne-Laure Fougères, Jean Bérard, Institut Camille Jordan [Villeurbanne] (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), and STAR, ABES
- Subjects
Auxiliary particule filter ,[MATH.MATH-GM]Mathematics [math]/General Mathematics [math.GM] ,Vraisemblances composites ,Filtre particulaire auxiliaire ,Particle filter ,[ MATH.MATH-GM ] Mathematics [math]/General Mathematics [math.GM] ,Chaînes de Markov cachées ,Context-dependent evolutionary models ,[MATH.MATH-GM] Mathematics [math]/General Mathematics [math.GM] ,Méthodes particulaires ,Hidden Markov models ,Modèles d’évolution avec dépendance au contexte ,Composite likelihood methods - Abstract
This thesis is devoted to the inference of context-dependent evolutionary models of DNA sequences, and is specifically focused on the RN95+YPR class of stochastic models. This class of models is based on the reinforcement of some substitution rates depending on the local context, which introduces dependence phenomena between sites in the evolution of the DNA sequence. Because of these dependencies, the direct computation of the likelihood of the observed sequences involves high-dimensional matrices, and is usually infeasible. Through encodings specific to the RN95+YpR class, we highlight new spatial dependence structures for these models, which are related to the evolution of DNA sequences throughout their evolutionary history. This enables the use of particle filter algorithms, developed in the context of hidden Markov models, in order to obtain consistent approximations of the likelihood. Another type of approximation of the likelihood, based on composite likelihoods, is also introduced. These approximation methods for the likelihood are implemented in a C++ program. They are applied on simulated data to empirically investigate some of their properties, and on genomic data, especially for comparison of evolutionary models, Cette thèse est consacrée à l'inférence de modèles stochastiques d'évolution de l'ADN avec dépendance au contexte, l'étude portant spécifiquement sur la classe de modèles stochastiques RN95+YpR. Cette classe de modèles repose sur un renforcement des taux d'occurrence de certaines substitutions en fonction du contexte local, ce qui introduit des phénomènes de dépendance dans l'évolution des différents sites de la séquence d'ADN. Du fait de cette dépendance, le calcul direct de la vraisemblance des séquences observées met en jeu des matrices de dimensions importantes, et est en général impraticable. Au moyen d'encodages spécifiques à la classe RN95+YpR, nous mettons en évidence de nouvelles structures de dépendance spatiales pour ces modèles, qui sont associées à l'évolution des séquences d'ADN sur toute leur histoire évolutive. Ceci rend notamment possible l'utilisation de méthodes numériques particulaires, développées dans le cadre des modèles de Markov cachés, afin d'obtenir des approximations consistantes de la vraisemblance recherchée. Un autre type d'approximation de la vraisemblance, basé sur des vraisemblances composites, est également introduit. Ces méthodes d'approximation de la vraisemblance sont implémentées au moyen d'un code en C++. Elles sont mises en œuvre sur des données simulées afin d'étudier empiriquement certaines de leurs propriétés, et sur des données génomiques, notamment à des fins de comparaison de modèles d'évolution
- Published
- 2014
37. Bayesian model mergings for multivariate extremes Application to regional predetermination of floods with incomplete data
- Author
-
Anne, Sabourin, Département Traitement du Signal et des Images (TSI), Télécom ParisTech-Centre National de la Recherche Scientifique (CNRS), Université Claude Bernard - Lyon I, Anne-Laure Fougères(fougeres@math.univ-lyon1.fr), and Sabourin, Anne
- Subjects
[STAT.AP]Statistics [stat]/Applications [stat.AP] ,[STAT.ME] Statistics [stat]/Methodology [stat.ME] ,[STAT.TH] Statistics [stat]/Statistics Theory [stat.TH] ,MCMC sampling ,Extrêmes multivariés ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Multivariate extremes ,dépassements de seuil ,threshold excesses ,prédétermination des crues ,mélanges de Dirichlet ,[STAT.AP] Statistics [stat]/Applications [stat.AP] ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,augmentation de données ,Dirichlet mixtures ,mixture models ,Bayesian Model Averaging ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] ,predetermination of floods ,data augmentation ,modèles de mélange ,échantillonnage MCMC - Abstract
Uni-variate extreme value theory extends to the multivariate case but the absence of a natural parametric framework for the joint distribution of extremes complexifies inferential matters. Available non parametric estimators of the dependence structure do not come with tractable uncertainty intervals for problems of dimension greater than three. However, uncertainty estimation is all the more important for applied purposes that data scarcity is a recurrent issue, particularly in the field of hydrology. The purpose of this thesis is to develop modeling tools for the dependence structure between extremes, in a Bayesian framework that allows uncertainty assessment. Chapter 2 explores the properties of the model obtained by combining existing ones, in a Bayesian Model Averaging framework. A semi-parametric Dirichlet mixture model is studied next: a new parametrization is introduced, in order to relax a moments constraint which characterizes the dependence structure. The re-parametrization significantly improves convergence and mixing properties of the reversible-jump algorithm used to sample the posterior. The last chapter is motivated by an hydrological application, which consists in estimating the dependence structure of floods recorded at four neighboring stations, in the 'Gardons' region, southern France, using historical data. The latter increase the sample size but most of them are censored. The lack of explicit expression for the likelihood in the Dirichlet mixture model is handled by using a data augmentation framework., La théorie statistique univariée des valeurs extrêmes se généralise au cas multivarié mais l'absence d'un cadre paramétrique naturel complique l'inférence de la loi jointe des extrêmes. Les marges d'erreur associées aux estimateurs non paramétriques de la structure de dépendance sont difficilement accessibles à partir de la dimension trois. Cependant, quantifier l'incertitude est d'autant plus important pour les applications que le problème de la rareté des données extrêmes est récurrent, en particulier en hydrologie. L'objet de cette thèse est de développer des modèles de dépendance entre extrêmes, dans un cadre bayésien permettant de représenter l'incertitude. Après une introduction à la théorie des valeurs extrêmes et à l'inférence bayésienne (chapitre 1), le chapitre 2 explore les propriétés des modèles obtenus en combinant des modèles paramétriques existants, par mélange bayésien (Bayesian Model Averaging). Un modèle semi-paramétrique de mélange de Dirichlet est étudié au chapitre suivant : une nouvelle paramétrisation est introduite afin de s'affranchir d'une contrainte de moments caractéristique de la structure de dépendance et de faciliter l'échantillonnage de la loi a posteriori. Le chapitre~\ref{censorDiri} est motivé par une application hydrologique: il s'agit d'estimer la structure de dépendance spatiale des crues extrêmes dans la région cévenole des Gardons en utilisant des données historiques enregistrées en quatre points. Les données anciennes augmentent la taille de l'échantillon mais beaucoup de ces données sont censurées. Une méthode d'augmentation de données est introduite, dans le cadre du mélange de Dirichlet, palliant l'absence d'expression explicite de la vraisemblance censurée. Les perspectives sont discutées au chapitre 5.
- Published
- 2013
38. From stochastic modelling of gene expression to inference of regulatory networks
- Author
-
Ulysse Herbach, Institut Camille Jordan (ICJ), École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), Laboratoire de biologie et modélisation de la cellule (LBMC UMR 5239), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS), Multi-scale modelling of cell dynamics : application to hematopoiesis (DRACULA), Centre de génétique et de physiologie moléculaire et cellulaire (CGPhiMC), Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)-Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Institut Camille Jordan (ICJ), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Probabilités, statistique, physique mathématique (PSPM), Université de Lyon, Thibault Espinasse, Anne-Laure Fougères, Olivier Gandrillon, Institut Camille Jordan [Villeurbanne] (ICJ), Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Université de Lyon-Université de Lyon-École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Institut National de la Santé et de la Recherche Médicale (INSERM), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de génétique et de physiologie moléculaire et cellulaire (CGPhiMC), and Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Hidden Markov random fields ,Expression stochastique des gènes ,Processus de Markov déterministes par morceaux ,Chemical reaction networks ,Gene network inference ,Poisson representation ,Champs de Markov cachés ,Single-cell data ,[SDV.BBM.MN]Life Sciences [q-bio]/Biochemistry, Molecular Biology/Molecular Networks [q-bio.MN] ,Données de cellules uniques ,[SDV.BIBS]Life Sciences [q-bio]/Quantitative Methods [q-bio.QM] ,Représentation de Poisson ,Stochastic gene expression ,Réseaux de réactions chimiques ,[MATH]Mathematics [math] ,Piecewise-deterministic Markov processes ,Inférence de réseaux de gènes - Abstract
Gene expression in cells has long been only observable through averaged quantities over cell populations. The recent development of single-cell transcriptomics has enabled gene expression to be measured in individual cells: it turns out that even in an isogenic population, the molecular variability can be very important. In particular, an average description is not sufficient to account for cell differentiation. In this thesis, we are interested in the emergence of such cell decision-making from underlying gene regulatory networks, which we would like to infer from data. The starting point is the construction of a stochastic gene network model that is able to explain the data using physical arguments. Genes are then seen as an interacting particle system that happens to be a piecewise-deterministic Markov process, and our aim is to derive a tractable statistical model from its invariant distribution. We present two approaches: the first one is a popular self-consistent field approximation, for which we obtain a concentration result, and the second one is based on an analytically tractable particular case, which provides a hidden Markov random field with interesting properties.; L'expression des gènes dans les cellules a longtemps été observable uniquement à travers des quantités moyennes mesurées sur des populations. L'arrivée des techniques « single-cell » permet aujourd'hui de mesurer des niveaux d'ARN et de protéines dans des cellules individuelles : il s'avère que même dans une population de génome identique, la variabilité entre les cellules est parfois très forte. En particulier, une description moyenne est insuffisante pour étudier la différenciation cellulaire, c'est-à-dire la façon dont les cellules souches effectuent des choix de spécialisation. Dans cette thèse, on s'intéresse à l'émergence de tels choix à partir de réseaux de régulation sous-jacents entre les gènes, que l'on souhaiterait pouvoir inférer à partir de données. Le point de départ est la construction d'un modèle stochastique de réseau de gènes capable de reproduire les observations à partir d'arguments physiques. Les gènes sont alors décrits comme un système de particules en interaction qui se trouve être un processus de Markov déterministe par morceaux, et l'on cherche à obtenir un modèle statistique à partir de sa loi invariante. Nous présentons deux approches : la première correspond à une approximation de champ auto-cohérent assez populaire en physique, pour laquelle nous obtenons un résultat de concentration, et la deuxième se base sur un cas particulier que l'on sait résoudre explicitement, ce qui aboutit à un champ de Markov caché aux propriétés intéressantes.
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.