1. Assessment criteria for confidence interval estimators
- Author
-
Gillibert, André, Centre de recherche en épidémiologie et santé des populations (CESP), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Assistance publique - Hôpitaux de Paris (AP-HP) (AP-HP)-Hôpital Paul Brousse-Institut National de la Santé et de la Recherche Médicale (INSERM)-Université Paris-Saclay, Unité de biostatistiques [CHU Rouen], CHU Rouen, Normandie Université (NU)-Normandie Université (NU)-Université de Rouen Normandie (UNIROUEN), Normandie Université (NU), Université Paris-Saclay, Jacques Benichou, Bruno Falissard, Jacques Bénichou, and STAR, ABES
- Subjects
[STAT.ME] Statistics [stat]/Methodology [stat.ME] ,[STAT.TH] Statistics [stat]/Statistics Theory [stat.TH] ,Confidence interval ,Estimateur ,Interpretation ,[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH] ,Estimator ,Test d’hypothèse ,Directionnel ,Interprétation ,Intervalle de confiance ,Hypothesis test ,Directional ,[STAT.ME]Statistics [stat]/Methodology [stat.ME] - Abstract
INTRODUCTION: the interpretation of confidence intervals and hypothesis tests is usually directional, drawing a distinction between superiority and inferiority. On another note, numerous statistical tools are conditional to statistics that are actually variable such as the model matrix of a generalized linear model or sample size. The aim of this thesis is to propose methods for the assessment of statistical estimators that are consistent with the use that will be done of these tools. METHODS: the consequences of ignoring the directional interpretation in the assessment of statistical tools, especially for survival analysis, were evaluated from reviews of the literature and theoretical considerations. Assessment criteria Assessment criteria based on local averages were proposed to free the assessment of statistical tools from conditioning on variable statistics, such as sample size even when such tools are conditional. Underestimation and overestimation risks were differentiated in the assessment of coverage flaws of confidence intervals. Usual estimators were reassessed with these new criteria : binomial proportion and Poisson regression estimators. RESULTS: the directional interpretation of hypothesis tests about differences in survival curves can lead to a risk of concluding in the opposite direction to the actual difference approaching 50% in some cases. New assessment criteria, in particular, one-sided local average type I error rates, showed the better behavior of the likelihood ratio test and confidence intervals compared to Rao’s score and Wald’s methods for logistic and Poisson regressions. Strictly conservative methods are relevant in some very specific contexts ; otherwise, methods based on mid-P-values should be preferred. Confidence intervals aiming at an imbalance between risks of overestimation and underestimation in order to shorten their overall width lose directional interpretation properties. CONCLUSION: the directional interpretation of hypothesis tests and confidence interval estimators should be taken into account in their design and assessment., INTRODUCTION : l’interprétation des intervalles de confiance et des tests d’hypothèses est généralement directionnelle, c’est-à-dire, distinguant la supériorité de l’infériorité. Par ailleurs, de nombreux outils statistiques conditionnent sur des statistiques qui sont variables, tel que la matrice d’exposition d’un modèle linéaire généralisé ou la taille d’échantillon. L’objectif de cette thèse est de proposer des outils d’évaluation des estimateurs statistiques en adéquation avec l’usage de ces outils. MÉTHODES : les conséquences de l’absence de prise en compte de l’interprétation directionnelle dans l’évaluation des outils statistiques, notamment les tests d’hypothèses concernant les analyses de survie, ont été évaluées à partir de revues de la littérature et de considérations théoriques. Des critères de jugement, basés sur les moyennes locales ont été proposés afin de s’abstraire du conditionnement sur des statistiques variables, notamment la taille d’échantillon, lors de l’évaluation des outils statistiques. Les risques de sous-estimation et surestimation ont été distingués dans l’évaluation des défauts de couverture des intervalles de confiance. Des estimateurs classiques ont été réévalués à la lumière de ces nouveaux critères de jugement : estimateurs d’une proportion binomiale et estimateurs de régressions de Poisson. RÉSULTATS : l’interprétation directionnelle de tests d’hypothèses concernant les différences de courbes de survie peut conduire à un risque de conclure à une différence dans le sens opposé de la différence réelle, qui approche parfois 50 %. Les nouveaux critères de jugement, notamment les risques alpha unilatéraux moyens locaux, ont mis en évidence la supériorité du test du rapport de vraisemblance et des intervalles de confiance associés, par rapport aux méthodes du score de Rao et de Wald, pour les régressions logistiques et de Poisson. Les méthodes visant le strict conservatisme s’avèrent pertinentes dans certains contextes très spécifiques ; autrement les méthodes basées sur les mid-P-valeurs devraient leur être préférées. Les intervalles de confiance visant à un déséquilibre des risques de surestimation et de sous-estimation afin d’en rétrécir la largeur totale perdent des propriétés d’interprétation directionnelle.CONCLUSION : l’interprétation directionnelle qui sera faite des tests d’hypothèses et estimateurs d’intervalles de confiance devrait être prise en compte lors de leur conception et évaluation.
- Published
- 2021