1. Du local au global : un nouveau défi pour l'analyse statistique implicative
- Author
-
Delacroix, Thomas, Lenca, Philippe, Lallich, Stéphane, Lab-STICC_IMTA_CID_DECIDE, Laboratoire des sciences et techniques de l'information, de la communication et de la connaissance (Lab-STICC), Institut Mines-Télécom [Paris] (IMT)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-École Nationale d'Ingénieurs de Brest (ENIB)-École Nationale Supérieure de Techniques Avancées Bretagne (ENSTA Bretagne)-Université de Bretagne Sud (UBS)-Université de Brest (UBO)-Centre National de la Recherche Scientifique (CNRS)-Université Bretagne Loire (UBL)-Institut Mines-Télécom [Paris] (IMT)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-École Nationale d'Ingénieurs de Brest (ENIB)-École Nationale Supérieure de Techniques Avancées Bretagne (ENSTA Bretagne)-Université de Bretagne Sud (UBS)-Université de Brest (UBO)-Centre National de la Recherche Scientifique (CNRS)-Université Bretagne Loire (UBL), Département Logique des Usages, Sciences sociales et Sciences de l'Information (IMT Atlantique - LUSSI), IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Equipe de Recherche en Ingénierie des Connaissances (ERIC), and Université Lumière - Lyon 2 (UL2)
- Subjects
[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB] ,Interestingness measures ,Mutual constrained independence ,Statistical implicative analysis ,Rule mining ,Maximum entropy model ,Indépendance mutuelle contrainte ,Modèles probabilistes ,[MATH.MATH-PR]Mathematics [math]/Probability [math.PR] ,Modèle d'entropie maximale ,Analyse statistique implicative ,[INFO.INFO-CY]Computer Science [cs]/Computers and Society [cs.CY] ,[STAT.ML]Statistics [stat]/Machine Learning [stat.ML] ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Mesure d’intérêt ,Probabilistic models ,Extraction de règles - Abstract
International audience; Statistical implicative analysis, as well as the vast majority of current approaches towards rule mining, are faced with a certain number of difficulties such as the issue of over abundant and redundant rules. While a large number of papers in pattern mining have addressed these issues, most have concentrated on finding solutions rather than identifying causes. We present here one of the main causes of these issues: the local nature of the various approaches in rule mining, which can qualify both the models used for the measure of rule interestingness and the mining process; as well as its counterpart: choosing a global approach. We suggest a certain number of options allowing to make this choice with the objective of opening up to new perspectives and encouraging the transition from a vast majority of current local approaches towards more global approaches.; L'analyse statistique implicative ainsi que la très grande majorité des approches qui ont été développées en extraction de règles sont confrontées à un certain nombre de difficultés dont la surabondance et le caractère redondant des règles extraites. Si de nombreux chercheurs en extraction de motifs ont essayé de proposer des solutions à ces problèmes, ils sont bien moins nombreux à en avoir cherché les causes. On présente ici l'une des causes principales de ces problèmes : le caractère local des approches en extraction de règles qui caractérise à la fois les modèles utilisés pour la mesure de l'intérêt des règles et les processus d'extraction de règles ; ainsi que son contre-pied : le choix d'une approche globale. On propose un certain nombre d'options permettant de faire ce choix dans le but d'ouvrir de nouvelles perspectives et d'accompagner la transition des approches courantes toujours très majoritairement locales vers des approches plus globales.
- Published
- 2017