Back to Search Start Over

Extension of Correspondence Analysis to multiway data-sets through High Order SVD: a geometric framework

Authors :
Olivier Coulaud
Alain Franc
Martina Iannacito
High-End Parallel Algorithms for Challenging Numerical Simulations (HiePACS)
Laboratoire Bordelais de Recherche en Informatique (LaBRI)
Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Inria Bordeaux - Sud-Ouest
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
Biodiversité, Gènes & Communautés (BioGeCo)
Université de Bordeaux (UB)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Inria Bordeaux - Sud-Ouest
Inrae
Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Inria Bordeaux - Sud-Ouest
from patterns to models in computational biodiversity and biotechnology (PLEIADE)
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Biodiversité, Gènes & Communautés (BioGeCo)
Université de Bordeaux (UB)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Source :
HAL, [Research Report] RR-9429, Inria Bordeaux-Sud-Ouest; Inrae. 2021

Abstract

This paper presents an extension of Correspondence Analysis (CA) to tensors through High Order Singular Value Decomposition (HOSVD) from a geometric viewpoint. Correspondence analysis is a well-known tool, developed from principal component analysis, for studying contingency tables. Different algebraic extensions of CA to multi-way tables have been proposed over the years, nevertheless neglecting its geometric meaning. Relying on the Tucker model and the HOSVD, we propose a direct way to associate with each tensor mode a point cloud. We prove that the point clouds are related to each other. Specifically using the CA metrics we show that the barycentric relation is still true in the tensor framework. Finally two data sets are used to underline the advantages and the drawbacks of our strategy with respect to the classical matrix approaches.; Ce document présente une extension de l'analyse des correspondances aux tenseurs par la décomposition en valeurs singulières d'ordre élevé (HOSVD) d'un point de vue géométrique. L'analyse des correspondances est un outil bien connu, développé à partir de l'analyse en composantes principales, pour étudier les tables de contingence. Différentes extensions algébriques de l'analyse des correspondances aux tables à voies multiples ont été proposées au fil des ans. En nous appuyant sur le modèle de Tucker et la HOSVD, nous proposons d'associer à chaque mode d'un tenseur un nuage de points. Nous établissons un lien entre les cordonnées de ces différents nuages. Une telle relation est classique en Analyse Factorielle des Correspondances (AFC) pour justifier la projection simultanée des profils lignes et profils colonnes d'une table de contingence (d'où le nom de correspondance). Nous étendons une telle relation barycentrique aux liens entre les nuages de points associés aux différents modes de l'Analyse Factorielle des Correspondances Multiple d'un tenseur, construite via la HOSVD avec les métriques de l'AFC.

Details

Database :
OpenAIRE
Journal :
HAL, [Research Report] RR-9429, Inria Bordeaux-Sud-Ouest; Inrae. 2021
Accession number :
edsair.dedup.wf.001..64685cf7088f99b1a255a917662eef7e