Accueil
 
Analyse des données
 
Plan d'expériences
 
Formation
 
Références
 
Services
 
Logiciel CORICO
 
Contact



Une comparaison entre l'Analyse en Composantes principales et l'Iconographie des Corrélations.

Le logiciel CORICO, fondé sur « l’Iconographie des Corrélations », contient également des méthodes classiques d’analyse des données, comme « l’Analyse en Composantes Principales » (ACP). Montrons l’un des apports de l’Iconographie des Corrélations.

L’une des limites de l’ACP est qu’elle requiert des ensembles de données homogènes. Or il est souvent utile de travailler sur des données non homogènes, par exemple, mélanger des données quantitatives et des données qualitatives, ou bien des données pluridisciplinaires dont on ne connaît pas à l’avance quelles sont celles qui exercent une influence sur les variables d’intérêt.

TRAITS PLEINS: corrélations positives; TRAITS POINTILLÉS: corrélations négatives.  

Figure A : Iconographie des Corrélations.

Considérons le cas d’école suivant : un tableau de données a donné l'image ci-contre avec CORICO. Il est donc formé d’un mélange de deux ensembles de variables pratiquement indépendants, en effet :

  • Deux ensembles de variables distincts apparaissent, avec une structure remarquable en réseau régulier.
  • Il existe entre eux des liens : les variables E et H du groupe bleu sont liées négativement (traits pointillés) à certaines variables du groupe rouge.

    L’iconographie des corrélations privilégie la représentation des liens et la clarté de la vue globale. Quelle que soit la dimension de l’espace des données (ici 4), la représentation se traduit par une image unique.

    Le tracé explicite des liens lève toute ambiguïté entre proximités apparentes et réelles.

  • Passons à l’Analyse en Composantes Principales (ACP) des mêmes données. Celle-ci privilégie au contraire la rigueur des positions, d’où la nécessité de les projeter sur des plans, au risque de nuire à la lisibilité et à l’interprétation. Le pouvoir de synthèse est inversement proportionnel au nombre d'axes nécessaires à la représentation :

     

    Figure B : Composantes principales 1 et 2.

    Les groupes sont bien séparés par l’axe 1.

    Inconvénient :

  • certains points du groupe bleu ont la même projection (et donc ne se distinguent pas).
  • Les groupes sont vus de profil ; leurs structures n’apparaissent pas.
  •  

    Figure C : Composantes principales 2 et 3.

    La structure du groupe rouge apparaît mais

  • tous les points du groupe bleu sont confondus en une même projection (au centre)
  •  

    Figure D : Composantes principales 3 et 4.

    Inconvénient :

  • La structure des groupes n’apparaît pas.
  • Les groupes rouge et bleu se croisent.
  •  

    Figure E : Composantes principales 4 et 5.

    La structure du groupe bleu apparaît mais

  • tous les points du groupe rouge sont confondus en une même projection (au centre).

  • Conclusion de la comparaison pour ce cas d’école simple

    CORICO bénéficie des apports des méthodes antérieures sans souffrir de leurs limitations :

  • Avec « l'Analyse en Composante Principales », il a fallu quatre projections (figures B, C, D, E) pour faire apparaître la structure de chacun des groupes, et la relation entre ces groupes. Cela exige de l'utilisateur une certaine concentration d’esprit, et une bonne mémoire, pour synthétiser toute l’information.
  • En « Iconographie des corrélations », la structure des deux groupes apparaît sur la seule figure A, et les liens remarquables sont soulignés d’emblée.

    Souvent, les données pertinentes contiennent plus de deux groupes non homogènes; alors l'ACP se complique ou devient inapplicable. En « Iconographie des corrélations » au contraire, il est recommandé d'analyser d'un coup toutes les variables disponibles.

    Conçue pour être comprise du plus large public, l'Iconographie des Corrélations nous aide à surmonter notre difficulté à penser les choses dans leurs dépendances réciproques. En savoir plus.

    Voir aussi : Questions fréquentes.

    D'autres exemples d'analyse de données avec CORICO :

  • Comparaison entre Classification Ascendante Hiérarchique (CAH) et Iconographie des corrélations.
  • La répartition des dirigeants de PME selon leur formation en fonction du secteur.
  • L'analyse des élections Européennes 2009.
  • L'analyse des élections présidentielles 2007.
  • L'analyse des élections législatives 2007 à PARIS.
  • Références, exemples.