Accueil
 
Analyse de données
 
Plan d'expériences
 
Formation
 
Nous contacter



BIBLIOGRAPHIE de la "Méthode CorIco"

Retour aux questions ? ...

Développée dans les années 1975-1981, l'Iconographie des Corrélations ou "méthode CorIco" (Correlation Iconography) a d'abord fait l'objet d'une thèse d'État intitulée : "Analyse Informatique de Données Géochimiques sur les Échanges Air-Mer" - 14 décembre 1981 - Université de Paris VII.

Elle fut suivie d'un article publiée dans la revue de J.P. Benzecri :
"La Synthèse Géométrique des Corrélations Multidimensionnelles." M. Lesty et P. Buat-Ménard. Les Cahiers de l'Analyse des données, Vol.VII, n°3, 1982, pp.355-370.

Depuis lors, la méthode n'a cessé d'être améliorée, au travers d'applications dans la recherche et l'industrie.

Bibliographie récente de CORICO.

" Corrélations partielles et « Corrélations duales » " M. Lesty, La Revue de Modulad, n°39, pp.1-22, décembre 2008.

Résumé :
Par analogie avec l’interprétation géométrique de la « corrélation partielle », tirée de la formule fondamentale du triangle sphérique, on introduit la notion de « corrélation duale ». Les propriétés de ces corrélations, examinées d’abord sur un cas d’école, se révèlent un moyen souple d’investigation de données géochimiques et astronomiques. Quatre sources indépendantes de calcium et quatre sources indépendantes de radon, sont mises en évidences dans l’aérosol marin de l’Atlantique Nord. Une comparaison est faite avec le radon de l’île Amsterdam. Une composante du CO2 atmosphérique est liée aux taches solaires. Article

" Une nouvelle approche dans le choix des régresseurs de la régression multiple en présence d'interactions et de colinéarités. " M. Lesty, La Revue de Modulad, n°22, pp.41-77, janvier 1999.

Résumé :
A partir d'exemples simples (performances en gymnastique, gain de poids des animaux, indice du marché des actions américain) on présente une méthode originale de choix des variables et interactions d'ordre 2 dans un modèle de régression multiple, en présence de multicolinéarités et d'interactions. La méthode CORICO (Iconographie des Corrélations) est fondée sur les corrélations totales et partielles. La détection des points aberrants est obtenue au moyen de variables indicatrices des observations. L'introduction de fonctions logiques non linéaires d'ordre 2 améliore l'interprétation du plan d'expérience. Une annexe contient l'exposé synthétique des principes de la méthode CORICO, ainsi qu'une bibliographie. Article

" La Recherche des Harmoniques, une Nouvelle Fonction du Logiciel CORICO ." M.Lesty, La revue de Modulad, n°29, pp 39-78, juin 2002.

Résumé :
Outre l'analyse de données et le plan d'expériences, la méthode CORICO innove dans la modélisation. Son aptitude à SELECTIONNER les régresseurs pertinents parmi des dizaines de milliers de fonctions non linéaires, telles qu'interactions logiques, motifs périodiques, effet de seuil, ruptures de tendance, points atypiques, etc.., est illustrée ici dans le cas particulier des séries temporelles.

Le principe de décomposition, absolument général, simple et robuste, ne recourt pas à l'analyse de Fourier, limitée aux composantes sinusoïdales stationnaires, ni au processus ARIMA, réclamant une cadence régulière d'échantillonnage, ni aux lissages de courbes par moyennes mobiles qui augmentent les risques de créer des saisonnalités parasites. Les exemples, très divers, sont présentés pas à pas, illustrés de graphes explicites.

Dans la décomposition traditionnelle des séries temporelles en saisonnalité, tendance et résidu, la prévision est possible si la série désaisonnalisée (la tendance) présente une forme aisément prolongeable vers le futur. Ce qui n'est pas toujours le cas lorsque la tendance est irrégulière. La méthode CORICO conduit au contraire à décomposer la série en :
  • des composantes qui se prêtent à la prévision (saisonnalités, rupture de tendances, interactions, motifs périodiques...),
  • des composantes qui n'empêchent pas la prévision, car localisées dans le temps (morceaux d'onde, points atypiques). Article
  • La Synthèse Géométrique des Corrélations Multidimensionnelles.
    M. Lesty et P. Buat-Ménard. Les Cahiers de l'Analyse des données, Vol.VII, n°3, 1982, pp.355-370.

    Résumé :
    La construction sphérique du schéma de CORICO est fondée sur l'aspect géométrique des corrélations totales et partielles (parcor). La précision trigonométrique met en évidence la structure organisée de microvariations géochimiques qui, sans cela, eussent été considérées comme du bruit. Lors d'une étude classique, la complexité des phénomènes conduit à une sélection, toujours arbitraire, des paramètres dont l'analyse est jugée prioritaire. Les schémas de CORICO permettent d'emblée, au contraire, une vue globale des multiples paramètres disponibles. Ils attirent l'attention sur des phénomènes géochimiques importants de l'atmosphère marine, comme le lien du radon avec le coefficient de marée, ou l'association du mercure avec le passage des fronts. D'autres phénomènes, de nature plus complexe, comme le groupe Rn, SO4, Se, Ca, Br, ne pouvaient être mis en lumière que par ce type de figure. Enfin, la possibilité de séparer les diverses composantes, montre une composante marine du chrome associée à celle du fer.

    " CORICO analyse les données dans l'agro-alimentaire." 01 Informatique, Numéro Spécial octobre 1999, p. 109.

    Résumé :
    Présentation succincte de l'entreprise CORYENT et du logiciel CORICO. Comment réduire les coûts expérimentaux.

    " Le Principe des Plans d'Expériences de type CORICO." Colloque Chimiométrie 2000, 6 -7 décembre 2000, Paris, Résumé des Communications, p. 83.

    " Interpolation d'une étoile variable, RT Cygni." M. Lesty, Bulletin de l'AFOEV n°96 - juin 2001, pp.8-13.

    Résumé :
    La décomposition harmonique de type CORICO, tout à fait inédite, n'est fondée ni sur les moyennes mobiles, ni sur le calcul différentiel, ni sur l'analyse de Fourrier, ni sur la dispersion de phase, ni sur les ondelettes, mais sur le seul calcul des corrélations totales et partielles. La corrélation étant un cosinus dans l'espace à n dimensions, cette méthode, purement trigonométrique, ne suppose à aucun moment une relation entre un instant t et un instant t+dt ou t+n; d'où sa grande précision, et la possibilité d'un calcul rigoureux même lorsque la cadence d'échantillonnage n'est pas régulière, comme c'est le cas pour les étoiles variables, en raison des intempéries.

    "Analyse des Corrélations et Fabrication des Composites." C. Vallée et X. Le Méteil. La Maîtrise du risque dans la Construction Aéronautique. Phoebus n°19 (tome 2) - 4 ième trimestre 2001.

    Résumé :
    La fabrication et l'intégration des composites dans les structures volantes restent souvent délicates et engendrent de nombreux rebuts face aux exigences sévères de fiabilité des matériels. La méthode CORICO permet d'exploiter les données disponibles dans les procès verbaux de réception de matière, de réduire les tests effectués habituellement à réception de ces lots, en ne conservant que les plus pertinents, et enfin, de mieux spécifier le produit vers les fournisseurs. Cette démarche s'inscrit dans la politique continue de réduction des coûts versus fiabilité qui reste un axe important pour la sûreté de fonctionnement au niveau du groupe SNECMA. La méthode peut être transposée à de nombreux problèmes.

    " Geometric Method and Generalized Linear Models: Two opposite Multiparametric Approaches Illustrated on a Sample of Pituitary Adenomas." Lesty C., Pleau-Varet J. & Kujas M. Journal of Applied Statistics Vol 31(2): pp191-213. February 2004.

    Abstract:
    This paper compares two general approaches to data analysis: based on general linear models and on CORICO geometric interpretation. The focus is on model selection (which variables to have in the model). The authors applied the methods to two different situations (a "case-control study" and a "historical cohort"). They show that the geometric exploratory tool is particularly suited to the analysis of small samples with a large number of variables. It could save time when setting up new study protocols. In this instance, the geometric approach highlighted, without preconceived ideas, the potential role of multihormonality in the course of pituitary adenoma and the unexpected influence of the date of tumor excision on the risk attached to haemorrhage.

    " Cleaved Lymphocytes in Chronic Lymphocytic Leukemia: A Detailed Retrospective Analysis of Diagnostic Features." Hugo Gonzalez , Karim Maloum , Florence Remy, Hélène Merle-Béral , Claude Lesty. Leukemia and Lymphoma, Volume 43, Number 3/2002 , pp 555-564

    Abstract:
    Through a global analysis of diagnostic features, the aim was to profile CLL patients with circulating cleaved lymphocytes at diagnosis, a controversial prognostic factor. Although some of them could have been considered today as having Non-Hodgkin's lymphoma, all 106 patients of our retrospective series have had CLL treatments. Slide review distinguished seven lymphocyte morphotypes. With minimal a priori assumptions, excluding in particular clinical staging systems, forty-five diagnostic features were analyzed in 37 patients. CORICO (Correlations Iconography), a purely geometric method, deciphered the multidimensional structure of the raw data. Probabilistic monoparametric tests were made on the 106 patients. In ten patients (Binet stages: 3A, 6B, 1C), at least 8% of the lymphocytes were cleaved. Unrelated to the prolymphocytes, this morphotype had neither links with the CD5+CD23+ (9/10 vs 80/86), FMC7+ (5/10 vs 22/62), CD38 (1/7 vs 7/64) markers nor with any major CLL laboratory values; only three links characterized it: no cases of mixed marrow infiltrate (nodular: 1, interstitial: 6, diffuse: 3; ns), a lower percentage of eosinophils (ns), and predominance of CD11c (7/l0 vs 20/66, p<0.02). In conclusion, in contrast to the PLL morphotype, or to the lactic dehydrogenase (LDH) activity, which was a strong prognostic factor in this series, an independent detrimental value of the cleaved morphotype has not yet been found. Our study shows that free of modeling constraints, this method makes possible a rapid and objective insight into variable interrelations. If further explored in a prospective study, this approach may contribute to the understanding of discrepancies in the literature.

    " Multi-correlation analyses of TOF-SIMS spectra for mineralogical studies." C. Engrand, J. Lespagnol, P.Martin, L. Thirkell, R. Thomas. Applied Surface Science 231-232 (2004) 883-887

    Abstract:
    The authors reports the statistical treatment of TOF-SIMS spectra recorded from two different kind of silicate which are abundant in extraterrestrial matter. The CORICO software used for this treatment: (1) show the correlation between spectra of the same mineralogical composition; (2) identifies mass peak which may introduce experimental bias (In, Na, K, etc.); (3) reveals unexpected differences in the anaysis of two fragments of the same mineral (case of the Ca-rich pyroxene).

    " Chemometric evaluation of time-of-flight secondary ion mass spectrometry data of minerals in the frame of future in situ analyses of cometary material by COSIMA onboard ROSETTA." Engrand C;, Kissel J., Krueger F.R., Martin P., Silén J., Thirkel L.l, Thomas R., Varmuza K. (2006). (Rapid Communications in Mass Spectrometry Volume 20, Issue 8 p 1361-1368) Published Online: 23 Mar 2006 (www.interscience.wiley.com).

    Abstract:
    Chemometric data evaluation methods for time-of-flight secondary ion mass spectrometry (TOF-SIMS) have been tested for the characterization and classification of minerals. Potential applications of these methods include the expected data from cometary material to be measured by the COSIMA instrument onboard the ESA mission ROSETTA in the year 2014. Samples of the minerals serpentine, enstatite, olivine, and talc have been used as proxies for minerals existing in extraterrestrial matter. High mass resolution TOF-SIMS data allow the selection of peaks from inorganic ions relevant for minerals. Multivariate cluster analysis of peak intensity data by principal components analysis and the new method CORICO showed a good separation of the mineral classes. Classification by k nearest-neighbor classification (KNN) or binary decision trees (CART method) results in more than 90% correct class assignments in a leave-one-out cross validation. Copyright © 2006 John Wiley & Sons, Ltd.