Accueil
 
Analyse de données
 
Plan d'expériences
 
Formation
 
Nous contacter



Réponses à des questions fréquentes (suite)

Retour aux questions ? ...

CORICO est-il seulement une méthode exploratoire et descriptive ?

Pas seulement. CORICO vous assiste aussi dans les problèmes de prévision, et son schéma, en soi, est déjà; une modélisation.

La moyenne remplace une suite de valeurs particulières par un nombre unique; elle "mélange tout", et cela n'a un sens que si la répartition est normale (gaussienne). Les moindres carrés, qui remplacent un nuage de point par une droite unique, généralisent la moyenne. Et si la régression se réduisait à cela, son intérêt serait limité. La qualité d'une régression réside dans la méthode de sélection des régresseurs. L'accent est particulièrement mis sur ce point dans CORICO :

REGRESSION MULTIPLE : une sélection robuste et unique parmi des milliers de régresseurs possibles (qui peuvent être corrélés et en plus grand nombre que les observations!), vous épargne le dilemme entre méthodes pas à pas ascendantes, descendantes ou mixtes. Le modèle colle de plus près à la réalité, grâce à l'introduction de termes non linéaires (interactions logiques, logique floue ...). La sélection, dont les interactions créées, peut être exploitée par d'autres logiciels.

Mais ce n'est pas tout : On parle de « surapprentissage » lorsqu’un modèle s’ajuste avec une grande précision aux données d’apprentissage, mais que des erreurs de prédictions sont constatées sur des jeux tests. Cette constatation s'est traduite en 2005 par l’introduction d’un « filtre anti-surapprentissage » dans le logiciel CORICO. Cette augmentation de robustesse ne concerne pas seulement la spectrométrie infrarouge et les modules de CORICO reposant sur des modèles (plan d’expériences, séries chronologiques… ), mais aussi les règles de segmentation !

Contrairement aux ( RESEAUX NEURONAUX), CORICO ne nécessite pas, pour être efficace, un grand nombre d'observations. En outre il peut apporter une contribution importante en amont de cette technique : Quelles que soient la variable à prédire, et les variables "explicatives" (même prises au hasard), un réseau neuronal donne toujours une solution, puisqu'il suffit d'introduire autant de neurones qu'il faudra. Pour autant, rien ne dit que la prédiction sera bonne sur un autre échantillon. Aussi est-il essentiel de bien choisir les variables d'entrée. A quoi peut nous aider la sélection très fouillée de CORICO.

SERIE CHRONOLOGIQUE : le retrait des tendances ou saisonnalités, sans recourir aux moyennes mobiles (responsables de saisonnalités parasites) vous libère des contraintes sur la cadence d'échantillonage. CORICO détecte les effets cycliques, les ruptures, les points suspects, les autocorrélations et les décalages.