Données de composition
En statistiques, les données de composition, ou données compositionnelles, sont des données relatives décrivant des parties d'un ensemble, sous forme de pourcentage ou de proportions. Mathématiquement, les données compositionnelles appartiennent au simplexe.
Espace des données de composition
[modifier | modifier le code]En 1982, John Aitchison définit les données compositionnelles comme étant des proportions d'un ensemble[1]. En particulier, une composition peut être représentée par un vecteur à composantes positives, dont la somme vaut le plus souvent 1. L'espace des données de composition est un simplexe:
où D est le nombre de parts (ou de composants). Puisque la seule information est le ratio entre les composants, l'information d'une composition est préservée par la multiplication par une constante positive. Ainsi, le simplexe peut toujours être considéré comme étant un simplexe standard, avec .
Références
[modifier | modifier le code]- John Aitchison, « The Statistical Analysis of Compositional Data », Journal of the Royal Statistical Society. Series B (Methodological), vol. 44, no 2, , p. 139–177 (DOI 10.1111/j.2517-6161.1982.tb01195.x)
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Compositional data » (voir la liste des auteurs).
Text is available under the CC BY-SA 4.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.