Properties and Interpretation of Relational Covariance on PCA. Propriétés et Interprétation de la Covariance Relationnelle en ACP

Properties and Interpretation of Relational Covariance on PCA

Propriétés et Interprétation de la Covariance Relationnelle en ACP

Sullivan Hidot Jean-Yves Lafaye  Christophe Saint-Jean 

L3I – Université de La Rochelle, UPRES EA 1216, avenue Michel Crépeau, 17042 La Rochelle cedex 1

7 October 2005
28 February 2007
| Citation



This paper is dedicated to the study of the main properties of the so called ‘Relational Principal Components Analysis’ (RPCA),that achieves the analysis of a random vector,with respect to the prior knowledge of one binary relationship upon the underlying probabilistic space.We detail the relational covariance and expectation properties that are the grounds of this technique,which whilst not being novel,remains scarcely studied.The paper presents with didactic examples for the properties we previously addressed and throw some light on interpretations in RPCA.


Cet article s’intéresse à l’étude des propriétés de l’Analyse en Composantes Principales Relationnelle (ACPR) qui analyse un vecteur aléatoire conditionnellement à la réalisation d’un paramètre induisant une relation binaire sur l’espace probabilisé de référence. Nous détaillons les propriétés de la covariance et de l’espérance relationnelles qui sont à la base de cette technique d’analyse connue mais finalement peu étudiée. L’article présente quelques illustrations des propriétés que nous mettons en évidence,et qui éclairent les interprétations en ACPR. 


Relational covariance,PCA,Graph Laplacian,Spatio-temporal Data Analysis.

Mots clés

Covariance relationnelle,ACP,Laplacien de graphe,Analyse de Données Spatio-temporelles.

1. ACP standard
2. ACP Relationnelle
3. Espérance Relationnelle
4. Discrétisation
5. Exemples Types
6. Conclusion

[BE90] H. BENALI and B. ESCOFIER,Analyse factorielle lissée et analyse factorielle des différences locales. Revue de Statistique Appliquée, 38(2) :55-76, 1990. 

[BL84] T. ALUJA BANET and L. LEBART, Local and partial principal component analysis and correspondence analysis. Proceedings in Computational Statistics (COMPSTAT’84), pp. 113-118, 1984.

[Bol98] B. BOLLODAS, Graph Theory. Springer Verlag, 1998. 

[BWOS96] M.A. BALSERA, W. WRIGGERS,Y. OONO and K. SCHULTEN, Principal component analysis and long time protein dynamics. Journal of Physical and Chemical, 100 :2567-2772, 1996. 

[CBV02] F. CHENEVIERE, S. BOUKIR and B. VACHON,A HMM-based dance gesture recognition. IWSIP’02, pp. 322-326, 2002. 

[Cre93] N. CRESSIE, Statistics for Spatial Data. New York, Wiley, 1993. 

[Fol82] Y. LE FOLL, Pondération des distances en analyse factorielle. Statistique et Analyse des données, 1(7) :13-21, 1982. 

[Gea54] R.C. GEARY, The contiguity ratio and statistical mapping. The Incorporated Statistician, 5 :115-145, 1954. 

[HLSJ06] S. HIDOT, J.Y. LAFAYE and C. SAINT-JEAN, ACP relationnelle pour l’analyse du mouvement: application à la danse. Actes électroniques de RFIA’06, p. 64, 9 pages, 2006. 

[JN02] D. JENSEN and J. NEVILLE, Linkage and autocorrelation cause feature selection bias in relationnal learning. Nineteenth International Conference of Machine Learning ICML’02, pages 259-266, 2002. 

[Jol86] I.T. JOLIFFE, Principal Component Analysis. Springer Verlag, 1986. 

[KMMT01] S. KSHIRAGAR, T. MOLLET and N. MAGNENAT-THALMANN, Principal components of expressive speech animation. In Proceedings of CG’01, pages 38-46, 2001. 

[Kri51] D.G. KRIGE, A Statistical approach to some basic mine valuation problems on the witwatersrand. Metallurgical and Mining Society of South Africa, 52 :119-139, 1951. 

[Leb69] L. LEBART, Analyse statistique de la contiguïté. Institut de Statistique de l’Université de Paris, 28 :81-112, 1969. 

[LMP00] L. LEBART,A MORINEAU and M. PIRON, Statistique exploratoire multidimensionnelle. Dunod, 2000. 

[Mat65] G. MATHERON. Les variables régionalisées et leur estimation. Masson, Paris, 1965. 

[Moh91] B. MOHAR, The Laplacian spectrum of graphs. In Graph Theory, Combinatorics and Application, 2 :871-898, 1991. 

[Mor48] P.A.P. MORAN, The interpretation of statistical maps. Journal of the Royal Statistical Society, series B, 10 :243-251, 1948. 

[PL97] N. PECH and F. LAHOE, Use of principal component analysis with instrumental variables (PCAIV) to analyse fisheries catch data. ICES Journal of Marine Science, pages 32-47, 1997. 

[RSV90] M. ROUX and S. SERVANT-VILDARY, Multivariate analysis of diatomes and water chemistry in bolivian salin lakes hydrobiologia. Hydrobiologia, 197 :267-290, 1990. 

[Sab87] R. SABATIER, Analyse factorielle de données structurées et métriques. Statistique et Analyse des Données, 3 :75-96, 1987. 

[SSM96] B. SCHOLKOPF, A. SMOLA and K.R. MULLER, Nonlinear componant analysis as a Kernel eignevalue problem. Technical report, Max-Planck-Institute fur biologische Kybernetik, 1996. 

[TCC02] J. THIOULOUSE, D. CHESSEL and S. CHAMPELY, Multivariate analysis of spatial patterns: a unified approach to local and global structures. Environnemental and Ecological Statistics, 27 :1-14, 2002. 

[WHT02] L. WANG, W. HU and T. TAN, A new attempt to gait-based human identification. In Proceedings of ICPR’02, 1 :115-118, 2002.