Finite Mixture Models Estimation with a Credal EM Algorithm
Estimation de Modèles de Mélanges Finis par un Algorithme EM Crédibiliste
This paper is concerned with finite mixture models estimation in the framework of Transferable Belief Model.This model relies on a non probabilistic formalism for representing and manipulating imprecise and uncertain information with belief functions.Within this framework,a credal EM algorithm,a variant of classical EM algorithm based on belief functions,is introduced for finite mixture parameters learning.This algorithm can be applied in several situations where available information on the data generation model is partially known.In the learning problem,this knowledge is represented with belief functions which allow to represent as better as possible the uncertainty on the component from where each observation has been generated.Several experimentations highlight situations where the algorithm is applied when available information on the learning set is imprecise (partially supervised learning where the actual component of each sample is only known as belonging to a subset of components),and/or uncertain (unsupervised learning where the knowledge about the actual sample is represented by a belief function).Synthetic data sets allow us to demonstrate the good performance of the proposed approach based on estimated parameters analysis and learning with gaussian finite mixture models.
Dans cet article,l’estimation d’un modèle de mélange fini est abordée dans le cadre du Modèle des Croyances Transférables (MCT). Ce modèle constitue le socle d’un formalisme non probabiliste pour la représentation d’informations imprécises et incertaines par des fonctions de croyances. Dans ce contexte,un algorithme EM crédibiliste,une extension de l’algorithme EM aux fonctions de croyance,est introduit pour l’apprentissage des paramètres du modèle de mélange fini. Nous montrons comment cet algorithme peut être appliqué dans plusieurs contextes où l’information sur le modèle de génération des données n’est que partiellement disponible. Cette information est représentée,dans le problème d’apprentissage,par des fonctions de croyance qui permettent de modéliser la connaissance disponible sur la composante ayant servie à générer chaque observation de manière la plus fine possible. Plusieurs simulations mettent en évidence des situations où le modèle de génération des données n’est connu que de manière imprécise (apprentissage partiellement supervisé) et où l’on ne posséde auncune information sur la composante d’appartenance de chaque observation (apprentissage non supervisé). Des jeux de données synthétiques permettent de démontrer les bonnes performances de l’approche proposée en terme d’estimation mais également en terme d’apprentissage sur des modèles de mélanges gaussiens.
Finite mixture models,Transferable Belief Model,EM algorithm,Learning.
Mots clés
Modèle de mélange fini,Modèle des croyances transférables,Algorithme EM,Apprentissage.
