Robust Detection Using Probabilistic Appearance-Based Models: a Bayesian Approach
Détection Robuste par Modèle Probabiliste D’Apparence: une Approche Bayésienne
OPEN ACCESS
In this paper, methods are proposed to detect objects in complex scenes using statistical global appearance based models. In our approach, the standard eigenspace representation of a training image database and a priori nonGaussian hypotheses are brought together in a Bayesian framework. This work unifies standard (appearancebased) detection methods already proposed in the literature and leads naturally to the definition of a new family of probabilistic detectors. It allows the use of more general a priori assumptions about the distribution on the eigenspace and its orthogonal. Experimental results are illustrated with ROC (Receiver Operating Characteristic) curves and show the major improvement of our Bayesian approach in comparison to the standard methods that have been the reference up to now [2, 14].
Résumé
Dans cet article, nous nous intéressons à la détection d'objets dans des scènes complexes, par des méthodes basées sur des modèles statistiques d'apparence globale. L'approche proposée associe, dans un cadre bayésien, une représentation standard des images d'apprentissage par espace propre à des modèles de bruit et à des modèles a priori non gaussiens. Ce modèle permet d'unifier les méthodes de détection classiques rencontrées dans la littérature et conduit, de façon naturelle, à la définition d'une nouvelle classe de détecteurs statistiques, intégrant des modèles de distribution quelconque pour les images d'apprentissage. La comparaison des caractéristiques opérationnelles des récepteurs (courbes COR) sur des bases de données communes, illustre les contributions de l'approche bayésienne. Elle montre également que l'adoption de modèles non gaussiens permet de dépasser significativement les performances des algorithmes faisant actuellement référence dans le domaine [2, 14].
Eigenspace representation, PCA, Bayesian approach, non-Gaussian models, M-estimators, half-quadratic algorithms.
Mots clés
Représentation par espace propre, ACP, approche bayésienne, modèles non gaussiens, M-estimateurs, algorithmes semi-quadratiques.
[1] J.M. Bernardo et A.F. Smith. Bayesian Theory. Wiley Series in Probability and Statistics, New York, 2000.
[2] M. J. Black et A. D. Jepson. Eigentracking: Robust matching and tracking of articulated objects using a view-based representation. International Journal on Computer Vision, 26(1):63-84, janvier 1998.
[3] P. Charbonnier, L. Blanc-Féraud, G. Aubert, et M. Barlaud. Two deterministic half quadratic regularization algorithms for computed imaging. Dans International Conference on Image Processing, pages 168-172, Austin, USA, 1994.
[4] D. Comaniciu et P. Meer. Mean shift: A robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(5):603-619, mai 2002.
[5] R. Dahyot. Analyse d’images séquentielles de scènes routières par modèles d’apparence pour la gestion du réseau routier. Thèse de doctorat, Université Louis Pasteur, Strasbourg, France, novembre 2001.
[6] R. Dahyot, P. Charbonnier et F. Heitz. Robust visual recognition of colour images. Dans IEEE conference on Computer Vision and Pattern Recognition, volume 1, pages 685-690, Hilton Head Island, USA, juin 2000.
[7] R.O. Duda, P.E. Hart et D.G. Stork. Pattern Classification (2nd. ed.). John Wiley and Sons, New York, 2001.
[8] R. Hamdan, F. Heitz, et L. Thoraval. Modèles probabilistes d'apparence : une représentation approchée de faible complexité. Traitement de Signal, 18(3):147-160, 2001.
[9] P.J. Huber. Robust Statistics. John Wiley and Sons, New York, 1981.
[10] M. Jogan et A. Leonardis. Parametric eigenspace representations of panoramic images. Dans International Conference on Advanced Robotics 2001 – Omnidirectional Vision Applied to robotic orientation and nondestructive testing (NDT), pages 31-36, Budapest, Hongrie, août 2001. IEEE Computer Society.
[11] D.J.C. MacKay. Probable network and plausible predictions – a review of practical Bayesian methods for supervised neural networks. Network, pages 469-505, 1995.
[12] B. Moghaddam. Principal manifolds and Bayesian subspaces for visual recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(6):780-788, juin 2002.
[13] B. Moghaddam et A. Pentland. Probabilistic visual learning for object detection. Dans The 5th International Conference on Computer Vision, Cambridge, USA, juin 1995.
[14] B. Moghaddam et A. Pentland. Probabilistic visual learning for object representation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 19(7):696-710, juillet 1997.
[15] H. Murase et S. K. Nayar. Visual learning and recognition of 3-D objects from appearance. International Journal of Computer Vision, 14(1):5-24, janvier 1995.
[16] S. A. Nene, S. K. Nayar et H. Murase. Columbia object image library (coil-20). Rapport technique CUCS-005-96, Department of Computer Science, Columbia University, 1996.
[17] R. H. Park. Comments on optimal approximation of uniformly rotated images: Relationship between Karhunen-Loeve expansion and discrete cosine transform. IEEE Transactions on Image Processing, 11(3):332334, mars 2002.
[18] W. H. Press, S. A. Teukolsky, W. T. Vetterling, et B. P. Flannery. Numerical Recipes in C - The Art of Scientific Computing. Cambridge University Press, 1995.
[19] C. Schmid et R. Mohr. Local grayvalue invariants for image retrieval. IEEE Transactions on Pattern Analysis and Machine Intelligence, 19(5):530-534, 1997.
[20] H. Schneiderman. A Statistical Approach to 3D Object Detection Applied to Faces and Cars. Thèse de doctorat, Carnegie Mellon University, Pittsburg USA, 2000.
[21] M.E. Tipping et C.M. Bishop. Mixtures of probabilistic principal component analysers. Neural Computation, 11(2):443-482, 1999.
[22] M.E. Tipping et C.M. Bishop. Probabilistic principal component analysis. Journal of the Royal Statistical Society, Series B, 61(3):611-622, 1999.
[23] M. Turk et A. Pentland. Eigenfaces for recognition. Journal of Cognitive Neuroscience, 3(1):71-86, 1991.
[24] T. Vik, F. Heitz et P. Charbonnier. Mean shift-based Bayesian image reconstruction into visual subspace. Dans IEEE International Conference on Image Processing (accepté pour publication), Barcelone, Espagne, septembre 2003.