Two-stage Classification System Combining Model-based Approach and Support Vector Machines
Système de Classification à Deux Niveaux de Décision Combinant Approche par Modélisation et Machines à Vecteurs de Support
OPEN ACCESS
The motivation of this work is based on two key observations. First, the classification algorithms can be separated into two main categories: discriminative and model-based approaches. Second, two types of patterns can generate problems: ambiguous patterns and outliers.While, the first approach tries to minimize the first type of error, but cannot deal effectively with outliers, the model-based approaches make the outlier detection possible, but are not sufficiently discriminant.Thus, we propose to combine these two different approaches in a two-stage classification system embedded in a probabilistic framework. In the first stage we pre-estimate the posterior probabilities with a model-based approach and we re-estimate only the highest probabilities with appropriate Support Vector Machine(SVM) in the second stage.Another advantage of this combination is to reduce the principal burden of SVM: the processing time necessary to make a decision. Finally, the first experiments on the benchmark database MNIST have shown that our dynamic classification process allows to maintain the accuracy of SVMs, while decreasing complexity by a factor 8.7 and making the outlier rejection available.
Résumé
Il est possible de distinguer deux types de données pouvant causer des problèmes à un classifieur:les données ambiguës et les données aberrantes. À ces deux types d’erreurs peuvent être associés deux types de rejet:le rejet d’ambiguïté et le rejet d’ignorance. Or,si les approches de classification agissant par séparation sont mieux adaptées au premier type de rejet,elles s’avèrent peu efficaces pour traiter les données aberrantes. Par contre,les approches qui agissent par modélisation sont par nature mieux adaptées à ce second type de rejet,mais ne s’avèrent que peu discriminantes. Ainsi,nous proposons de combiner les deux types d’approche au sein d’un système de classification à deux niveaux de décision. Au premier niveau, une approche par modélisation sera utilisée pour rejeter les données aberrantes et pré-estimer les probabilités a posteriori. En cas de conflit entre plusieurs classes,des machines à vecteurs de support (SVM) appropriées seront utilisées pour ré-estimer plus précisément les probabilités des classes en conflit et permettre de rejeter efficacement les données ambiguës. En outre,cette combinaison présente l’avantage de réduire la complexité de calcul associée à la prise de décision des SVM. Ainsi,les résultats obtenus sur un problème classique de reconnaissance d’images de chiffres manuscrits isolés ont montré qu’il est possible de maintenir les performances associées aux SVM,tout en réduisant la complexité d’un facteur 8.7 et en permettant de filtrer efficacement les données aberrantes.
Classifier Combination, Support Vector Machine, Model-Based Approach, Posterior probability Estimation, Outlier Detection, Errror-Reject Tradeoff, Classifying Cost.
Mots clés
Combinaison de classifieurs,machine à vecteurs de support,approches par modélisation,estimation de probabilités a posteriori,rejet d’ambiguïté,rejet d’ignorance,coût de classification.
[BEL 03] A. BELLILI, M. GILLOUX, P. GALLINARI, « An MLP-SVM combination architecture for offline handwritten digit recognition », International Journal on Document Analysis and Recognition,Vol. 5, #4, 2003, p. 244-252.
[CHA 01] C.-C. CHANG, C.-J. LIN., « LIBSVM: a library for support vector machines », Technical rapport, Department of Computer Science and Information Engineering, National Taiwan University, 2001. Software available at: http://www.csie.ntu.edu.tw/~cjlin/libsvm/.
[DUD 01] R.O. DUDA, P.E. HART, D.G. STORK, « Pattern Classification », Wiley-Interscience, Second Edition, 2001.
[FUM 00] G. FUMERA, F. ROLI, G. GIACINTO, « Reject option with multiple thresholds », Pattern Recognition,Vol. 33, #12, 2000, p. 2099-2101.
[HAM 03] T. HAMAMURA, H. MIZUTANI, B. IRIE, « A multiclass classification method based on multiple pairwise classifiers », International Conference on Document Analysis and Recognition, 2003, p. 809-813.
[LEC 98] Y. LECUN, L. BOTTOU,Y. BENGIO, P. HAFFNER, « Gradientbased learning applied to document recognition », Proceedings of IEEE,Vol. 86, #11, 1998, p. 2278-2324.
[LIN 03] H.-T. LIN, C.-J. LIN, R.C. WENG, « A note on Platt’s probabilistic outputs for support vector machines », Technical report, Department of Computer Science and Information Engineering, National Taiwan University, 2003.
[LIU 02] C.-L. LIU, H. SAKO, H. FUJISAWA, « Performance evaluation of pattern classifiers for handwritten character recognition », International Journal on Document Analysis and Recognition,Vol. 4, #3, 2002, p. 191-204.
[LIU 03] C.-L. LIU, K. NAKASHIMA, H. SAKO, H. FUJISAWA, «Handwritten digit recognition: benchmarking of state-of-the-art techniques », Pattern Recognition,Vol. 36, #10, 2003, p. 2271-2285.
[OH 02] I.-S. OH, C.-Y. SUEN, « A class-modular feedforward neural network for handwriting recognition », Pattern Recognition,Vol. 35, #1, 2002, p. 229-244.
[PLA 99] J.C. PLATT, « Probabilities for SV Machines », Advances in Large Margin Classifiers, MIT Press, 1999, p. 61-74.
[PRE 03] L. PREVOST, C. MICHEL-SENDIS, A. MOISES, L. OUDOT, M. MILGRAM, « Combining model-based and discriminative classifiers: application to handwritten character recognition », International Conference on Document Analysis and Recognition, 2003, p. 31-35.
[VUU 03] L. VUURPIJL, L. SCHOMAKER, M. VAN ERP, « Architectures for detecting and solving conflicts: two-stage classification and support vector classifiers », International Journal on Document Analysis and Recognition,Vol. 5, #4, 2003, p. 213-223.