Système de reconnaissance de chiffres manuscrits hors lignes

Système de reconnaissance de chiffres manuscrits hors lignes

Recognition System of Unconstrained Handwritten Numerals

Nicolas Feray Denis De Brucq 

PSI - La31 – Itepea, UFR des Sciences et des Techniques BP118 76 821 Mont Saint Aignan Cedex

Corresponding Author Email: 
Feray©la3i.univ-rouen.fr
Page: 
85-98
|
Received: 
1 February 1995
| |
Accepted: 
N/A
| | Citation

OPEN ACCESS

Abstract: 

In this paper, we present a recognition system of unconstrained handwritten numerals . We describe all essential stages to its elaboration. We approach the first phase of all recognition system: the extraction of the primitives. A structure that use the skeleton of the numeral is used to extract rapidly 55 binary primitives. We specify a method that allows to determine the transmitted information about the primitives on the problem of the recognition of unconstrained handwritten numerals. Information transmitted by each primitive providing a criterion allowing to generate a binary decision tree. This criterion is used to select in each node the best primitive. The obtained classifier does not use the totality of 55 binary primitives but solely those that have been retained during the phase of identification of the decision tree. We present an original reject criterion that allows to increase performances of the recognition system. Finally, We describe the database of American handwritting numerals that serves to test the classifier. We demonstrate the performance of our system with this database.

Résumé

Nous présentons dans cet article un système de reconnaissance de chiffres manuscrits hors lignes, en décrivant toutes les étapes essentielles à son élaboration. Nous abordons d'abord la première phase de tout système de reconnaissance: l'extraction de primitives. Une représentation structurée construite à partir du squelette du chiffre est utilisée pour extraire rapidement un jeu de 55 primitives binaires. Nous précisons ensuite une méthode qui permet de déterminer l'information transmise par une primitive sur le problème de la reconnaissance des chiffres manuscrits hors lignes. L'information transmise par chaque primitive fournit un critère permettant de générer un arbre de décision binaire de manière complètement automatique. Ce critère est utilisé pour sélectionner au niveau de chaque noeud de l'arbre la primitive la plus informative sur le problème de reconnaissance associé au noeud en cours de traitement. Le classifieur obtenu n'utilise pas la totalité des 55 primitives binaires mais uniquement celles qui ont été retenues durant la phase d'identification de l'arbre de décisio. Nous présentons ensuite un critère de rejet original qui permet d'augmenter les performances du système de reconnaissance de manière significative. Nous décrivons finalement la base de données de chiffres manuscrits américains qui sert à tester le classifieu. Nous donnons les résultats obtenus.

Keywords: 

Skeleton, Primitive, Information theory, Reject criterion, Handwritten numeral recognition

Mots clés

Squelettisation, Primitive, Théorie de l'information, Critère de rejet, Reconnaissance de chiffres

1. Introduction
2. Représentation De Haut Niveau D'un Chiffre Manuscrit
3. Extraction De Caractéristiques En Vue De La Reconnaissance
4. Construction D'un Classifieur
5. Résultats
6. Conclusion
  References

[1] F. Ali et Th . Pavlidis, Syntactic Recognition of handwritten Numerals . IEEE Transaction on Systems, Man and Cybernetics, vol . n°7, pp . 537-541, 1977.

[2] C . Tappert, C . Y. Suen, T. Wakahana, The state of the art in on-line handwritting recognition. IEEE Transaction on Pattern Analysis and Machine Intelligence, vol . PAMI-12, pp. 787-807, 1990.

[3] M . Wing, Variability in Handwritten Characters . Visible Language, XIII 3 , pp 283-298, 1979 .

[4] M . Shridar and A . Badreldin, Recognition of isolated and simply connected handwritten numerals . Pattern Recognition, vol. 19, N° 1, pp . 1-12, 1986.

[5] P. Gader, B . Forester, M . Ganzberger, A . Gillies, B . Mitchell, M . Whalen and T. Yocum, Recognition of handwritten digits using template and model matching. Pattern Recognition, Vol . 24, N° 5, pp . 421-431, 1991 .

[6] L . Heutte, Reconnaissance de caractères manuscrits : application à la lecture des chèques et des enveloppes postales . Thèse de doctorat, Université de Rouen, 1994.

[7] C . Y. Suen, C . Nadal, R . Legault, T. A . Mai and L. Lam, Computer Recognition of Unconstrained Handwritten Numerals . Proceedings of the IEEE, Vol. 80 , n°7, pp . 1162-1180, 1992.

[8] C . Roche, Information utile en reconnaissance des formes et en compression de données . Application à la génération automatique de système de reconnaissance optique et accoustique. Thèse d'état ES Sciences Mathématiques , Paris VI, 1972 .

[9] D. de Brucq, K . Romeo, M. Lachkar, N. Feray, F. Bagui, Une méthode d'évaluation du codage en reconnaissance de chiffres manuscrits . 3ème Colloque National sur l'écrit et le document, CNED'94, pp . 19-26, 1994 .

[10] Q. R . Wang and C . Y. Suen, Analysis and Design of a Decision Tree Based on Entropy Reduction and Its Application to Large Character Set  Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol . PAMI -6, n° 4, pp . 406-417, 1984 .

[11] D. Geman, B . Jedynak, Shape Recognition and Twenty Questions . Rapport de recherche INRIA, No . 255, 1993 .

[12] L . Breiman, J. Freidman, R . Olsen and C . Stone, Classification and Regression Trees . Wadsworth, Belmont, CA, 1984 .

[13] S . W. Lee, L . Lam and C . Y. Suen, A systematic evaluation of skeletonization algorithms . International Journal of Pattern Recognition and Artificial Intelligence, Vol . 7, n° 5, pp . 239-261, 1993 .

[14] A. Belaid et Y. Belaid, Reconnaissance des formes . Méthodes et applications . InterEdition, 1992 .

[15] P. Marthon, A. Bruel et G . Biguet, Squelettisation par calcul d'une fonction discriminante sur un voisinage de 8 points . Actes du 2e congrès AFCET RFIA, pp . 107-117, toulouse, 1979 .

[16] L . Lam and C . Y. Suen, Structural classification and relaxation matching of totally unconstrained handwritten zip-code numbers. Pattern Recognition , Vol . 21, n° 1, pages 19-31, 1988 .

[17] T. Pavlidis, Algorithms for graphics and image processing . Computer Science Press, 1982 .

[18] G. Gaillat et M . Berthod, Panorama des techniques d'extraction de traits caractéristiques en lecture optique des caractères . Revue Technique THOMSONCSF, Vol . 11, n° 4, pp . 943-959, 1979.

[19] C . Y. Suen, M . Berthod and S . Mori, Automatic Recognition of Handprinted Characters - The State of the Art . Proceeding IEEE, Vol. 68, n° 4, pp . 469-487 , 1980 .

[20] C. Y. Suen, Distinctive features in automatic recognition of handprinted characters. Signal processing, Vol. 4, pp. 193-207, 1982 .

[21] M . Beun, A flexible method for automatic reading of handwritten numérals . Philips Technical Rewiew, Vol . 33, pp . 89-101 and 130-137, 1973 .

[22] B . Cherabo, L. Massip-Pailhes, S . Castan . Description polygonale basée sur l'extraction d'ilots de confiance . Actes du 8 e congrès AFCET RFIA, pp . 841-846, Lyon-Villeurbanne, 1991 .

[23] L . Miclet, Méthodes structurelles pour la reconnaissance des formes . Edition EYROLLES, 1984 .

[24] A . M. Yaglom, I M . Yaglom, Probabilité et information . Dunod, pp . 33-89 ,1969 .

[25] C. Nadal and C . Y. Suen, Applying human knowledge to improve machine recognition of confusing handwritten numerals . Pattern Recognition, vol 26, n° 3, pp . 381-389, 1993 .