Writer Identification and Verification in Handwritten Documents. Identification et Vérification du Scripteur dans des Documents Manuscrits

Writer Identification and Verification in Handwritten Documents

Identification et Vérification du Scripteur dans des Documents Manuscrits

Ameur Benséfia Thierry Paquet  Laurent Heutte 

Laboratoire PSI - FRE CNRS 2645, UFR des Sciences, Université de Rouen, 76821 Mont-Saint-Aignan Cedex, France

Page: 
249-259
|
Received: 
19 May 2004
| |
Accepted: 
N/A
| | Citation

OPEN ACCESS

Abstract: 

In this communication we apply an Information Retrieval model for the writer identification task.Queries are handwreitten document images projected on a suitable feature set.The handwritten document database is indexed according to the vector space model originaly used for textual information.The approach uses both the image and textual description of handwritten documents.Identified documents are then processed by the verification stage.We use a mutual information criterion so as to verify that each identified document can have been written by the writer of the query.Decision operates using an hypothesis test.The approcah is evaluated on two different database and proves to be robust to the variability of handwriting.Perspectives are oriented towards the use of large handwritten document database.

Résumé

Dans cette communication,nous appliquons un modèle de recherche d’information pour la tâche d’identification du scripteur. Les requêtes sont des images de documents qui sont tout d’abord projetées dans un espace de caractéristiques. La base de documents manuscrits est indexée selon le principe du modèle vectoriel de recherche d’information textuelle. L’approche exploite donc à la fois la représentation mixte image et textuelle spécifique d’un document manuscrit. Les documents identifiés à l’issue de cette étape font ensuite l’objet d’une analyse complémentaire pour vérifier les hypothèses émises. Nous proposons d’utiliser un critère d’information mutuelle pour vérifier que chacun des documents identifiés peut avoir été produit par le scripteur de la requête. Nous utilisons un test d’hypothèse à cet effet. L’approche est testée sur deux bases d’écritures différentes et montre une grande robustesse aux différentes écritures. L’approche semble donc très intéressante pour des applications à plus grande échelle nécessitant d’interroger des bases de documents manuscrits.

Keywords: 

Handwritten Documents,Writer Identification,Writer Verification,Information Retrieval,Mutual Information, Hypothesis Test.

Mots clés

Documents manuscrits,identification du scripteur,vérification du scripteur,recherche d’information,information mutuelle,test d’hypothèse.

1. Introduction
2. Identification du Scripteur
3. Vérification du Scripteu
4. Conclusion
  References

[Cha] S.H. CHA, S. SRIHARI, «Multiple Feature Integration for Writer Verification », 7th International Workshop on Frontiers in Handwriting Recognition, Amsterdam, pp. 333-342, 2000. 

[Feng] D. FENG, W.C. SIU, H.J. ZHANG, Multimedia Information Retrieval and Management, Springer Edition, 2003. 

[Marti] U.V. MARTI, R. MESSERLI, H. BUNKE, « Writer Identification Using Text Line Based Features», Proc. ICDAR’01, Seattle (USA), pp. 101-105, 2001. 

[Nosary] A. NOSARY, Automatic recognition of handwritten texts through writer adaptation, PhD dissertation (in french), University of Rouen, France, 2002. 

[Plamondon] R. PLAMONDON, G. LORETTE, «Automatic signature verification and writer identification – the state of the art», Pattern Recognition, vol. 22, n°2, pp. 107-131, 1989. 

[Said] H.E.S. SAID, T.N TAN, K.D. BAKER, «Personal Identification Based on Handwritting», Pattern Recognition, vol. 33, pp. 149-160, 2000. 

[Salton] G. SALTON, WRONG, «A vector Space Model for Automatic Indexing», Information Retrieval and Language Processing, pp. 613620, 1975. 

[Saporta] G. SAPORTA, Probabilités analyse des données et statistiques, Edition Technip, pp. 317-330, 1990. 

[Shannon] C. SHANNON, The Mathematical Theory of Communication. Bell System Technical. Journal, Roberts, J.A. vol 27, pp. 379-423, 1984. 

[Schaüble] P. SCHAÜBLE, Multimedia Information Retrieval : ContentBased Information Retrieval From Large Text and Audio Databases, Kluwer Academic Publishers, 1997. 

[Schomaker] L. SCHOMAKER, M. BULACU, Automatic Writer Identification Using Connected-Component Contours and EdgeBased Features of Uppercases Western Script, IEEE-PAMI, vol. 26, N° 6, pp. 787-798, 2004. 

[Song] F. SONG, W. BRUCE CROFT, «A General Language Model for Information Retrieval», Eighth International Conference on Information and Knowledge Management (ICIKM’99), 1999. 

[Srihari] S. SRIHARI, S.H. CHA, H. ARORA, S. LEE, «Individuality of Handwritig: A Validity Study», Proc. ICDAR’01, pp.106-109, 2001. 

[Zimmermann] M. ZIMMERMANN, H. BUNKE, « Automatic Segmentation of the IAM Off-line Handwritten {English} Text Database», 16th International Conference on Pattern Recognition, Vol 4, pp. 35-39, 2002. 

[Zois] E.N. ZOIS, V. ANASTASSOPOULOS, «Morphological Waveform Coding for Writer Identification», Pattern Recognition, vol. 33, n°3, pp.385-398, 2000.