Interactive Segmentation and Analysis of Historical Printed Documents. Segmentation et Analyse Interactives de Documents Anciens Imprimés

Interactive Segmentation and Analysis of Historical Printed Documents

Segmentation et Analyse Interactives de Documents Anciens Imprimés

J.Y. Ramel S. Leriche 

Lab. d’Informatique, École Polytechnique de l’Université de Tours, 64, avenue Jean Portalis 37200 Tours

Page: 
209-222
|
Received: 
19 May 2004
| |
Accepted: 
N/A
| | Citation

OPEN ACCESS

Abstract: 

In this paper,we first precise the main error sources from classical methods of structural page layout analysis based on a study of the specificity of old printed books.We show that each type of methods (bottom-up and top-down) provides different kinds of information that should not be ignored to obtain both a generic method and good segmentation results.Then,we propose to use a hybrid segmentation algorithm.We build two maps :a shape map that focuses on connected components and a background map that provides information on white areas corresponding to block separation in the page.Then,using this first segmentation,a classification of the extracted blocks can be achieved according to scenarios built by the user.These scenarios are defined very simply during an interactive stage allowing the users to produce processing sequences adapted to the different kinds of images they can meet and to their needs. The method gives very good results while the setting of parameters is easy and not sensitive to low variations.

Résumé

Après avoir caractérisé les spécificités de mise en page dans les ouvrages imprimés anciens,nous montrons par une campagne d’expérimentations que les méthodes ascendantes et descendantes d’extraction de la structure physique apportent des informations différentes qu’il ne faut pas ignorer lorsque l’on désire segmenter de manière optimale des documents anciens. Les tests réalisés mettent également en évidence les sources d’erreurs des méthodes traditionnelles. Partant de ces constatations,notre proposition consiste à utiliser un algorithme de segmentation hybride basé sur la construction de deux représentations de l’image : une carte des formes qui se focalise sur les composantes connexes présentes dans l’image et une carte du fond qui fournit de l’information sur les espaces blancs séparant les blocs constituant la page. Ensuite, sur la base de la segmentation obtenue à l’aide de cette méthode,une classification des blocs extraits peut être réalisée selon des scénarios que l’utilisateur met en place en fonction de ses besoins. Ces scénarios sont définis simplement grâce à une phase d’interaction entre l’utilisateur et le système et permettent de concevoir des chaînes de traitements adaptées aux différents types d’images que l’on peut rencontrer.

Keywords: 

Page layout analysis,segmentation,block classification,old documents,analysis strategy.

Mots clés

Analyse de la structure physique,segmentation,classification des blocs,documents anciens,stratégie d’analyse.

Remerciements
1. Introduction
2. Études Préliminaires
3. Une Nouvelle Méthode de Segmentation
4. Analyse de Structure Interactive
5. Expérimentations et Résultats
6. Conclusion
  References

[Akindele93] O.T. AKINDELE, A. BELAID. «Page Segmentation by Segment Tracing». In Proc. of the 2nd International Conference on Document Analysis and Recognition, 1993. p341-344 

[Baird92] H BAIRD. «Background structure in document images», In Advances in Structural and Syntactical Pattern Recognition,ed. H. Bunke. 1992. p253-269. 

[Belaid97] A. BELAÏD, «Conception automatisée de modèles de page en vue de leur utilisation en reconnaissance de documents», Workshop on Electronic Page Models (LAMPE’97). 1997.

[Couasnon02] B. COÜASNON, J. CAMILLERAPP, «DMOS, une méthode générique de reconnaissance de documents : évaluation sur 60000 formulaires du XIXe siècle», in Actes du Colloque International Francophone sur l’Écrit et le Document (CIFED’02), Hammamet, 2002, p. 225-234. 

[Hadjar01] K. HADJAR, O. HITZ, R. INGOLD, «Newpaper page decomposition using split and merge approach», Proceedings of the 5th International Conference on Document Analysis and Recognition. 2001. p. 1186-1191. 

[Hadjar02] K. HADJAR, O. HITZ, L. ROBADEY, R. INGOLD, «Configuration REcognition Model for Complex Reverse Engineering Methods: 2(CREM)», Proceedings of the 5th International Workshop on Document Analysis Systems, 2002. p.469-479. 

[Kise98] K. KISE, AKINORI SATO, MOTOI IWATA. «Segmentation of page images using the area Voronoi diagram», Computer Vision and Image Understanding archive,Volume 70 (3), Special issue on document image understanding and retrieval, 1998, p.370-382. 

[Lebourgeois03] F. LEBOURGEOIS, H. EMPTOZ, E. TRINH, «Compression et accessibilité aux images de documents numérisés Application au projet Debora», Document Numérique,Vol 7 n°3-4. 2003, p.103-127. 

[Nagy84] G. NAGY, S. SETH, «Hierarchical representation of optically scanned documents», In 7th International Conference on Pattern Recognition (ICPR), 1984, p.347-349. 

[Nagy93] G. NAGY, S. SETH, M. KRISHNAMOORTHY, AND M. VISWANATHAN, «Syntactic Segmentation and Labeling of Digitized Pages from Technical Journals», IEEE Transactions on Pattern Analysis and Machine Intelligence, 15(7), 1993. p737-747. 

[OGorman93] L. O’GORMAN, «The Document Spectrum for Page Layout Analysis», In IEEE Transaction On PAMI,15 (11). 1993. p.11621173. 

[OGorman95] L.O’GORMAN, R. KASTURI, «Document Image Analysis», IEEE Computer Society Press, Los Alamitos, CA, 1995. 

[Ramel98] J.Y. RAMEL, N. VINCENT, H. EMPTOZ, «Extraction contextuelle d’entités graphiques dans les dessins : du plus simple au plus complexe….» Colloque International Francophone sur l’Ecrit et le Document, Quebec (Canada). May 1998. p. 453-462. 

[Saidali02] Y. SAIDALI, N. BAUDOUIN, E. TRUPIN, M. HOLZEM, J. LABICHE, «ACTI_VA : Plate-Forme interactive pour l’Acquisition de Connaissances Traiteur d’Images de document», 5e Colloque International sur le Document Électronique CIDE, Hammamet, Tunisie, 20-23 Octobre 2002, p.195-209. 

[Sauvola00] J. SAUVOLA, M. PIETIKAINEN,: «Adaptive Document Image Binarization», Pattern Recognition, Vol. 33, p.225-236, 2000 

[Trinh03] E TRINH, «De la numérisation à la consultation de documents anciens». Thèse de doctorat en Informatique, Insa de Lyon, Juin 2003