Using the Fourier Mellin Transform for Multi-Oriented and Multi-Scaled Patterns Recognition: Application to Automatic Analysis of Technical Documents. Utilisation de la Transformée de Fourier-Mellin pour la Reconnaissance de Formes Multi-Orientées et Mult

Using the Fourier Mellin Transform for Multi-Oriented and Multi-Scaled Patterns Recognition: Application to Automatic Analysis of Technical Documents

Utilisation de la Transformée de Fourier-Mellin pour la Reconnaissance de Formes Multi-Orientées et Multi-Échelles: Application à L’Analyse Automatique de Documents Techniques

S. Adam J-M. Ogier  C. Cariou  R. Mullot  J. Gardes  Y. Lecourtier 

Laboratoire PSI, La3I, Université de Rouen, 76821 Mont Saint Aignan, France

LASTI/Groupe Image, ENSSAT Lannion, Université de Rennes I, 6, rue de Kerampont, B.P. 447, 22305 Lannion, France

France Télécom Recherche et Développement, DMI/GRI, Technopôle Anticipa, 2, avenue Pierre Marzin, 22307 Lannion cedex, France

7 December 1999
| |
| | Citation



In this paper, we propose an original methodology which allows the detection and the recognition of multi-oriented and multiscaled patterns. The supports on which the method is applied are technical documents representing the network of the French Telephone operator France Telecom. The adopted technique, based on the Fourier-Mellin Transform (FMT) is integrated in a global strategy that solves ambiguous situations, through the providing of contextual information. The strategy which is applied to solve the character and symbol classification problem can be divided into two stages. The first one consists in computing a set of invariant descriptors for each isolated pattern belonging to a characters layer detected thanks to a connected components extractor. The second stage, based on a filtering scheme, consists in detecting and recognising the shapes which are either interconnected or connected to any other object. The results of the application of this technique are very encouraging since the classification rate reaches excellent scores in comparison with classical techniques.


Dans cet article, nous proposons une méthodologie originale permettant la détection et la reconnaissance de caractères multiorientés et multi-échelles. Les supports sur lesquels la méthode est appliquée sont des documents techniques représentant le réseau de l’opérateur de télécommunication français France Télécom. La technique adoptée, basée sur la transformation de Fourier-Mellin (TFM), est intégrée dans une stratégie globale permettant la résolution de situations ambiguës, par intégration d’informations contextuelles. La stratégie appliquée pour résoudre ce problème de reconnaissance de caractères et symboles multi-orientés et multi-échelles peut être divisée en deux étapes. La première réside dans l’extraction d’un ensemble de descripteurs invariants pour chacune des formes isolées de la couche « caractères » identifiée à partir d’un extracteur de composantes connexes. La seconde étape, basée sur un processus de filtrage, consiste à détecter et reconnaître les formes connectées au réseau ou à d’autres formes. Les résultats de l’application de cette technique sont très encourageants puisque le taux de classification atteint d’excellents niveaux en comparaison avec les techniques classiques de la littérature.


Character recognition, primitives extraction and classification, document analysis, Fourier-Mellin transform

Mots clés 

Reconnaissance de caractères, extraction de primitives et classification, analyse de document, transformée de Fourier-Mellin.

1. Introduction
2. Traitement des Informations Textuelles
3. Reconnaissance de Formes Multi-Orientées et Multi-échelles
4. Application de la TFM dans le Cas de L’interprétation de Document
5. Conclusion et Perspectives
6. Remerciements

[ADAM] S. Adam, R. Mullot, J-M. Ogier, C. Cariou, J. Gardes, Y. Lecourtier, « Combination of Invariant Pattern Recognition primitives on Technical Documents », Proceedings of Graphic RECognition, GREC’99, Jaipur, India, pp. 203-210. 

[ANTOINE] D. Antoine, S. Collin, K. Tombre, « Analysis of technical documents : The REDRAW system », Structured Document Analysis, Baird H.S., Bunke H., Yamamoto K. Editors, Springer-Verlag, 1992, pp. 385-402. 

[ARSENAULT] H. Arsenault and Y. Sheng, « Properties of the circular harmonic expansion for rotation-invariant pattern recognition », Applied Optics, 25, 1986, pp. 3225-3229. 

[BAILEY]  R.R. Bailey, M. Srinath, « Orthogonal moment features for use with parametric and non parametric classifiers », IEEE Trans. on PAMI, 18 (4), 1996, pp. 389-399. 

[BAMIEH] R. Bamieth, R. De Figueiredo, « A general moments invariants/attributed graph method for the three dimensional object recognition from a single image », IEEE Journal of Robotics Automation, 2, 1986, pp. 240-242. 

[BELKASIM] S. O. Belkasim, M. Shridar, M. Ahmadi, « Pattern recognition with moment invariants : a comparative study and new results », Pattern Recognition, 24, 1991, pp. 1117-1138. 

[BOATTO-1] L. Boatto et al., « An interpretation system for land register maps », IEEE Computer Magazine, vol. 25, 1992, pp. 25-33. 

[BOATTO-2] L. Boatto et al., « Detection and separation of symbols connected to graphics in line drawings », Proc. of 11th International Conference on Pattern Recognition, The Hague, vol. 2, 1992, pp 545-548.

[CASEY] R.G. Casey, E. Lecolinet, « A Survey of methods and strategies in character segmentation », IEEE Trans. on PAMI, 18 (7), 1996, pp. 690-706. 

[CHEN]  Y. Chen, N.A. Langrana,A.K. Das, « Perfecting vectorized mechanical drawings », Computer Vision and Image Understanding, 63 (2), 1996, pp. 273-286. 

[DAI] M. Dai, P. Baylou and M. Najim, « An efficient algorithm for computation of shape moments from run-length codes or chain codes », Pattern Recognition , 25, 1992, pp. 1119-1128.

[DENHARTOG] J.E. Den Hartog , T . K. Ten Kate, J.J. Gerbrands, « Knowledgebased interpretation of utility maps », Computer Vision and Image Understanding, 63, 1996, pp. 105-117. 

[DERRODE-1] S. Derrode, Représentation de formes planes à niveaux de gris par différentes approximations de Fourier-Mellin analytique en vue d’indexation de bases d’images, Th èse de Doctorat, Université de Rennes 1, 1999. 

[DERRODE-2] S. Derrode, F. Ghorbel, « Transformée de Fourier-Mellin numérique – Reconstruction et estimation de mouvements d’objets à niveaux de gris », Actes du Colloque GRETSI, Grenoble, France, 1997, pp. 655-658. 

[DESSEILLIGNY-1] M. P. Deseilligny, H. Le Men, G. Stamon, « Character string recognition on maps, a rotation-invariant recognition method », Pattern Recognition Letters, 16, 1995, pp. 1297-1310.

[DESSEILLIGNY-2] M.P. Deseilligny, H.L. Men, G. Stamon, « Lecture Automatique des Écritures sur Cartes Scannées », Traitement du Signal, 12 (6), 1995, pp. 639-652. 

[DORI-1]  D. Dori, L. Wenyin, « Automated CAD conversion with the machine drawing understanding system: concepts, algorithms, and performances », IEEE Trans. on SMC – Part A, 29 (4), 1999, pp. 411416. 

[DORI-2]  D. Dori, W. Liu, « Vector-based segmentation of text connected to graphics in engineering drawings », P. Perner, P. Wang and A. Rosenfeld, edts., Lecture Notes in Computer Science, 1121, 1996, pp. 322-331. 

[DUDANI] S. A. Dudani, K. J. Bredding, R. M. McGhee, « Aircraft identification by moment invariants », IEEE Trans. on Computers, 26, 1977, pp. 39-45. 

[FLETCHER] L.A. Fletcher, R. Kasturi, « A robust algorithm for text string separation from mixed text/graphics images » , IEEE Trans. on  PAMI, 10 (6), 1988, pp. 910-918. 

[FUKUMI] M. Fukumi, S. Omatu, T. Takeda, T. Kosaka, « Rotation invariant neural pattern recognition system with application to coin recognition », IEEE Trans. on Neural Networks, 3, 1992, pp. 272-279. 

[GHORBEL] F. Ghorbel, « A complete invariant description for gray level images by the harmonic analysis approach », Pattern Recognition Letters, 15, 1994, pp. 1043-1051. 

[GRENIER] V. Grenier, R. Mullot, J-M. Ogier, S. Adam, J. Gardes, Y. Lecourtier, « Une architecture distribuée pour l’interprétation de documents techniques », Actes de RFIA 2000, Paris, Janvier 2000.

[HU] M. K. Hu, « Visual pattern recognition by moment invariants », IRE Trans. on Information Theory, 8, 1962, pp. 179-187. 

[JOSEPH] S. H. Joseph, P. Pridmore, « Knowledge-directed interpretation of mechanical engineering drawings », IEEE Trans. on Pattern Analysis and Machine Intelligence, 14, 1992, pp. 928-940.

[KASTURI] R. Kasturi, J. Alemany, « Information extraction from images of paper-based maps », IEEE Trans. on Software Engineering, 14 (5), 1988, pp. 671-675. 

[KHOTANZAD-a] A. Khotanzad, Y. H. Hong, « Rotation invariant image recognition using features selected via a systematic method », Pattern Recognition, 23, 1990, pp. 1089-1101. 

[KHOTANZAD-b] A. Khotanzad,Y. H. Hong, « Invariant image recognition by Zernike moments », IEEE Trans. on PAMI, 12 (5), 1990, pp. 489-497.

[KITA] N. Kita, « Object locating based on concentric circular description », Proc. 11th IEEE International Conference of Pattern Recognition, The Hague, vol. 1, 1992, pp. 637-641. 

[KUHL]  F.P. Kuhl, C.R. Giardana, « Elliptic Fourier features of closed contour », Computer Vision, Graphics and Image Processing, 18, 1982, pp. 236-258. 

[LAI]  C.P. Lai, R. Kasturi, « Detection of dimension sets in engineering drawings », IEEE Trans. on PAMI, 16 (8), 1994, pp. 848-855. 

[LANGRANA] N.A. Langrana,Y. Chen,A.K. Das, « Feature identification from vectorized mechanical drawings, Computer Vision and Image Understanding, 68 (2), 1997, pp. 127-145. 

[LEFRERE] L. Lefrere, Contribution au Développement d’Outils pour l’Analyse Automatique de Documents Cartographiques, Th èse de Doctorat, Université de Rouen, 1993. 

[LIAO] S.X. Liao, M. Pawlak, « On the accuracy of Zernike moments for image analysis », IEEE Trans. on PAMI, 20 (12), 1998, pp. 13581364. 

[LIN-1] B. C. Lin, J. Shen, « Fast computation of moment invariants », Pattern Recognition, 24, 1991, pp. 807-813. 

[LIN-2] C. H. Lin, « New forms of shape invariants from elliptic Fourier descriptors », Pattern Recognition, 20 , 1987, pp. 535-545. 

[LIU] W. Liu, D. Dori, « A protocol for performance evaluation of line detection algorithms », Machine Vision and Applications, 9 (5), 1997, pp. 240-250. 

[LU] Z. Lu, « Detection of text regions from digital engineering drawings », IEEE Trans. on PAMI, 20 (4), 1998, pp. 431-439. 

[MORI] S. Mori, C. Y. Suen, K. Yamamoto, « Historical review of OCR research and development », Proceedings of  IEEE , 80, 1992, pp. 1029-1098. 

[NAGY]  G. Nagy, A. Samal, S. Seth, T. Fisher, E. Guthmann, K. Kalafala, L. Li, P. Sarkar, S. Sivasubramaniam, Y. Xu, « A prototype for adaptative association with streets on maps », in K. Tombre and A.K. Chhabra, eds., Lecture Notes  in Computer Science, 1389, 1998. 

[OGIER-1] J.M. Ogier, C. Cariou, R. Mullot, J. Gardes, Y. Lecourtier, « Interpretation of technical document: Application to French telephonic network », Proc. ISAS, 1998, Orlando, Florida, pp. 457-463.

[OGIER-2] J. M. Ogier, R. Mullot, J. Labiche and Y. Lecourtier, «Multilevel approach and distributed consistency for technical map interpretation: application to cadastral maps», Computer Vision and Image Understanding, 70, 1998, pp. 438-451. 

[PEI] S. C. Pei and C. N. Lin, «  Normalisation of rotationally symmetric shapes for pattern recognition », Pattern Recognition, 25 , 1992, pp. 913-920.

[RAVICHANDRAN] G. Ravichandran, M. Trivedi, « Circular-Mellin features for texture segmentation », IEEE Trans. Image Processing, 4, 1995, pp. 1629-1640. 

[REISS] T. H. Reiss, « Recognizing planar objects using invariants image features», in Lecture Notes in Computer Science, Springer-Verlag, Berlin, 1993. 

[ROTHE]  I. Rothe, H. Susse, K. Voss, « The Method of normalization to determine invariants », IEEE Trans. on PAMI, 18 (4), 1996, pp. 366-379. 

[SHENG] Y. Sheng, L. Shen, « Orthogonal Fourier-Mellin moments for invariant pattern recognition », J. Opt. Soc. Am., 11, 1994, pp. 1748-1757. 

[SHIMOSUTJI-1] S. Shimotsuji, O. Hori, M. Asano, K. Suzuki, F. Hoshino, T. Ishii, « A robust recognition system for a drawing superimposed on a map », IEEE Computer magazine, 25 (7), 1992, pp. 56-64. 

[SHIMOSUTJI-2] S. Shimotsuji, O. Hori, M. Asano, « Robust drawing recognition based on based-guided segmentation», Proc. of IAPR Workshop on Document Analysis Systems, Kaiserslautern, Germany, 1994, pp. 337-348. 

[SUZUKI] S. Suzuki, T. Yamada, « MARIS : MAp Recognition Input System», Pattern Recognition, 23, 1990, pp. 919-933. 

[TAN] T. N. Tan, « Rotation invariant texture features and their use in automatic script identification», IEEE Trans. on PAMI, 20, 1998, pp. 751-756. 

[TAXT] T. Taxt, J. B. Olafsdottir, M. Daehlen, « Recognition of handwritten symbols », Pattern Recognition, 23, 1990, pp. 1155-1166. 

[TEAGUE] M. Teague, « Image analysis via the general theory of moments », Journal of Optical Society of America, 70, 1980, pp. 920-930. 

[TEH] C. Teh, R. Chin, « On image analysis by the method of moments », IEEE Trans. on PAMI, 10, 1988, pp. 496-512. 

[TRIER-1] O. D. Trier, A. K. Jain, T. Taxt, « Features extraction methods for character recognition – a survey », Pattern Recognition, 29, 1996, pp. 641-662. 

[TRIER-2] O. D. Trier, T. Taxt, A.K. Jain, « Data capture from maps based on gray scale topographic analysis », Proc. of International Conference on Documents Analysis and Recognition, 1995, Montreal, Canada, pp. 923-926. 

[TRIER-3]  O.D. Trier, T. Taxt, A.K. Jain, « Recognition of digits in hydrographic maps : binary versus topographic analysis » , IEEE Trans. on PAMI, 19 (4), 1997, pp. 399-404. 

[VAXIVIERE] P. Vaxiviere, K. Tombre, « CELESTIN : CAD conversion of mechanical drawings », IEEE Computer Magazine, 25, 1992, pp. 4654. 

[WENYIN]  L. Wenyin, D. Dori, « A proposed scheme for performance evaluation of graphics/text separation algorithms », in K. Tombre and A.K. Chhabra, Lecture Note in Computer Science, 1389, 1998, pp. 359-371. 

[WOOD] J. Wood, « Invariant pattern recognition : a review », Pattern recognition, 29, 1996, pp. 1-17.