Incremental Learning with Few Data for Online Handwritten Character Recognition. Apprentissage Incrémental avec Peu de Données pour la Reconnaissance de Caractères Manuscrits En-Ligne

Incremental Learning with Few Data for Online Handwritten Character Recognition

Apprentissage Incrémental avec Peu de Données pour la Reconnaissance de Caractères Manuscrits En-Ligne

Abdullah Almaksour Harold Mouchère  Eric Anquetil 

Laboratoire IRISA/INSA, Campus Universitaire de Beaulieu,Avenue du Général Leclerc, 35042 RENNES Cedex

Laboratoire IRCCyN, Rue Christian Pauc, BP 50609, 44306 Nantes Cedex 03

15 December 2009
The experiments are based on the recognition of the 26 isolated lower case Latin letter.The writer specific datasets were written on a PDA by 18 writers.Each writer has randomly inputted 40 times each character,i.e 1040 characters per writer.In order to estimate the performance of the incremental learning strategy for each writer,we proceed by a 4-fold cross-validation technique.Three quarters of the dataset (780 letters) are used to incrementally learn the system, and one quarter (260 letters) is used to estimate the evolving of system capacity during the learning process.The presented results in the figures are the average of the 18 tests (18 writers).Each pattern in our system is described by a set of 21 features.A new example of each class is presented to the system in each learning cycle.

We compare in these experiments the performance of the two incremental learning strategies in terms of the complexity of the classifier,and the quality of the classifier.we evaluate also the impact of using the artificial characters generation on the quality and the complexity of the classifier in our incremental learning system.

We note that the confusion-driven strategy results in a classifier with a quality equal to or greater than that obtained with the two-phase strategy,with creating fewer prototypes.We find that using the confusion-driven strategy with artificial characters generation,a recognition rate about 90% is reached after only 5 learning examples, and such rate rapidly improves reaching 94% after 10 examples,and about 97% after 30 examples.We note also that recognition error rate decreases by 40% using artificial characters generation techniques.

We conclude that confusion-driven strategy achieves a better recognition rate for the same number of prototypes comparing to two-phase one.It can be also noted that the quality/complexity ratio of the classifier is enhanced thanks to the artificial characters generation.A special emphasis for a possible future work is placed on reducing the number of prototypes in the system either by deleting the “useless”prototypes or by merging redundant ones.We plan also to explore other approaches to synthesize handwriting,inspired in particularly by the Sigma-lognormal model.


Dans ce papier,nous présentons un nouvel algorithme d’apprentissage incrémental d’un système de reconnaissance en-ligne de caractères manuscrits. L’objectif est d’apprendre «à la volée » toute nouvelle classe de caractères à partir de très peu d’exemples de caractères tout en optimisant les classes déjà modélisées au fur et à mesure de la saisie de nouveaux exemples. Le système proposé est capable de surmonter le problème du manque de données d’apprentissage lors de l’introduction d’une nouvelle classe de caractères grâce à la synthèse de caractères artificiels. Les tests ont été conduits dans le cadre d’un apprentissage incrémental mono-scripteur de lettres minuscules cursives sur une base de 18 scripteurs. Les résultats montrent qu’un bon taux de reconnaissance (environ 90 %) est atteint en utilisant seulement 5 exemples d’apprentissage par classe. De plus,ce taux augmente rapidement pour atteindre 94 % pour 10 exemples,et environ 97 % pour 30. Une réduction d’erreur de 40 % est obtenue en utilisant la synthèse de caractères par rapport à une stratégie sans synthèse.


Mots clés 

Apprentissage incrémental,reconnaissance de caractères manuscrits en-ligne,synthèse de données manuscrites,rejet d’ambiguïté,systèmes d’inférence floue.

2.Principes Généraux de l’Approche Proposée
3.Stratégies d’Apprentissage Incrémental
4.Accélération de l’Apprentissage par la Synthèse
6.Conclusion et Travaux Futurs

