L'ICR décrypte les manuscrits
Intégrée aux technologies de lecture automatique des documents, l'Intelligent Character Recognition est capable de reconnaître l'écriture manuscrite.

Patrick Brébion , Décision Informatique, le 23/03/2006 à 07h00

Une des facettes les plus intéressantes de la dématérialisation consiste à scanner, reconnaître et classer les documents entrants, qui seront envoyés dans la corbeille électronique du service adéquat ou versés dans des bases de données, sans intervention humaine. Pour ce faire, les technologies d'ICR ( Intelligent Character Recognition ) prennent en charge la reconnaissance de l'écriture manuscrite.

En l'état actuel des technologies, il ne s'agit pas encore de reconnaître l'ensemble des courriers manuscrits, mais plutôt des mots ou des chiffres dans des cases (montant d'un chèque, par exemple), ou d'identifier des mots-clés dans un courrier entrant. Un mot qui sera comparé à une liste prédéfinie. Les éditeurs du domaine décomposent habituellement l'ICR en deux familles.

Dans la première, il s'agit de reconnaître une suite de caractères isolés composant, par exemple, le code postal d'un courrier, à partir de caractères bâtons séparés ou jointifs. La seconde famille s'attache à découvrir l'occurrence de mots entiers à n'importe quel endroit dans un texte manuscrit en lettres cursives. Cette seconde famille est souvent baptisée Intelligent Word Recognition , ou IWR. Les deux approches s'appuient sur les mêmes technologies, réseaux de neurones et reconnaissance de formes.

Segmentation et reconnaissance du texte

Les moteurs d'ICR commencent par découper le texte. Cette phase, dite de segmentation, consiste à découper un texte en mots et/ou en lettres. Elle se fait, entre autres, à partir du calcul de la distance entre chacune des lettres ou chacun des mots. Une fois découpés, les caractères sont analysés par plusieurs moteurs. Chaque moteur effectue son analyse à partir d'algorithmes qui lui sont propres.

Les techniques les plus classiques reposent sur la reconnaissance d'un ensemble de caractéristiques. Les lignes, cadres, concavités, convexités sont analysés. Ainsi, le moteur détectera la présence d'une boucle, d'une barre oblique et d'une barre horizontale de haut en bas. Il utilisera ces caractéristiques pour attribuer un caractère à découper. D'autres moteurs sont constitués d'algorithmes capables de définir une lettre à partir d'un apprentissage. Dans ce cas, on donne au réseau de neurones une série de lettres en entrée et la correspondance. Plus la base sera fournie, plus le réseau sera capable de reconnaître des lettres présentant des variations de forme importantes.

Il s'agit, par exemple, de fournir un « A », de définir à quel ensemble de pixels correspondra cette lettre et de fournir un échantillon de « A » manuscrits. Le réseau calculera la probabilité que l'image soit effectivement une image de « A ». Une probabilité qui sera utilisée comme note de confiance pour évaluer la fiabilité de la reconnaissance. Pour la reconnaissance de mots, les Modèles de Markov Cachés ne nécessitent pas de découpage en lettres, impossible à réaliser avec des écritures cursives, mais en formes élémentaires pouvant être regroupées en lettres. La richesse des échantillons d'écritures fournis lors de l'apprentissage permettra de s'affranchir des types d'écritures.

Etablir un seuil de confiance

Chacun de ces moteurs attribue une note de confiance correspondant à une probabilité de reconnaissance, variant en général entre 0 et 1000. L'ensemble des notes obtenues par chaque moteur est ensuite pondéré pour donner une note globale. Quelques éditeurs, comme Itesoft ou A2iA, utilisent conjointement segmentation et reconnaissance pour obtenir un score de confiance plus élevé.

Cette itération a pour but de découper, par exemple, un « 1 » et un « 2 » graphiquement reliés en différents endroits jusqu'à atteindre un seuil de confiance acceptable dans la reconnaissance. La note obtenue permet de départager les résultats de reconnaissance par rapport à un seuil paramétrable.


 

1 - La reconnaissance par forme analyse les courbes, droites, concavités, convexités, etc., et leur agencement. Elle les compare ensuite à des modèles définissant une lettre par un agencement de formes.

2 - Dans la reconnaissance par réseau neuronal, on fournit initialement au moteur un ensemble de pixels correspondant à une lettre. Puis, une série de la même lettre manuscrite. L'analyse part de cet apprentissage.


 

 

 

 01banner_vertical_blanc_ass14.jpg

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 accueil/association/services/promotion/contact/webmaster