L'ICR décrypte les manuscrits Intégrée aux technologies de
lecture automatique des documents, l'Intelligent Character Recognition est
capable de reconnaître l'écriture manuscrite.
Patrick
Brébion , Décision Informatique,
le
23/03/2006 à 07h00
Une des facettes les plus intéressantes de la
dématérialisation consiste à scanner, reconnaître et classer les documents
entrants, qui seront envoyés dans la corbeille électronique du service adéquat
ou versés dans des bases de données, sans intervention humaine. Pour ce faire,
les technologies d'ICR ( Intelligent Character
Recognition ) prennent en charge la
reconnaissance de l'écriture manuscrite.
En l'état actuel des technologies, il ne s'agit pas
encore de reconnaître l'ensemble des courriers manuscrits, mais plutôt des mots
ou des chiffres dans des cases (montant d'un chèque, par exemple), ou
d'identifier des mots-clés dans un courrier entrant. Un mot qui sera comparé à
une liste prédéfinie. Les éditeurs du domaine décomposent habituellement l'ICR
en deux familles.
Dans la première, il s'agit de reconnaître une suite de
caractères isolés composant, par exemple, le code postal d'un courrier, à partir
de caractères bâtons séparés ou jointifs. La seconde famille s'attache à
découvrir l'occurrence de mots entiers à n'importe quel endroit dans un texte
manuscrit en lettres cursives. Cette seconde famille est souvent baptisée
Intelligent Word Recognition , ou IWR. Les deux approches s'appuient sur les mêmes
technologies, réseaux de neurones et reconnaissance de formes.
Segmentation et reconnaissance du texte
Les moteurs d'ICR commencent par découper le texte. Cette
phase, dite de segmentation, consiste à découper un texte en mots et/ou en
lettres. Elle se fait, entre autres, à partir du calcul de la distance entre
chacune des lettres ou chacun des mots. Une fois découpés, les caractères sont
analysés par plusieurs moteurs. Chaque moteur effectue son analyse à partir
d'algorithmes qui lui sont propres.
Les techniques les plus classiques reposent sur la
reconnaissance d'un ensemble de caractéristiques. Les lignes, cadres,
concavités, convexités sont analysés. Ainsi, le moteur détectera la présence
d'une boucle, d'une barre oblique et d'une barre horizontale de haut en bas. Il
utilisera ces caractéristiques pour attribuer un caractère à découper. D'autres
moteurs sont constitués d'algorithmes capables de définir une lettre à partir
d'un apprentissage. Dans ce cas, on donne au réseau de neurones une série de
lettres en entrée et la correspondance. Plus la base sera fournie, plus le
réseau sera capable de reconnaître des lettres présentant des variations de
forme importantes.
Il s'agit, par exemple, de fournir un « A », de définir à
quel ensemble de pixels correspondra cette lettre et de fournir un échantillon
de « A » manuscrits. Le réseau calculera la probabilité que l'image soit
effectivement une image de « A ». Une probabilité qui sera utilisée comme note
de confiance pour évaluer la fiabilité de la reconnaissance. Pour la
reconnaissance de mots, les Modèles de Markov Cachés ne nécessitent pas de
découpage en lettres, impossible à réaliser avec des écritures cursives, mais en
formes élémentaires pouvant être regroupées en lettres. La richesse des
échantillons d'écritures fournis lors de l'apprentissage permettra de
s'affranchir des types d'écritures.
Etablir un seuil de confiance
Chacun de ces moteurs attribue une note de confiance
correspondant à une probabilité de reconnaissance, variant en général entre 0 et
1000. L'ensemble des notes obtenues par chaque moteur est ensuite pondéré pour
donner une note globale. Quelques éditeurs, comme Itesoft ou A2iA, utilisent
conjointement segmentation et reconnaissance pour obtenir un score de confiance
plus élevé.
Cette itération a pour but de découper, par exemple, un
« 1 » et un « 2 » graphiquement reliés en différents endroits jusqu'à atteindre
un seuil de confiance acceptable dans la reconnaissance. La note obtenue permet
de départager les résultats de reconnaissance par rapport à un seuil
paramétrable.
1 - La reconnaissance par forme analyse les courbes,
droites, concavités, convexités, etc., et leur agencement. Elle les compare
ensuite à des modèles définissant une lettre par un agencement de formes.
2 - Dans la reconnaissance par réseau neuronal, on
fournit initialement au moteur un ensemble de pixels correspondant à une lettre.
Puis, une série de la même lettre manuscrite. L'analyse part de cet
apprentissage. |