Ca y est, un module de reconnaissance optique des caractères alphanumériques est maintenant opérationnel. Lorsque les caractères individuels ont été correctement extraits du texte, et que le programme d'extraction peut fournir quelques informations sur l'échelle des caractères et leur position par rapport à la ligne de base, ce module a un taux de succès qui avoisine les 100%. Les erreurs qu'il commet encore surviennent sur des scans de mauvaise qualité, ou lorsque plusieurs lettres collées sont considérées comme une seule. Il nous faut maintenant interconnecter nos différents modules, pour réaliser une chaine complète allant de l'image scannée au texte complet extrait. Seul bémol pour l'instant, la reconnaissance, si elle fonctionne assez bien, reste abominablement lente. Du travail d'optimisation devra être effectué pour rendre le procédé utilisable, mais ce n'est pas notre souci pour l'instant. D'abord quelque chose qui fonctionne tout court, et ensuite seulement quelque chose qui fonctionne vite. |