réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe

1
La Reconnaissance Optique des Caractères
Application á la Graphie Amazighe
Présenté par
AIT OUGUENGAY Youssef
Encadré par :
Mr. Taalabi
Ecole Mohammadia d’Ingénieurs
DESA / CPI
2008

2
PLAN
DESA / CPI juillet 2008
2. La graphie Amazighe
3. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.

3
Motivations
 Travaux d’aménagement de la langue amazighe (codage
Unicode/ISO10646 (2002), standardisation de
l’amazighe,..)
 Intégration de la langue amazighe dans les NTIC.
 Premier travail d’OCR pour l’amazighe (travaux en cours)
 Utilisation des réseaux de neurones:
 Outils classiques dans les problèmes de classification.
 Simplification de la modélisation des problèmes
statiques non linéaires.
 Efficaces dans le cas d’un nombre important de
variables.
DESA

Introduction
DESA / CPI juillet 2008 4
Acquisition
Segmentation
Apprentissage
Post-traitement
Prétraitement
Extraction des
Caractéristiques
Classification
Modèles
Les composants d’un système de ROC :

5
PLAN
7. Entraînement du RNA
1. Introduction.

Cahier des charges et démarche
 Objectif : La classification des caractères
amazighes
 Technologie utilisée :
 les polices de caractéres amazighes éxistants
pour la constitution de la base de données
d’apprentissage
 réseaux de neurones artificiels pour la
classification.

 Démarche séparée en 3 étapes :
 présentation des formats de caractères en un format
plus approprié à l’aide des polices de caractéres.
 Extraction des caractéristiques
 Simulation et entraînement du réseau de neurones
artificiels.
Cahier des charges et démarche

8
PLAN
1. Introduction.

9
La graphie amazighe
 Alphabet «Tifinaghe» = système d’écriture amazighe.
 Plusieurs variantes existent (Afrique de nord, Sahara,
îles canaries)
 Origine = alphabet libyque et saharien depuis 6éme
siècle avant l’ère chrétienne
 Aucun changement de formes à travers l’histoire
 55 caractères sont retenu (Unicode)
 Tifinaghe-IRCAM, néo-tifinaghe, touaregs,..
 33 caractère pour l’alphabet marocaine retenue :
Tifinaghe-IRCAM.

10
La graphie amazighe

11
La graphie amazighe
• Formes géométriques simples
• Caractères à plusieurs composantes connexes
SITA'08 systémes intélligent : théories et applications

12
PLAN
1. Introduction.

13
Création des modèles d’apprentissage
• 12 polices de caractères
• Tailles entre : 10 points – 28 points
DESA / CPI 2008

14
• Images de départ = Tableaux contenant
un caractères par cellule
• Création de la base de données brut
 Taille réelle (300
dpi)
Cadrage minimal de chaque caractère
 Arborescence de stockage bien
définis (../caract/font_taille.png)
DESA / CPI 2008

15
Deux types de normalisation des patterns :
Tailles réelles des patterns + Remplissage par des pixels
éteints.
Hmax = 105 pixels
Lmax = 125 pixel
 1ére normalisation :
DESA / CPI 2008

16
Tailles normalisées vers une valeur normalisé calculée
(24*24 pixels).
Hnorm = 24 pixels
Lnorm = 24 pixels
 2éme normalisation :

17
PLAN
1. Introduction.

18
Extraction des caractéristiques
 Caractéristiques à extraire : variables d’entrée
 Centre de gravité du caractère
 Densité (pixels allumés (=Aire) / la surface totale de l’image)

 projection verticale de l’image du caractère.
 Projection horizontale de l’image de caractère

 Périmètre du caractère par rapport au périmètre de l’image.
Π Compacité = ((périmètre)²/(4 Aire))

 Moments centrales d’ordre 2
X et y sont les centres de masse de caractère.

22
PLAN
1. Introduction.

Le réseau de neurones
 Un RNA est un système d’équation
de N variables.
 Inconnus : les poids des connections
entre les nœuds
 Architecture : multicouches à
connexion complète.
 chaque nœud fait un calcul simple
selon une fonction seuil d’activation.
23
sortie
entrée
Variables d’entrée
couche
cachée

 Cas du reconnaissance des formes
 Sorties bien connus
 Apprentissage supervisé
 Entrées = caractéristiques extraites des caractères
24SITA'08 systémes intélligent : théories et applications

25
Un Perceptron multicouche à une seule couche cachée
Couche d’entrée
C.Sortie
 33 neurones =
33 caractères

26
 Caractéristiques extraits = variables d’entrée
centre de gravité du caractère (2 neurones)
Moments centrales d’ordre 2. (3 neurones)
projection verticale de l’image du caractère. ( L neurones)
Projection horizontale de l’image de caractère ( H neurones )
Périmètre du caractère par rapport au périmètre de l’image. (1 neurones)
Densité (pixels allumés (Aire) / la surface totale de l’image) (1
neurone )
ΠCompacité ((périmètre) ²/ (4 Aire)) ( 1 neurone )
La couche d’entrée

La couche de sortie
 33 neurones = 33 cractéres
La couche cachée :
 nbr de neurones par essai et erreur + règles pratiques (littérature)
 Nombre indicatif retenu = (n(c.entrée)+n(c.sortie)) / 2
27

28
PLAN
1. Introduction.

29
Apprentissage du RNA
BD des
modèles
 Logiciel de simulation = JavaNNS
 Base de données des modèles
est un fichier textes formaté.
 Base de données devisée en deux
partie:
1. Fichier d’entraînement
(Tailles paires des patterns)
1. Fichier de validation (test)
(Tailles impaires patterns)
• Constitution de la base de données
d’entraînement :

30
Apprentissage du RNA (premiers résultats)
 1ére normalisation des patterns (tailles réelles des caract..)
 Configuration du réseau de neurones :
 c.e : 138 neurones
 c.c : 85 neurones
 c.s : 33 neurones
 Base de données d’apprentissage : ~ 3900 Patterns et 3500
pattern pour le test
 Inconnus : ~14535 connexions à calculer ((138*85)+(85*33)).

31
Apprentissage du RNA (premiers résultats)
entraînement
validation
Évolution de l’erreur quadratique
moyenne (MSE)

Apprentissage du RNA (Amélioration du RNA)
 Pour améliorer les résultats du simulation :
On effectue une première amélioration :
 On utilise la deuxième normalisation des images des
caractères ( vers une taille de 24*24 pixels)
32

Apprentissage du RNA (version améliorée)
 Normalisation des patterns.
 Configuration du réseau de neurones
 c.e : 56 neurones
 c.c : 44 neurones
 c.s : 33 neurones
 Avec une base de données triplée : 10700
d’entrainement et 10500 pour le test.
 Inconnus : ~3916 connexions à déterminer.
33

34
Evolution de l’erreur quadratique moyenne (MSE)
en fonction de nombres de neurones de la couche
cachée.

35
 Une deuxième amélioration :
On augmente la taille de la base de données
d’apprentissage en introduisant des variantes Gras et
italique des polices de caractères.
 La Base de données est triplé.

36
Evolution de l’erreur quadratique moyenne (MSE)
en fonction de nombres de neurones de la couche
cachée.

37
Conclusions et perspectives
 Le RNA donne un bon rendement même avec peu de
données .
 La recommandation en pratique est d’avoir beaucoup
plus de données que de connexions dans le réseaux.
Dans notre cas :
connexions données rapport
14535 3900 0.2
3916 10700 2.7

Conclusions et perspectives
Perspectives de ce travail :
 Augmentation de la BD d’apprentissage :
 Plus de polices de caractéres.
 Introduction des modèles d’apprentissage bruités.
 Chiffres, ponctuation..
 Implimentation du réseau dans un systéme ROC.

réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe

Recommandé

Recommandé

Contenu connexe

Similaire à réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe

Similaire à réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe (20)

Plus de Youssef Ouguengay

Plus de Youssef Ouguengay (7)

réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe