Le Tifinaghe et les nouvelles technologies au service du document numérique a...
réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe
1. 1
La Reconnaissance Optique des Caractères
Application á la Graphie Amazighe
Présenté par
AIT OUGUENGAY Youssef
Encadré par :
Mr. Taalabi
Ecole Mohammadia d’Ingénieurs
DESA / CPI
2008
2. 2
PLAN
DESA / CPI juillet 2008
2. La graphie Amazighe
3. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
3. 3
Motivations
Travaux d’aménagement de la langue amazighe (codage
Unicode/ISO10646 (2002), standardisation de
l’amazighe,..)
Intégration de la langue amazighe dans les NTIC.
Premier travail d’OCR pour l’amazighe (travaux en cours)
Utilisation des réseaux de neurones:
Outils classiques dans les problèmes de classification.
Simplification de la modélisation des problèmes
statiques non linéaires.
Efficaces dans le cas d’un nombre important de
variables.
DESA
4. Introduction
DESA / CPI juillet 2008 4
Acquisition
Segmentation
Apprentissage
Post-traitement
Prétraitement
Extraction des
Caractéristiques
Classification
Modèles
Les composants d’un système de ROC :
5. 5
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Entraînement du RNA
1. Introduction.
6. Cahier des charges et démarche
Objectif : La classification des caractères
amazighes
Technologie utilisée :
les polices de caractéres amazighes éxistants
pour la constitution de la base de données
d’apprentissage
réseaux de neurones artificiels pour la
classification.
DESA / CPI juillet 2008 6
7. Démarche séparée en 3 étapes :
présentation des formats de caractères en un format
plus approprié à l’aide des polices de caractéres.
Extraction des caractéristiques
Simulation et entraînement du réseau de neurones
artificiels.
DESA / CPI juillet 2008 7
Cahier des charges et démarche
8. 8
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
9. 9
La graphie amazighe
Alphabet «Tifinaghe» = système d’écriture amazighe.
Plusieurs variantes existent (Afrique de nord, Sahara,
îles canaries)
Origine = alphabet libyque et saharien depuis 6éme
siècle avant l’ère chrétienne
Aucun changement de formes à travers l’histoire
55 caractères sont retenu (Unicode)
Tifinaghe-IRCAM, néo-tifinaghe, touaregs,..
33 caractère pour l’alphabet marocaine retenue :
Tifinaghe-IRCAM.
DESA / CPI juillet 2008
11. 11
La graphie amazighe
• Formes géométriques simples
• Caractères à plusieurs composantes connexes
SITA'08 systémes intélligent : théories et applications
12. 12
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Entraînement du RNA
1. Introduction.
13. 13
Création des modèles d’apprentissage
• 12 polices de caractères
• Tailles entre : 10 points – 28 points
DESA / CPI 2008
14. 14
Création des modèles d’apprentissage
• Images de départ = Tableaux contenant
un caractères par cellule
• Création de la base de données brut
Taille réelle (300
dpi)
Cadrage minimal de chaque caractère
Arborescence de stockage bien
définis (../caract/font_taille.png)
DESA / CPI 2008
15. 15
Création des modèles d’apprentissage
Deux types de normalisation des patterns :
Tailles réelles des patterns + Remplissage par des pixels
éteints.
Hmax = 105 pixels
Lmax = 125 pixel
1ére normalisation :
DESA / CPI 2008
16. 16
Création des modèles d’apprentissage
Tailles normalisées vers une valeur normalisé calculée
(24*24 pixels).
Hnorm = 24 pixels
Lnorm = 24 pixels
2éme normalisation :
17. 17
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Entraînement du RNA
1. Introduction.
18. 18
Extraction des caractéristiques
Caractéristiques à extraire : variables d’entrée
Centre de gravité du caractère
Densité (pixels allumés (=Aire) / la surface totale de l’image)
19. Extraction des caractéristiques
DESA / CPI juillet 2008 19
projection verticale de l’image du caractère.
Projection horizontale de l’image de caractère
20. Extraction des caractéristiques
DESA / CPI juillet 2008 20
Périmètre du caractère par rapport au périmètre de l’image.
Π Compacité = ((périmètre)²/(4 Aire))
22. 22
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
23. Le réseau de neurones
Un RNA est un système d’équation
de N variables.
Inconnus : les poids des connections
entre les nœuds
Architecture : multicouches à
connexion complète.
chaque nœud fait un calcul simple
selon une fonction seuil d’activation.
23
sortie
entrée
Variables d’entrée
couche
cachée
24. Le réseau de neurones
Cas du reconnaissance des formes
Sorties bien connus
Apprentissage supervisé
Entrées = caractéristiques extraites des caractères
24SITA'08 systémes intélligent : théories et applications
25. 25
Le réseau de neurones
Un Perceptron multicouche à une seule couche cachée
Couche d’entrée
C.Sortie
33 neurones =
33 caractères
SITA'08 systémes intélligent : théories et applications
26. 26
Le réseau de neurones
Caractéristiques extraits = variables d’entrée
centre de gravité du caractère (2 neurones)
Moments centrales d’ordre 2. (3 neurones)
projection verticale de l’image du caractère. ( L neurones)
Projection horizontale de l’image de caractère ( H neurones )
Périmètre du caractère par rapport au périmètre de l’image. (1 neurones)
Densité (pixels allumés (Aire) / la surface totale de l’image) (1
neurone )
ΠCompacité ((périmètre) ²/ (4 Aire)) ( 1 neurone )
SITA'08 systémes intélligent : théories et applications
La couche d’entrée
27. Le réseau de neurones
La couche de sortie
33 neurones = 33 cractéres
La couche cachée :
nbr de neurones par essai et erreur + règles pratiques (littérature)
Nombre indicatif retenu = (n(c.entrée)+n(c.sortie)) / 2
27
28. 28
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
29. 29
Apprentissage du RNA
BD des
modèles
Logiciel de simulation = JavaNNS
Base de données des modèles
est un fichier textes formaté.
Base de données devisée en deux
partie:
1. Fichier d’entraînement
(Tailles paires des patterns)
1. Fichier de validation (test)
(Tailles impaires patterns)
• Constitution de la base de données
d’entraînement :
30. 30
Apprentissage du RNA (premiers résultats)
1ére normalisation des patterns (tailles réelles des caract..)
Configuration du réseau de neurones :
c.e : 138 neurones
c.c : 85 neurones
c.s : 33 neurones
Base de données d’apprentissage : ~ 3900 Patterns et 3500
pattern pour le test
Inconnus : ~14535 connexions à calculer ((138*85)+(85*33)).
31. 31
Apprentissage du RNA (premiers résultats)
entraînement
validation
Évolution de l’erreur quadratique
moyenne (MSE)
32. Apprentissage du RNA (Amélioration du RNA)
Pour améliorer les résultats du simulation :
On effectue une première amélioration :
On utilise la deuxième normalisation des images des
caractères ( vers une taille de 24*24 pixels)
32
33. Apprentissage du RNA (version améliorée)
Normalisation des patterns.
Configuration du réseau de neurones
c.e : 56 neurones
c.c : 44 neurones
c.s : 33 neurones
Avec une base de données triplée : 10700
d’entrainement et 10500 pour le test.
Inconnus : ~3916 connexions à déterminer.
33
34. 34
Apprentissage du RNA (version améliorée)
Evolution de l’erreur quadratique moyenne (MSE)
en fonction de nombres de neurones de la couche
cachée.
35. 35
Apprentissage du RNA (version améliorée)
Une deuxième amélioration :
On augmente la taille de la base de données
d’apprentissage en introduisant des variantes Gras et
italique des polices de caractères.
La Base de données est triplé.
36. 36
Apprentissage du RNA (version améliorée)
Evolution de l’erreur quadratique moyenne (MSE)
en fonction de nombres de neurones de la couche
cachée.
SITA'08 systémes intélligent : théories et applications
37. 37
Conclusions et perspectives
Le RNA donne un bon rendement même avec peu de
données .
La recommandation en pratique est d’avoir beaucoup
plus de données que de connexions dans le réseaux.
Dans notre cas :
connexions données rapport
14535 3900 0.2
3916 10700 2.7
38. Conclusions et perspectives
Perspectives de ce travail :
Augmentation de la BD d’apprentissage :
Plus de polices de caractéres.
Introduction des modèles d’apprentissage bruités.
Chiffres, ponctuation..
Implimentation du réseau dans un systéme ROC.
DESA / CPI juillet 2008 38