SlideShare une entreprise Scribd logo
1  sur  39
1
La Reconnaissance Optique des Caractères
Application á la Graphie Amazighe
Présenté par
AIT OUGUENGAY Youssef
Encadré par :
Mr. Taalabi
Ecole Mohammadia d’Ingénieurs
DESA / CPI
2008
2
PLAN
DESA / CPI juillet 2008
2. La graphie Amazighe
3. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
3
Motivations
 Travaux d’aménagement de la langue amazighe (codage
Unicode/ISO10646 (2002), standardisation de
l’amazighe,..)
 Intégration de la langue amazighe dans les NTIC.
 Premier travail d’OCR pour l’amazighe (travaux en cours)
 Utilisation des réseaux de neurones:
 Outils classiques dans les problèmes de classification.
 Simplification de la modélisation des problèmes
statiques non linéaires.
 Efficaces dans le cas d’un nombre important de
variables.
DESA
Introduction
DESA / CPI juillet 2008 4
Acquisition
Segmentation
Apprentissage
Post-traitement
Prétraitement
Extraction des
Caractéristiques
Classification
Modèles
Les composants d’un système de ROC :
5
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Entraînement du RNA
1. Introduction.
Cahier des charges et démarche
 Objectif : La classification des caractères
amazighes
 Technologie utilisée :
 les polices de caractéres amazighes éxistants
pour la constitution de la base de données
d’apprentissage
 réseaux de neurones artificiels pour la
classification.
DESA / CPI juillet 2008 6
 Démarche séparée en 3 étapes :
 présentation des formats de caractères en un format
plus approprié à l’aide des polices de caractéres.
 Extraction des caractéristiques
 Simulation et entraînement du réseau de neurones
artificiels.
DESA / CPI juillet 2008 7
Cahier des charges et démarche
8
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
9
La graphie amazighe
 Alphabet «Tifinaghe» = système d’écriture amazighe.
 Plusieurs variantes existent (Afrique de nord, Sahara,
îles canaries)
 Origine = alphabet libyque et saharien depuis 6éme
siècle avant l’ère chrétienne
 Aucun changement de formes à travers l’histoire
 55 caractères sont retenu (Unicode)
 Tifinaghe-IRCAM, néo-tifinaghe, touaregs,..
 33 caractère pour l’alphabet marocaine retenue :
Tifinaghe-IRCAM.
DESA / CPI juillet 2008
10
La graphie amazighe
DESA / CPI juillet 2008
11
La graphie amazighe
• Formes géométriques simples
• Caractères à plusieurs composantes connexes
SITA'08 systémes intélligent : théories et applications
12
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Entraînement du RNA
1. Introduction.
13
Création des modèles d’apprentissage
• 12 polices de caractères
• Tailles entre : 10 points – 28 points
DESA / CPI 2008
14
Création des modèles d’apprentissage
• Images de départ = Tableaux contenant
un caractères par cellule
• Création de la base de données brut
 Taille réelle (300
dpi)
Cadrage minimal de chaque caractère
 Arborescence de stockage bien
définis (../caract/font_taille.png)
DESA / CPI 2008
15
Création des modèles d’apprentissage
Deux types de normalisation des patterns :
Tailles réelles des patterns + Remplissage par des pixels
éteints.
Hmax = 105 pixels
Lmax = 125 pixel
 1ére normalisation :
DESA / CPI 2008
16
Création des modèles d’apprentissage
Tailles normalisées vers une valeur normalisé calculée
(24*24 pixels).
Hnorm = 24 pixels
Lnorm = 24 pixels
 2éme normalisation :
17
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Entraînement du RNA
1. Introduction.
18
Extraction des caractéristiques
 Caractéristiques à extraire : variables d’entrée
 Centre de gravité du caractère
 Densité (pixels allumés (=Aire) / la surface totale de l’image)
Extraction des caractéristiques
DESA / CPI juillet 2008 19
 projection verticale de l’image du caractère.
 Projection horizontale de l’image de caractère
Extraction des caractéristiques
DESA / CPI juillet 2008 20
 Périmètre du caractère par rapport au périmètre de l’image.
Π Compacité = ((périmètre)²/(4 Aire))
Extraction des caractéristiques
DESA / CPI juillet 2008 21
 Moments centrales d’ordre 2
X et y sont les centres de masse de caractère.
22
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
Le réseau de neurones
 Un RNA est un système d’équation
de N variables.
 Inconnus : les poids des connections
entre les nœuds
 Architecture : multicouches à
connexion complète.
 chaque nœud fait un calcul simple
selon une fonction seuil d’activation.
23
sortie
entrée
Variables d’entrée
couche
cachée
Le réseau de neurones
 Cas du reconnaissance des formes
 Sorties bien connus
 Apprentissage supervisé
 Entrées = caractéristiques extraites des caractères
24SITA'08 systémes intélligent : théories et applications
25
Le réseau de neurones
Un Perceptron multicouche à une seule couche cachée
Couche d’entrée
C.Sortie
 33 neurones =
33 caractères
SITA'08 systémes intélligent : théories et applications
26
Le réseau de neurones
 Caractéristiques extraits = variables d’entrée
centre de gravité du caractère (2 neurones)
Moments centrales d’ordre 2. (3 neurones)
projection verticale de l’image du caractère. ( L neurones)
Projection horizontale de l’image de caractère ( H neurones )
Périmètre du caractère par rapport au périmètre de l’image. (1 neurones)
Densité (pixels allumés (Aire) / la surface totale de l’image) (1
neurone )
ΠCompacité ((périmètre) ²/ (4 Aire)) ( 1 neurone )
SITA'08 systémes intélligent : théories et applications
La couche d’entrée
Le réseau de neurones
La couche de sortie
 33 neurones = 33 cractéres
La couche cachée :
 nbr de neurones par essai et erreur + règles pratiques (littérature)
 Nombre indicatif retenu = (n(c.entrée)+n(c.sortie)) / 2
27
28
PLAN
DESA / CPI juillet 2008
3. La graphie Amazighe
2. Cahier des charges et démarche.
4. Création des modèles d’apprentissage
5. Extraction des caractéristiques
6. Le réseaux de neurones artificiels (RNA)
7. Apprentissage du RNA
1. Introduction.
29
Apprentissage du RNA
BD des
modèles
 Logiciel de simulation = JavaNNS
 Base de données des modèles
est un fichier textes formaté.
 Base de données devisée en deux
partie:
1. Fichier d’entraînement
(Tailles paires des patterns)
1. Fichier de validation (test)
(Tailles impaires patterns)
• Constitution de la base de données
d’entraînement :
30
Apprentissage du RNA (premiers résultats)
 1ére normalisation des patterns (tailles réelles des caract..)
 Configuration du réseau de neurones :
 c.e : 138 neurones
 c.c : 85 neurones
 c.s : 33 neurones
 Base de données d’apprentissage : ~ 3900 Patterns et 3500
pattern pour le test
 Inconnus : ~14535 connexions à calculer ((138*85)+(85*33)).
31
Apprentissage du RNA (premiers résultats)
entraînement
validation
Évolution de l’erreur quadratique
moyenne (MSE)
Apprentissage du RNA (Amélioration du RNA)
 Pour améliorer les résultats du simulation :
On effectue une première amélioration :
 On utilise la deuxième normalisation des images des
caractères ( vers une taille de 24*24 pixels)
32
Apprentissage du RNA (version améliorée)
 Normalisation des patterns.
 Configuration du réseau de neurones
 c.e : 56 neurones
 c.c : 44 neurones
 c.s : 33 neurones
 Avec une base de données triplée : 10700
d’entrainement et 10500 pour le test.
 Inconnus : ~3916 connexions à déterminer.
33
34
Apprentissage du RNA (version améliorée)
Evolution de l’erreur quadratique moyenne (MSE)
en fonction de nombres de neurones de la couche
cachée.
35
Apprentissage du RNA (version améliorée)
 Une deuxième amélioration :
On augmente la taille de la base de données
d’apprentissage en introduisant des variantes Gras et
italique des polices de caractères.
 La Base de données est triplé.
36
Apprentissage du RNA (version améliorée)
Evolution de l’erreur quadratique moyenne (MSE)
en fonction de nombres de neurones de la couche
cachée.
SITA'08 systémes intélligent : théories et applications
37
Conclusions et perspectives
 Le RNA donne un bon rendement même avec peu de
données .
 La recommandation en pratique est d’avoir beaucoup
plus de données que de connexions dans le réseaux.
Dans notre cas :
connexions données rapport
14535 3900 0.2
3916 10700 2.7
Conclusions et perspectives
Perspectives de ce travail :
 Augmentation de la BD d’apprentissage :
 Plus de polices de caractéres.
 Introduction des modèles d’apprentissage bruités.
 Chiffres, ponctuation..
 Implimentation du réseau dans un systéme ROC.
DESA / CPI juillet 2008 38
MERCI
39

Contenu connexe

Similaire à réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe

TP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdfTP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdfSafaeElOmari
 
Poly reseau transparents_ppt
Poly reseau transparents_pptPoly reseau transparents_ppt
Poly reseau transparents_pptLily Babou
 
Les réseaux de neurones
Les réseaux de neuronesLes réseaux de neurones
Les réseaux de neuronesMariam Amchayd
 
International Journal of Engineering Research and Development (IJERD)
International Journal of Engineering Research and Development (IJERD)International Journal of Engineering Research and Development (IJERD)
International Journal of Engineering Research and Development (IJERD)IJERD Editor
 
Cours python avancé
Cours python avancéCours python avancé
Cours python avancépierrepo
 
intégration du Tifinaghe dans un Ocr OpenSource
intégration du Tifinaghe dans un Ocr OpenSourceintégration du Tifinaghe dans un Ocr OpenSource
intégration du Tifinaghe dans un Ocr OpenSourceYoussef Ouguengay
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docxkhalil Ismail
 
Cours Benhabiles TMS320.pdf
Cours Benhabiles TMS320.pdfCours Benhabiles TMS320.pdf
Cours Benhabiles TMS320.pdfHouBou3
 
Cours signaux et systemes
Cours signaux et systemesCours signaux et systemes
Cours signaux et systemesFoulah Mustapha
 
La reconnaissance des gestes
La reconnaissance des gestesLa reconnaissance des gestes
La reconnaissance des gestesLoghin Dumitru
 
pfe mehdi benamor
pfe mehdi benamorpfe mehdi benamor
pfe mehdi benamorguest719b0b
 
Vhdl cours
Vhdl coursVhdl cours
Vhdl courssgdaim
 
La complexité des algorithmes récursives Géométrie algorithmique
La complexité des algorithmes récursivesGéométrie algorithmiqueLa complexité des algorithmes récursivesGéométrie algorithmique
La complexité des algorithmes récursives Géométrie algorithmiqueHajer Trabelsi
 
Jouer avec des analyseurs syntaxiques
Jouer avec des analyseurs syntaxiquesJouer avec des analyseurs syntaxiques
Jouer avec des analyseurs syntaxiquesEric De la Clergerie
 
L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...
L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...
L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...Aurélia Rostaing
 
64378311-Traitement-Du-Signal.ppt
64378311-Traitement-Du-Signal.ppt64378311-Traitement-Du-Signal.ppt
64378311-Traitement-Du-Signal.pptdocteurgyneco1
 

Similaire à réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe (20)

TP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdfTP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdf
 
Poly reseau transparents_ppt
Poly reseau transparents_pptPoly reseau transparents_ppt
Poly reseau transparents_ppt
 
Les réseaux de neurones
Les réseaux de neuronesLes réseaux de neurones
Les réseaux de neurones
 
International Journal of Engineering Research and Development (IJERD)
International Journal of Engineering Research and Development (IJERD)International Journal of Engineering Research and Development (IJERD)
International Journal of Engineering Research and Development (IJERD)
 
Rapport
RapportRapport
Rapport
 
Cours python avancé
Cours python avancéCours python avancé
Cours python avancé
 
intégration du Tifinaghe dans un Ocr OpenSource
intégration du Tifinaghe dans un Ocr OpenSourceintégration du Tifinaghe dans un Ocr OpenSource
intégration du Tifinaghe dans un Ocr OpenSource
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docx
 
Cours Benhabiles TMS320.pdf
Cours Benhabiles TMS320.pdfCours Benhabiles TMS320.pdf
Cours Benhabiles TMS320.pdf
 
Cours signaux et systemes
Cours signaux et systemesCours signaux et systemes
Cours signaux et systemes
 
Réseaux de neurones
Réseaux de neurones Réseaux de neurones
Réseaux de neurones
 
La reconnaissance des gestes
La reconnaissance des gestesLa reconnaissance des gestes
La reconnaissance des gestes
 
pfe mehdi benamor
pfe mehdi benamorpfe mehdi benamor
pfe mehdi benamor
 
pfe benamor
pfe benamorpfe benamor
pfe benamor
 
Vhdl cours
Vhdl coursVhdl cours
Vhdl cours
 
La complexité des algorithmes récursives Géométrie algorithmique
La complexité des algorithmes récursivesGéométrie algorithmiqueLa complexité des algorithmes récursivesGéométrie algorithmique
La complexité des algorithmes récursives Géométrie algorithmique
 
Jouer avec des analyseurs syntaxiques
Jouer avec des analyseurs syntaxiquesJouer avec des analyseurs syntaxiques
Jouer avec des analyseurs syntaxiques
 
L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...
L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...
L'intelligence artificielle appliquée aux Archives : LectAuRep (Lecture autom...
 
Coursmp
CoursmpCoursmp
Coursmp
 
64378311-Traitement-Du-Signal.ppt
64378311-Traitement-Du-Signal.ppt64378311-Traitement-Du-Signal.ppt
64378311-Traitement-Du-Signal.ppt
 

Plus de Youssef Ouguengay

Le Tifinaghe face au défi technologique
Le Tifinaghe face au défi technologiqueLe Tifinaghe face au défi technologique
Le Tifinaghe face au défi technologiqueYoussef Ouguengay
 
Création des ressources amazighes en Tifinaghe
Création des ressources amazighes en TifinagheCréation des ressources amazighes en Tifinaghe
Création des ressources amazighes en TifinagheYoussef Ouguengay
 
La graphie Tifinaghe : parcours et perspectives d'informatisation
La graphie Tifinaghe : parcours et perspectives d'informatisationLa graphie Tifinaghe : parcours et perspectives d'informatisation
La graphie Tifinaghe : parcours et perspectives d'informatisationYoussef Ouguengay
 
Atelier sur l'amazighe et les NTIC
Atelier sur l'amazighe et les NTICAtelier sur l'amazighe et les NTIC
Atelier sur l'amazighe et les NTICYoussef Ouguengay
 
L'amazighe à l'ère des tablettes
L'amazighe à l'ère des tablettesL'amazighe à l'ère des tablettes
L'amazighe à l'ère des tablettesYoussef Ouguengay
 
contexte de l'amazighe dans la normalisation internationale
contexte de l'amazighe dans la normalisation internationalecontexte de l'amazighe dans la normalisation internationale
contexte de l'amazighe dans la normalisation internationaleYoussef Ouguengay
 
Le Tifinaghe et les nouvelles technologies au service du document numérique a...
Le Tifinaghe et les nouvelles technologies au service du document numérique a...Le Tifinaghe et les nouvelles technologies au service du document numérique a...
Le Tifinaghe et les nouvelles technologies au service du document numérique a...Youssef Ouguengay
 

Plus de Youssef Ouguengay (7)

Le Tifinaghe face au défi technologique
Le Tifinaghe face au défi technologiqueLe Tifinaghe face au défi technologique
Le Tifinaghe face au défi technologique
 
Création des ressources amazighes en Tifinaghe
Création des ressources amazighes en TifinagheCréation des ressources amazighes en Tifinaghe
Création des ressources amazighes en Tifinaghe
 
La graphie Tifinaghe : parcours et perspectives d'informatisation
La graphie Tifinaghe : parcours et perspectives d'informatisationLa graphie Tifinaghe : parcours et perspectives d'informatisation
La graphie Tifinaghe : parcours et perspectives d'informatisation
 
Atelier sur l'amazighe et les NTIC
Atelier sur l'amazighe et les NTICAtelier sur l'amazighe et les NTIC
Atelier sur l'amazighe et les NTIC
 
L'amazighe à l'ère des tablettes
L'amazighe à l'ère des tablettesL'amazighe à l'ère des tablettes
L'amazighe à l'ère des tablettes
 
contexte de l'amazighe dans la normalisation internationale
contexte de l'amazighe dans la normalisation internationalecontexte de l'amazighe dans la normalisation internationale
contexte de l'amazighe dans la normalisation internationale
 
Le Tifinaghe et les nouvelles technologies au service du document numérique a...
Le Tifinaghe et les nouvelles technologies au service du document numérique a...Le Tifinaghe et les nouvelles technologies au service du document numérique a...
Le Tifinaghe et les nouvelles technologies au service du document numérique a...
 

réseaux de neurones artificielles pour la reconnaissance optique du Tifinaghe

  • 1. 1 La Reconnaissance Optique des Caractères Application á la Graphie Amazighe Présenté par AIT OUGUENGAY Youssef Encadré par : Mr. Taalabi Ecole Mohammadia d’Ingénieurs DESA / CPI 2008
  • 2. 2 PLAN DESA / CPI juillet 2008 2. La graphie Amazighe 3. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Apprentissage du RNA 1. Introduction.
  • 3. 3 Motivations  Travaux d’aménagement de la langue amazighe (codage Unicode/ISO10646 (2002), standardisation de l’amazighe,..)  Intégration de la langue amazighe dans les NTIC.  Premier travail d’OCR pour l’amazighe (travaux en cours)  Utilisation des réseaux de neurones:  Outils classiques dans les problèmes de classification.  Simplification de la modélisation des problèmes statiques non linéaires.  Efficaces dans le cas d’un nombre important de variables. DESA
  • 4. Introduction DESA / CPI juillet 2008 4 Acquisition Segmentation Apprentissage Post-traitement Prétraitement Extraction des Caractéristiques Classification Modèles Les composants d’un système de ROC :
  • 5. 5 PLAN DESA / CPI juillet 2008 3. La graphie Amazighe 2. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Entraînement du RNA 1. Introduction.
  • 6. Cahier des charges et démarche  Objectif : La classification des caractères amazighes  Technologie utilisée :  les polices de caractéres amazighes éxistants pour la constitution de la base de données d’apprentissage  réseaux de neurones artificiels pour la classification. DESA / CPI juillet 2008 6
  • 7.  Démarche séparée en 3 étapes :  présentation des formats de caractères en un format plus approprié à l’aide des polices de caractéres.  Extraction des caractéristiques  Simulation et entraînement du réseau de neurones artificiels. DESA / CPI juillet 2008 7 Cahier des charges et démarche
  • 8. 8 PLAN DESA / CPI juillet 2008 3. La graphie Amazighe 2. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Apprentissage du RNA 1. Introduction.
  • 9. 9 La graphie amazighe  Alphabet «Tifinaghe» = système d’écriture amazighe.  Plusieurs variantes existent (Afrique de nord, Sahara, îles canaries)  Origine = alphabet libyque et saharien depuis 6éme siècle avant l’ère chrétienne  Aucun changement de formes à travers l’histoire  55 caractères sont retenu (Unicode)  Tifinaghe-IRCAM, néo-tifinaghe, touaregs,..  33 caractère pour l’alphabet marocaine retenue : Tifinaghe-IRCAM. DESA / CPI juillet 2008
  • 10. 10 La graphie amazighe DESA / CPI juillet 2008
  • 11. 11 La graphie amazighe • Formes géométriques simples • Caractères à plusieurs composantes connexes SITA'08 systémes intélligent : théories et applications
  • 12. 12 PLAN DESA / CPI juillet 2008 3. La graphie Amazighe 2. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Entraînement du RNA 1. Introduction.
  • 13. 13 Création des modèles d’apprentissage • 12 polices de caractères • Tailles entre : 10 points – 28 points DESA / CPI 2008
  • 14. 14 Création des modèles d’apprentissage • Images de départ = Tableaux contenant un caractères par cellule • Création de la base de données brut  Taille réelle (300 dpi) Cadrage minimal de chaque caractère  Arborescence de stockage bien définis (../caract/font_taille.png) DESA / CPI 2008
  • 15. 15 Création des modèles d’apprentissage Deux types de normalisation des patterns : Tailles réelles des patterns + Remplissage par des pixels éteints. Hmax = 105 pixels Lmax = 125 pixel  1ére normalisation : DESA / CPI 2008
  • 16. 16 Création des modèles d’apprentissage Tailles normalisées vers une valeur normalisé calculée (24*24 pixels). Hnorm = 24 pixels Lnorm = 24 pixels  2éme normalisation :
  • 17. 17 PLAN DESA / CPI juillet 2008 3. La graphie Amazighe 2. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Entraînement du RNA 1. Introduction.
  • 18. 18 Extraction des caractéristiques  Caractéristiques à extraire : variables d’entrée  Centre de gravité du caractère  Densité (pixels allumés (=Aire) / la surface totale de l’image)
  • 19. Extraction des caractéristiques DESA / CPI juillet 2008 19  projection verticale de l’image du caractère.  Projection horizontale de l’image de caractère
  • 20. Extraction des caractéristiques DESA / CPI juillet 2008 20  Périmètre du caractère par rapport au périmètre de l’image. Π Compacité = ((périmètre)²/(4 Aire))
  • 21. Extraction des caractéristiques DESA / CPI juillet 2008 21  Moments centrales d’ordre 2 X et y sont les centres de masse de caractère.
  • 22. 22 PLAN DESA / CPI juillet 2008 3. La graphie Amazighe 2. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Apprentissage du RNA 1. Introduction.
  • 23. Le réseau de neurones  Un RNA est un système d’équation de N variables.  Inconnus : les poids des connections entre les nœuds  Architecture : multicouches à connexion complète.  chaque nœud fait un calcul simple selon une fonction seuil d’activation. 23 sortie entrée Variables d’entrée couche cachée
  • 24. Le réseau de neurones  Cas du reconnaissance des formes  Sorties bien connus  Apprentissage supervisé  Entrées = caractéristiques extraites des caractères 24SITA'08 systémes intélligent : théories et applications
  • 25. 25 Le réseau de neurones Un Perceptron multicouche à une seule couche cachée Couche d’entrée C.Sortie  33 neurones = 33 caractères SITA'08 systémes intélligent : théories et applications
  • 26. 26 Le réseau de neurones  Caractéristiques extraits = variables d’entrée centre de gravité du caractère (2 neurones) Moments centrales d’ordre 2. (3 neurones) projection verticale de l’image du caractère. ( L neurones) Projection horizontale de l’image de caractère ( H neurones ) Périmètre du caractère par rapport au périmètre de l’image. (1 neurones) Densité (pixels allumés (Aire) / la surface totale de l’image) (1 neurone ) ΠCompacité ((périmètre) ²/ (4 Aire)) ( 1 neurone ) SITA'08 systémes intélligent : théories et applications La couche d’entrée
  • 27. Le réseau de neurones La couche de sortie  33 neurones = 33 cractéres La couche cachée :  nbr de neurones par essai et erreur + règles pratiques (littérature)  Nombre indicatif retenu = (n(c.entrée)+n(c.sortie)) / 2 27
  • 28. 28 PLAN DESA / CPI juillet 2008 3. La graphie Amazighe 2. Cahier des charges et démarche. 4. Création des modèles d’apprentissage 5. Extraction des caractéristiques 6. Le réseaux de neurones artificiels (RNA) 7. Apprentissage du RNA 1. Introduction.
  • 29. 29 Apprentissage du RNA BD des modèles  Logiciel de simulation = JavaNNS  Base de données des modèles est un fichier textes formaté.  Base de données devisée en deux partie: 1. Fichier d’entraînement (Tailles paires des patterns) 1. Fichier de validation (test) (Tailles impaires patterns) • Constitution de la base de données d’entraînement :
  • 30. 30 Apprentissage du RNA (premiers résultats)  1ére normalisation des patterns (tailles réelles des caract..)  Configuration du réseau de neurones :  c.e : 138 neurones  c.c : 85 neurones  c.s : 33 neurones  Base de données d’apprentissage : ~ 3900 Patterns et 3500 pattern pour le test  Inconnus : ~14535 connexions à calculer ((138*85)+(85*33)).
  • 31. 31 Apprentissage du RNA (premiers résultats) entraînement validation Évolution de l’erreur quadratique moyenne (MSE)
  • 32. Apprentissage du RNA (Amélioration du RNA)  Pour améliorer les résultats du simulation : On effectue une première amélioration :  On utilise la deuxième normalisation des images des caractères ( vers une taille de 24*24 pixels) 32
  • 33. Apprentissage du RNA (version améliorée)  Normalisation des patterns.  Configuration du réseau de neurones  c.e : 56 neurones  c.c : 44 neurones  c.s : 33 neurones  Avec une base de données triplée : 10700 d’entrainement et 10500 pour le test.  Inconnus : ~3916 connexions à déterminer. 33
  • 34. 34 Apprentissage du RNA (version améliorée) Evolution de l’erreur quadratique moyenne (MSE) en fonction de nombres de neurones de la couche cachée.
  • 35. 35 Apprentissage du RNA (version améliorée)  Une deuxième amélioration : On augmente la taille de la base de données d’apprentissage en introduisant des variantes Gras et italique des polices de caractères.  La Base de données est triplé.
  • 36. 36 Apprentissage du RNA (version améliorée) Evolution de l’erreur quadratique moyenne (MSE) en fonction de nombres de neurones de la couche cachée. SITA'08 systémes intélligent : théories et applications
  • 37. 37 Conclusions et perspectives  Le RNA donne un bon rendement même avec peu de données .  La recommandation en pratique est d’avoir beaucoup plus de données que de connexions dans le réseaux. Dans notre cas : connexions données rapport 14535 3900 0.2 3916 10700 2.7
  • 38. Conclusions et perspectives Perspectives de ce travail :  Augmentation de la BD d’apprentissage :  Plus de polices de caractéres.  Introduction des modèles d’apprentissage bruités.  Chiffres, ponctuation..  Implimentation du réseau dans un systéme ROC. DESA / CPI juillet 2008 38