PRESENTATION OF FIDELISATION

71 vues

Publié le

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
71
Sur SlideShare
0
Issues des intégrations
0
Intégrations
4
Actions
Partages
0
Téléchargements
3
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Bonjour chère audience , chère membre de jury , j’ai l’honneur de soumettre à votre appréciation le résultat de notre projet de fin d’année effectué au sein de SOFT CENTRE et intitulé Projet de fidélisation
    . Le projet a été réalisé par moi même ISSAM plus 2 autres personnes , sous l’encadrement de El Mourabit Abdelwahad.




    /* et sera jugé par Vous Monsieur Abdellatif EL FAKER
    ….

  • 1-- Dans le cadre de notre première année d’études, à l’ ENSIAS, Nous sommes tenus d’effectuer un stage de fin d’année pendant l’été. L’organisme d’accueil est Soft Centre, un centre de recherche et développement en génie logiciel, dans lequel j’ai effectué un stage de 2 mois.

    2-- Mon stage effectué chez la société SOFTCENTER à Rabat, ayant comme but la réalisation d’une application de fidélisation (OCR, data mining, Machine Learning, Data Visualisation)

    3– Cela m’as permis de Mettre en pratique les prérequis théoriques

    4-- Les stratégies de fidélisation sont multiples mais elles nécessitent des moyens de collecte, de stockage et d'exploitation des informations sur la clientèle. L'usage des TIC et des bases de données favorise ces stratégies.

    5-- Le contexte économique et commercial actuel pousse les entreprises à faire des arbitrages entre conquête et fidélisation de clientèle afin de dominer sur le marché concurrentielle
  • Cette présentation suivra le schéma suivant:
    nous commencerons par Présentation de l’organisme d’accueil ,
    puis nous entamerons à la Présentation de la mission de stage
    Après nous présenterons Le comportement de l’OCR
    avant d’aborder la phase de génération
    Nous présenterons par la Segmentation et correction
    Puis la phase du Datamining
    Et enfin Conclusion et perspectives


    Commençant par vous décrire SOFT CENTER

  • Comme vous avez déjà vu avec Abdelghafour et Ferdaouissi ,,,,,,,,,,
  • A TRAVERS LES COMPETENCES DE CES GENS , IL PEUVENT GAGNER DE BENEFICES
  • Nous passerons maintenant à La phase de la présentation de la mission de stage

  • Un ticket de caisse est un reçu que les commerces de détail remettent à chacun de leurs clients

    ------Ce ticket vaut de l’or car chaque information inscrite sur cette fine bande de papier est
    --un avantage concurrentiel décisif pour les géants de la distribution.


    Comment ? C’est en utilisons la science de données est l'extraction de connaissance de données, c’est la discipline qui s'appuie sur des outils mathématiques, de statistiques et d'informatique.

  • Ma mission étais l’ L’alimentation des autres équipes par les entrées de traitement
    La phase de la génération a un rôle primordiale dans le présent projet,

    Comment ?
    lancement -- > on risque d’attendre un moment avant d’avoir assez de données via OCR

    GENERATION  simuler les comportements d’achat en vue d’améliorer le traitement du datamining. Et la génération des tickets textes bruité permet de diagnostiquer les systemes de la segmentation et de la correction,
  • Passons mtn au comportement de l’OCR
  • La reconnaissance optique de caractères (ROC, en anglais optical character recognition : OCR),


    Celui-ci permet de récupérer le texte dans l'image et de le sauvegarder dans un fichier, il sera exploité dans un traitement de texte , et stocké dans une base de données exploitable pour l’extraction de connaissances,
  • Or , A cause des images illisibles ou inclinée, l’output de l’OCR peut être affecté et incorrecte,

    La condition nécessaire de l’OCR est que l’image pris soit plus claire tout en prendre en considération la luminosité et le contraste.

    Il nous faut Comprendre le comportement de l’OCR pour pouvoir corriger les erreurs textes qui peuvent se produire.
  • Passant mtn à la phase de génération
  • Pour générer une base de donnée, qui sera exploitable durant tout le processus du projet, il fallait faire :

    une étude profonde pour comprendre la base commune entre tous les supers marché marocaines, le TVA des produits, les noms des produits s’ils changent d’un centre de vente à un autre, les catégories…

    Parmi les référence qu’on se basait ; les tickets réels des centres commerciales à savoir : MARJANE, CARREFOUR, BIM, ACIMA.
  • Exploitation de :
    Données sur internet : webscraping
    base de données sql
    Extraction des données depuis des excels

    En vue de produire une base de données géante

    Par exemple :
    Ajouter les différents centres de distribution de produits marocaine : il y a 174 centres différents au Maroc pour les quatre : MARJANE, BIM, CARREFOUR et ACIMA.

    Enfin faire un nettoyage pour obtenir une base de donnés raffinées que l’équipe du datamining peuvent exploiter.
  • Les interfaces graphiques ne sont pas demandé , c que de la génération via des fonctions
  • Pour simuler les sorties des tickets photographes par l’OCR, il faut tout d’abord générer les tickets textes en format (MARJANE, CARREFOUR, BIM, ACIMA) en se basant sur la base de données déjà conçu tout en bien paramétrant les tickets qu’on souhaite générer
  • Malgré les IHM n’étaient pas demandé durant cette phase, mais pour nous faciliter la tâche, pour mieux comprendre la génération et pour acquérir plus de technologies ; j’ai pu à réaliser quelques interfaces graphiques en utilisant SWING java.
    Il faut respecter le fait que chaque centre de distribution marocain dispose de son propre format de tickets, ainsi la génération doit être bien paramétré, sois pour la génération d’un seul ou plusieurs tickets
    On choisissant le distributeur (saler) ; la 2éme liste sera remplie par les différents centres (store) de ce distributeur. Le 3éme champ pour la date du ticket.

    --En cliquant sur ‘NEXT ‘, l’interface du choix des catégories suivante s’apparaitra :
  • Pour les catégories en cliquant sur "+" on obtiendra une nouvelles liste par les catégories et la liste à droite se rempli par les produits suivant cette catégorie.
    En cliquant sur ‘Generate ‘, une petite interface s’affiche afin de préciser le nombre de tickets qu’on souhaite générer avec ce paramétrage.
  • L’étude sur le calcul des TVA était une nécessité, pour que l’imitation soit parfaite, le TVA de chaque produit se calcule selon sa. Enfin il faut calculer le total des tickets (HT, TTC).
  • TJR LA GENERATION BASIQUE SONT DES FONCTIONS ::

    Le paramétrage de la génération se constitue à désigner :  Le nom du centre (MARJANE, BIM, CARREFOUR, ACIMA)
     Le nombre de tickets à générer
     Date début et date fin de l’achat des tickets
     Probabilité que les tickets ne contient pas une tête, ne contient pas une queue, ne contient ni tète ni queue.
     Choisir la destination des tickets : la base de données ou des fichiers .txt
     Le nombre de catégorie minimum dans les tickets
     Le nombre de catégorie maximum dans les tickets

     Le nombre minimum des produits dans chaque catégorie
     Le nombre maximum des produits dans chaque catégorie
  • Transducteur de la génération des textes erronés La matrice de confusion nous donne les probabilités de chaque caractère pour qu’il se transforme en un autre caractère. Pour réaliser la tâche nous avons utilisé des transducteurs qui prennent en entré un texte brute, en prend en considération la matrice de confusion de l’OCR, et nous génère le texte erroné. Celui-ci nous permet simuler le comportement de l’OCR.

    D abord on peut bien générer tant qu on veux des tickets propres ou imporopres !  DIAGNOSTIC

  • Cette phase permet de tester si les gens de notre équipe du datamining sont capables d’extraire les informations cachées. Ainsi on garantit la crédibilité, lors de la mise en œuvre de l’application.

    Il fallait alimenter la base de données par des comportements d’achat cachés.
  • Les fonctions permettant d’implémenter des comportements
    Corrélation entre deux :
    se fait par une simple fonction qui prend comme paramètre : les deux noms de produits qu’on souhaite corréler, date de début et date de fin constitue la période qu’on veut appliquer cette corrélation et un réel entre -1 et 1 qui désigne la relation de corrélation.
    Produits préféré par une certaine profession

    L'analyse du panier de marché (MBA
    Produits plus vendus dans une saison
  • Il y avait pleine d’outils
  • Segmentation et correction étais la phase d’un autre membre de stage , Or on se collabore pour les premières stratégies à faire ce qui m’as permis de bien comprendre ce processus
  • SEGMENTATION :

    --Les erreurs produites par l’OCR déforment le ticket, cela rend le langage non régulier pour reconnaitre le type de chaque ligne. Donc il faut être capable de segmenter les lignes par une méthode robuste et susceptible aux erreurs.

    --Pour extraire les informations nécessaires du ticket (date, produits, adresse...), il est convenable d'utiliser des techniques du machine Learning, --Parmi les algorithmes qui ont été proposé : les réseaux de neurones artificiels ou SVM sur Sckitlearn(python). Le choix a été fixé sur le SVM.

    -- ici les tickets bruité sont classé ,
    -- donc on peut faire la tockénisation pour remplir notre fichier JSON par un ticket bruité mais bien segmenté ,

    CORRECTION

    -- Se servir des outils qui font la tâche de manière plus optimisé notamment Elasticsearch : un moteur de recherche propriétaire En cas de réussite : c bon remplir la base de données
    Sinon -- Utiliser un genre de distance de Levenshtein amélioré ; qui tient compte des erreurs de l'OCR, qui est une fonction qui prend en paramètre une matrice de confusion, ainsi que les chaines incorectes.

  • En fin
  • Maintenant notre base de données raffinée est prête, donc on doit faire une étude et construire des agrégations de donnée à partir des données brutes,

    -- en utilisant les techniques de datamining, de
    -- reconnaissance de pattern,
    -- de classification, --
    -- de segmentation,
    -- d'arbre de décision,
    -- en utilisant des outils tels que WEKA et R Programming,

    ____> pour but de trouver la corrélation entre pattern et ainsi prendre la stratégie la plus adéquate,

    Cette phase était attribué à un membre qui n’as pas pu d’implémenter les interfaces IHM que les entreprise peuvent consulter ; pour ça il y a des nouveaux stagiaires qui s’occuperont à réaliser ces IHM qui seront le fruit de notre projet
  • Notre projet de fin d’année consistait à participer au développement d'une application de fidélisation

    BILAN :
    La tâche que j’étais en charge de la réaliser, j’ai pu de la rendre automatisée


    EVALUATION :

    TRELLO : SUIVI DU PROJEt
    --Ce stage de deux mois m’a permis d’avoir une richesse pour le travail en équipe, grâce à sa richesse technique et aux nombreuses nouvelles notions rencontrées tel que l’informatique décisionnel et l’étude des systèmes(OCR)

    --Il nous a également offert la possibilité de travailler à distance par des outils dédié à cela à savoir : SLACK, ( GIT )GITLAB , TRELLO…

    Perspectives : --Personnel : la création des IHM pour toute la phase de la génération et d’implémentation des erreurs et des comportements. -- PROJET ENTIER : convertir l’extraction de données vers des pages web exploitable par ceux qui décide leurs stratégie commerciale
  • Merci Pour Votre aimable Attention
  • Bonjour chère audience , chère membre de jury , j’ai l’honneur de soumettre à votre appréciation le résultat de notre projet de fin d’année effectué au sein de SOFT CENTRE et intitulé Application de fidélisation
    . Le projet a été réalisé par moi même ISSAM plus 2 autres personnes , a été supervisé par El Mourabit, Abdelwahad.




    /* et sera jugé par Vous Monsieur Abdellatif EL FAKER
    ….

  • PRESENTATION OF FIDELISATION

    1. 1. Sujet : Projet de fidélisation (OCR, Génération, Correction , Data Visualisation , Data mining) Année universitaire 2015-2016 Soutenance de stage de première année Université Mohammed V Ecole Nationale Supérieure d’Informatique et d’Analyse des Systèmes 1 De 11/07/2016 à 11/09/2016 GHANOUCH Issam EL MOURABIT Abdelwahad Soutenu par : ENCADRÉ par :
    2. 2. 2 • STAGE • ENSIAS• ENSIAS Réaliser un projet de fin d’année : 2 mois • La mission Application de fidélisation • L’entreprise : l'utilisation de savoirs, savoir-faire et savoir-être liés à l’entreprise, • L’informatique décisionnel BIG data , collection et analyse de données • Les stratégies de fidélisation S’approcher aux clients • Gestion de projet Travail en équipe Stage d’été de fin d’année Introduction
    3. 3. Présentation de l’organisme d’accueil Présentation de la mission de stage Le comportement de l’OCR Phase de génération Segmentation et correction Stage d’été de fin d’année Plan Datamining Conclusion et perspectives 3
    4. 4. 4 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Centre R&D SOFTCENTRE SOFTWARE DEVELOPMENT 123 Ressources universitaires Chercheurs Ingénieurs
    5. 5. 5 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Activités de SOFTCENTRE Recherche appliquée & développement logiciel Recherche prospective Centre de services partagés Recherche autofinancée sur des domaines d’excellence
    6. 6. 6 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Mode de fonctionnement Compétences R&D logicielle Chercheurs Ingénieurs Doctorants SOFTCENTRE
    7. 7. 7 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Organigramme Conseil d’administration Direction Comité Projets Comité d’orientation stratégique Laboratoires de recherche
    8. 8. Plan Projet de Fin d’Etudes Présentation de l’organisme d’accueil Présentation de la mission de stage
    9. 9. 9 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Source de données
    10. 10. 10 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion GENERATION L’équipe du datamining L’équipe de la correction d’erreur Et de la segmentation Base de données raffinée Ticket texte Bruité L’alimentation des autres équipes par les entrées de traitement
    11. 11. Plan Projet de Fin d’Etudes Présentation de l’organisme d’accueil Présentation de la mission de stage Le comportement de l’OCR
    12. 12. L’entrée et la sortie de l’OCR 12 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion
    13. 13. Exemples de tickets illisibles 13 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion
    14. 14. Plan Projet de Fin d’Etudes 14 Présentation de l’organisme d’accueil Présentation de la mission de stage Le comportement de l’OCR Phase de génération
    15. 15. SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils Extraction des données utiles depuis un ticket réel
    16. 16. 16 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils Database data Insertion Nettoyage Processus de la collection des données
    17. 17. SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils
    18. 18. 18 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Input de paramétrage Extraction suivant le paramétrage OUTPUT TICKET données Traitement Concept Base de données Ticket propre Ticket bruité Comportements Outils Le processus de la Génération des tickets
    19. 19. 19 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils
    20. 20. 20 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils
    21. 21. 21 Présentation Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils
    22. 22. 22 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils
    23. 23. 23 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion TRANSDUCTEUR TICKET PROPRE TICKET BRUITE MATRICE DE CONFUSION DE L’OCR INPUT INPUT OUPUT Concept Base de données Ticket propre Ticket bruité Comportements Outils
    24. 24. 24 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Choisir le comportement à implémenter STRATEGIE Paramétrage Concept Base de données Ticket propre Ticket bruité Comportements Outils Le processus d’implémentation des comportements
    25. 25. 25 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils
    26. 26. 26 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Concept Base de données Ticket propre Ticket bruité Comportements Outils 26 WampServer POI appache ….
    27. 27. Plan Projet de Fin d’Etudes 27 Présentation de l’organisme d’accueil Présentation de la mission de stage Le comportement de l’OCR Phase de génération Segmentation et correction
    28. 28. Le processus engendrant la Segmentation et la correction SOFT CENTRE Mission OCR Génération Segmentation + Correction Datamining Conclusion Classificateur SVM Ticket bruité classifié Ticket Segmentation structuré Amélioré par OCR Correction Base de donnée propre Input Remplissage Remplissage Ticket bruité non classifié Machine Learning (SVM)
    29. 29. Plan Projet de Fin d’Etudes 29 Présentation de l’organisme d’accueil Présentation de la mission de stage Le comportement de l’OCR Phase de génération Segmentation et correction Datamining
    30. 30. 30 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Extraction Analyse données Processus d’extraction des connaissances Phase de DATAMINING
    31. 31. Présentation de l’organisme d’accueil Présentation de la mission de stage Le comportement de l’OCR Phase de génération Segmentation et correction Stage d’été de fin d’année Introduction Datamining Conclusion et perspectives 31
    32. 32. 32 SOFT CENTRE Mission OCR Génération Segmentation+ Correction Datamining Conclusion Participer au développement d'une application de fidélisation Evaluation Bilan • Personnel : IHM attribué à la génération • Projet entier : l’extraction de données vers des pages web exploitable et manipulable par ceux qui décide leurs stratégie commercial Perspectives • Génération à base d’un module intégré. • Participation à un projet de recherche
    33. 33. Merci pour votre aimable attention 33
    34. 34. Sujet : Projet de fidélisation (OCR, Génération, Correction , Data Visualisation , Data mining) Année universitaire 2015-2016 Soutenance de stage de première année Université Mohammed V Ecole Nationale Supérieure d’Informatique et d’Analyse des Systèmes 34 De 11/07/2016 à 11/09/2016 GHANOUCH Issam EL MOURABIT Abdelwahad Soutenu par : ENCADRÉ par :

    ×