1. Dossier de compétences | Beezen
www.beezen.fr
163/165 avenue Charles de Gaulle – 92200 Neuilly-sur-Seine – Téléphone : 01 41 43 00 00
Société par Actions Simplifiée au capital de 100.000 € - SIREN 502 612 914 RCS Nanterre
DOSSIER DE COMPETENCES
Data Engineer PYTHON
Mokhtar
COMPETENCES
Bigdata: Elasticsearch, Logstash, Kibana, Hadoop, Spark, Hive, Kafka, Hortonworks, Ambari,
Hue, ScikitLearn, Pandas, numpy.
Informatique Décisionelle: MSBI (SSIS, SSAS, SSRS), Tableau Software.
Web: HTML5, php, javascript, CSS.
SGBD & OS : MySQL, Sql Server, Ubuntu, CentOS.
Modélisation : Power AMC, UML.
Langages de programmation : Python, java, C#, SQL, R, Bash, XML.
Gestion de projets : Scrum(Agile), CrispDM.
REFERENCES PROJETS
Depuis Fevrier 2017 : Datavora
De Octobre 2017 / ce jour
Data Engineer Python
Elaboration des études et analyses sur la data de Datavora et préparation de POC (proof of
concept) client. Le travail est en collaboration avec l’équipe développement(Crawl) et
l’équipe sales et marketing.
Pour la partie préparation de POC, ces derniers sont élaborés selon le client, le secteur
d’activité et les spécificités de son business.
Pour la partie études et analyses, le travail est réalisé en collaboration avec le Marketing
manager afin de diffuser des études sous forme de visualisations sur les évènements
importants influençant le e-commerce (exemple Noël ou Black Friday) ou bien en réalisant
des cases study sur l’impact de la data fournit sur l’activité des clients.
• Etude du business des clients ou du marché et définition des besoins.
• Consolidation de la data pour répondre aux besoins : développement de scripts
scrappy pour sites additionnels, exécution de taches CRON et leur indexation dans
Elasticsearch.
• Ingestion de la data des différents index Elasticsearch disponibles en utilisant logstash.
• Nettoyage et préparation de la donnée en utilisant Python et Pandas.
2. Dossier de compétences | Beezen
www.beezen.fr
163/165 avenue Charles de Gaulle – 92200 Neuilly-sur-Seine – Téléphone : 01 41 43 00 00
Société par Actions Simplifiée au capital de 100.000 € - SIREN 502 612 914 RCS Nanterre
• Calcul d’indicateur et de métriques en utilisant Python.
• Préparation des dashboard clients ou des visualisations des évènements en utilisant
Tableau software ou bien Kibana.
• Réalisation des cases study en utilisant Canvas.
Environment technique: Elasticsearch, Logstash, Kibana, Tableau Software, Python, Pandas,
Canvas
De Fevrier 2017 / Sep 2017
Data Engineer / Machine learning.
Préparation de POC pour un des clients de Datavora dans le secteur du reconditionnement
des téléphones. Crisp-DM est la méthodologie utilisée pour ce projet
• Analyse du Business du client (Volpy) et définition des Kpi’s utiles à son activité.
• Développent des Kpi en ayant recourt au Machine learning (classification,
segmentation).
• Installation d’Elasticsearch et préparation des nouveaux index.
• Intégration des kpi’s dans les nouveaux dashboard du client.
Environment technique: Python, Scikit-learn, Pandas, Numpy, Elasticsearch.
Juillet à Aout 2016 : Discovery Datasoft
Ingénieur Business Intelligence.
Réalisation d'un projet BI avec la suite Microsoft BI pour exploiter les données issue de l'ERP
Sage et les restituer en rapports.
• Analyse des données disponibles sur l’ERP et définition des études à rajouter.
• Création des paquages SSIS pour l’extraction des donnés de Sql Server 2012 (base de
données de l’ERP), la préparation des données et le stockage dans le
datawarehouse.
• Création des cubes OLAP sous SSAS et développement des Kpi’s.
• Préparation des nouveaux rapports complémentaires sous SSRS.
Environment technique: Microsoft BI (SSIS, SSAS, SSRS), Sql Server 2012
Janvier à Mai 2016 : ESPRIT (Tunis, Tunisie)
Ingénieur Business Intelligence et Big Data.
Elaboration d’une solution décisionnelle comportant une partie BI et une partie Big Data
avec la suite Microsoft BI et Hadoop pour exploiter les données de l’inventaire d’un hôtel à
Hammamet et le flux Twitter de l’hôtel. SCRUM est la méthodologie agile utilisée pour ce
projet.
3. Dossier de compétences | Beezen
www.beezen.fr
163/165 avenue Charles de Gaulle – 92200 Neuilly-sur-Seine – Téléphone : 01 41 43 00 00
Société par Actions Simplifiée au capital de 100.000 € - SIREN 502 612 914 RCS Nanterre
• Analyse des besoins fonctionnels émanant du manager de l’hôtel.
• Création des paquages SSIS pour l’extraction des donnés de la base de données
Oracle proposé par le client, la préparation des données et le stockage dans le
datawarehouse.
• Création des cubes OLAP sous SSAS et création des hiérarchies.
• Préparation des tableaux de bord pour le suivi des Magasins de l’hôtel sous SSRS.
• Extraction des flux Twitter avec Flume et leur analyse avec Hive.
• Visualisation des tweet avec Spark graphX.
Environment technique: Microsoft BI (SSIS, SSAS, SSRS), Hadoop, Hive, Flume, Spark.
FORMATION
Février 2019- The ultimate hands-on Hadoop – Tame your Big Data, Udemy
(https://www.udemy.com/certificate/UC-9WYKPTE8/)
Octobre 2018- Master Course in Tableau 10 & 2018 for Business intelligence, Udemy
(https://www.udemy.com/certificate/UC-X92G5DFK/)
2014 - 2017- Diplôme d’Ingénieur en informatique, Option ERP / BI. Ecole Supérieure Privée
d’ingénierie et Technologies (ESPRIT) Tunis, Tunisie.
2013 - 2017- Bachelor of International Business Administration. Sup de Co. Montpellier Business
School, (à distance depuis Tunis)
2010 - 2013- Préparatoire intégré, Option MPI (Mathématiques – Physique – Informatique).
Institut national des sciences appliquées et de technologie (INSAT), Tunisie
2010- Baccalauréat Scientifique (Mathématiques)