Expérience professionnelle
2023 Senior Data Engineer , JCDECAUX.
• Gestion efficace des projets Scala en automatisant les tâches de gestion de dépendances, de compilation
et de déploiement avec Scala/Spark sur Maven
• Utilisation de Git pour la gestion des versions
• Transformations, analyses, et ingestion des données avec jobs Spark sur EMR
• Mis en place un pipeline de CI/CD pour automatiser le déploiement des pipelines d’ingestion de données
Environnement technique : Python, Spark, Scala,maven, SQL, AWS , Airflow, Git, Docker, CI/CD ,
IntelliJ
2021 Data scientist, ASKLOCALA.
• Proposition de solutions innovantes en utilisant des modèles de machine learning qui respectent les contraintes industrielles, en particulier pour la gestion de gros volumes de données
• Descriptions et mis en place de protocoles d’évaluation correspondants
• Documentation et communication des réalisations, en soignant particulièrement l’accessibilité de la présentation à l’audience
2018 Data scientist, CESP.
• Analyse et évaluation des dispositifs de mesure d’audience ( qualité des données, vérification des hypothèses, choix et méthodes d’estimation des paramètres et définition des indicateurs de qualité)
• Formulations mathématiques de problèmes concrets (la fusion de la presse papier et la presse digitale)
• Modélisation de mesures d’audience et tests de modèles alternatifs (fusion, hybridation, validation croisée)
• Formulation de recommandations techniques et suivi de leur mise en oeuvre
• Présentation aux Collègues thématiques et au Comité Scientifique du CESP
• Veille scientifique et participation à des conférences
2018
Stage de fin d’étude(6 mois), Publicis Sapient (Paris), Le Deep D earning appliqué à la correction orthographique(Tensorflow, GPU, Docker, Seq2Seq, LDA, GCP, d3js).
• Complémenter une étude pré-campagne sur le lancement de l’Alaskan de Renault dans 3 pays en 3 langues (UK,Spanish et Germand) pour mieux connaitre les cibles et savoir quelles sont les caractéristiques dont ils parlent (LDA, worcloud, bubble char, d3js, tableau, sklearn,taggage)
• Analyser les différentes recherches effectuées sur la FAQ de EDF en cherchant les grands thèmes de recherches, visualisation des résultats (LDA, worcloud, bubble char, d3js, tableau, sklearn,taggage)
2017
Stage d’application (4 mois), Orange-Lannion , Détection de fraude via les outliers (scikit-learn, Série temporelle, kmean, triclustering, khiops).
2015
Consultant junior (10 mois), Agence National de la Statistique et de la Démographie, Dakar (Cspro, Arcgis,html, css,javascript,Mysql).