• Proposition de solutions innovantes en utilisant des modèles de machine learning qui respectent les contraintes industrielles, en particulier pour la gestion de gros volumes de données
• Descriptions et mis en place de protocoles d’évaluation correspondants
• Documentation et communication des réalisations, en soignant particulièrement l’accessibilité de la présentation à l’audience
• Analyse et évaluation des dispositifs de mesure d’audience ( qualité des données, vérification des hypothèses, choix et méthodes d’estimation des paramètres et définition des indicateurs de qualité)
• Formulations mathématiques de problèmes concrets (la fusion de la presse papier et la presse digitale)
• Modélisation de mesures d’audience et tests de modèles alternatifs (fusion, hybridation, validation croisée)
• Formulation de recommandations techniques et suivi de leur mise en oeuvre
• Présentation aux Collègues thématiques et au Comité Scientifique du CESP
• Veille scientifique et participation à des conférences
D earning appliqué à la correction orthographique(Tensorflow, GPU, Docker, Seq2Seq, LDA, GCP, d3js).
• Complémenter une étude pré-campagne sur le lancement de l’Alaskan de Renault dans 3 pays en 3 langues (UK,Spanish et Germand) pour mieux connaitre les cibles et savoir quelles sont les caractéristiques dont ils parlent (LDA, worcloud, bubble char, d3js, tableau, sklearn,taggage)
• Analyser les différentes recherches effectuées sur la FAQ de EDF en cherchant les grands thèmes de recherches, visualisation des résultats (LDA, worcloud, bubble char, d3js, tableau, sklearn,taggage)
Orange-Lannion , Détection de fraude via les outliers (scikit-learn, Série temporelle, kmean, triclustering, khiops).