Notre base de 155515 CV vous permet de trouver rapidement un Data scientist Strasbourg freelance. Recevez gratuitement et sous 24h maximum les CV des meileurs intervenants disponibles.
Projet : Détection d’anomalies dans les transactions des trades
▪ Collecter les données de plusieurs sources (csv, Jason, parquet) à partir du datalake (2 milliards de
points fichier)
▪ Explorer les données et mettre en place d’une méthode automatique et efficace de préparation des
données qui optimise les analyses statistiques et qui réduit énormement le temps d’exécution des
algorithmes d’apprentissage automatique
▪ Modélisation et implémentation de 10 algorithmes de clustering pour la détection d’anomalies
▪ Introduction d’une nouvelle mesure de similarité définie par l’utilisateur et choix des meilleurs
hyperparameters par la méthode grid-search
▪ Analyse des résultats de clustering results and filtrage des points ayant une probabilité élevée
d’être une anomalie.
▪ Automatisation des processus précédents (pipe)
▪ Communication avec les métiers au sein de l’entreprise pour valider les outliers qui sont vraiment
des anomalies
▪ Validation du modèle par les métiers et passage en production
▪ Audit de la base de données existante et création d’une nouvelle architecture plus solide en
utilisant MYSQL Workbench;
▪ Extraction, Transformation et Chargement des données vers des outils de visualisation (Tableau
and QlikView) en utilisant Python et Talend (création d’un Data Wharehouse pour automatiser le
processus ETL);
▪ Développement d’algorithmes de machine learning algorithm pour commander et prédire le
comportement de la voiture autonomme utilisant PyCharm..
▪ Design et implémentation d’un parking intelligent:
▪ Recherche, planification du projet et design du parking (Gantt, Doors, UML)
▪ Rédaction des specifications, production des données, collection et pré-processing des données
(MYSQL, SPARK, Python)
▪ Introduction d’un nouveau modèle de reconnaissance vocale speech (développé durant mon stage
de fin d’études) et amélioration par un « language model » et meilleurs choix des
hyperparameters.
▪ Entraînement d’un reconnaissant vocale end-to-end sur une base de données propriétaire
▪ Mise en place d’une nouvelle architecture qui combine un « Convolutional Neural Network
(CNN) » et un « Deep Recurrent Neural Network (DRNN) »
▪ Prouver que le modèle a appris plus rapidement et a donné des meilleurs résultats (en terme de
« phonemes test error rates (PhERR) » grâce à sa capacité pour généraliser)
▪ Réussir 19.1% PhERR avec un modèle composé de 3 « convolutional layers », après avoir été à
22.3% sans convolution (dépassement de l’état de l’art)
Échantillons de code source:
********?id=1zXz_rE1sPMZ7RbEZeVlxvjEOtZxlJ-MY
Projet : Prédiction des pannes sur une unité de raffinage
▪ Collection de données capteurs à partir d’un système de stockage propriétaire.
▪ Modelisation de la topologie défaillante en collaboration avec les trades
▪ Modélisation d’une panne(causes et conséquences).
▪ Mise en place d’un modèle de prédiction de pannes
▪ Développement d’une interface graphique d’alerte et d’un simulateur de réparage « Upset »
(optimisant le fonctionnement d’une unité).