Notre base de 144194 CV vous permet de trouver rapidement un Data scientist Clermont-Ferrand freelance. Recevez gratuitement et sous 24h maximum les CV des meileurs intervenants disponibles.
Projet : Automatisation des processus d’attribution de crédit de la caisse régionale de Toulouse
• Implémentation d’une solution de classification de documents en se basant sur une approche visuelle d’analyse
sémantique.
• Apprentissage de différentes architectures de réseaux de neurones convolutifs par une technique de transfert
learning.
• Développement de différentes approches d’interprétabilité des résultats du modèle.
• Serving du modèle en production à l’aide de l’outil tensorflow-serving .
Projet : Traitement automatique de mails pour la caisse régionale de Ille-et-Vilaine
• Apprentissage de réseaux de neurones récurrents de type Bi-LSTM pour la segmentation des mails
• Encapsulation d’une brique générique de segmentation de mails
Compétences techniques : Python , Keras , Tensorflow , Opencv , Computer Vision , NLP , Git , OCR ,
scikit-learn
BNP Paribas Securities Services , Paris , France
Projet : Digitalisation et automatisation des processus métier pour des marchés / hubs internationaux via des solutions de l'Intelligence Artificielle (natural language processing / machine learning)
Développement d’une API pour la classification automatique de mails sur le serveur de messagerie Exchange en utilisant différentes approches de traitement de langage naturel.
Design d’architecture et prototypage de la solution IA réalisant l’extraction des entités nommées à partir de fichier Excel / PDF / Texte
Application de frameworks deep learning pour le traitement de texte
Projet : Mise en place d’un moteur de recommandation qui permet de matcher entre collaborateur et offre
de mission / formation . Application ouverte à plus de 100 000 utilisateurs.
Accompagnement du client dans la démarche de définition du besoin / Organisation des ateliers métiers.
Développement des jobs Spark Scala batch pour les traitements et préparation des gros volumes et différents types de données en entrée ( CSV , XML , JSON ..)
Développement des algorithmes NLP permettant une analyse sémantique des offres de mission / formation, en se basant sur un modèle de représentation vectorielle des mots (Word2Vec).
Développement des workflows Oozie pour ordonnancer les jobs Spark
Optimisation du temps de traitement et performance en production ; Tunning des algorithmes.
Mettre en place des indicateurs de performance (KPI) / analyses statistiques et représentations visuelles.
Migration de la plateforme BigInsights ( Spark 1.5) vers la plateforme HortonWorks ( Spark 2.2) .
Développement d’une API en JAVA de push de données vers des clusters distants .
Définition et validation des scénarios de tests .
Assister le client dans la procédure de construction d’un DataLake .
Compétences techniques : Python , Tensorflow , JAVA , NLP , Docker , Swagger
Compétences techniques : HortonWorks , JAVA , NLP , Scala , Python , ANN , Word2vec , Hive , Spark
Projet R&D : Traitement automatique des documents scannés
Classification des factures scannées à travers une reconnaissance de logo – Entrainement des modèles de reconnaissance par des méthodes de boosting [ADABoost, XGBoost]
Reconnaissance optique de caractères – Tesseract OCR
Parsing et structuration du texte brut
Projet R&D : Applications NLP
Web Scrapping – [BeautifulSoup] & Automatic summarization
Topic modelling [LDA]
Text classification [SVM, Naives Bayes ...]
Outils utilisés : Python , Gensim , Machine learning , NLP , OCR , Image Detection/ Image Recognition, ANN ,Text mining , Computer Vision , Yolo
Projet : Détection de fraude à la Simbox
Profiling et analyse des CDR (enregistrements des détails des appels) pour extraire les critères de détection de fraude à la SIMBOX .
Utilisation des algorithmes Machine Learning ( Supervised & Unsupervised Clustering ) pour une identification proactive des profils fraudeurs .
Visualisation interactive et restitution des résultats.
Compétences techniques : Python, Gensim , Machine learning , NLP , OCR , Image Detection/ Image
Recognition, ANN ,Text mining , Computer Vision
Compétences techniques Python , Scikit-Learn, Apache Spark , Mlib , Angular 2 , D3JS