Réalisation d’un POC pour prédire les risques de sinistres automobiles lors d’un trajet des assurés
• Compréhension du besoin client
• Collecte , prétraitement et Analyse des données
• Mise en place de modèles de classification (LightGBM, RandomForest, Régression Logistique)
• Déploiement du modèle final sous forme d’API avec Streamlit Python
Détection de fraude de transactions bancaires pour la Banque LCL
Mise en place d’un modèle machine learning LightGBM pour détecter les fraudes bancaires
Déploiement du modèle via le framework Flask python
Rédaction du cahier des charges répondant aux besoins
Mise en place d’outils de Webscrapping pour améliorer la connaissance des consommateurs de LECLERC
• Collecte des informations de manières automatiques sur les réseaux sociaux du client
• Stockage des données collectées sur PostgreSQL
• Mise en place d’outils d’indicateurs de performances pour améliorer la connaissance des consommateurs
Migrer la collecte des données Réassurance des clients disposant d'un contrat MRH vers la plateforme Hadoop de Generali
Transférer les requêtes BOBI et codes SAS sous Hadoop en utilisant PySpark.
Construire une base de données contenant les données clients collectés sous Hadoop.
Rehausser les valeurs des champs manquants.
Vérifier la fiabilité des données collectées par un calcul de taux de concordance (seuil fixé à 95%)
Automatiser les prochaines collectes des données réassurances sous Hadoop.
Rédiger un cahier des charges répondant aux besoins du client
Mise en place d’outils de traitement des contrats sinistres à disposition des équipes Recours et Remboursement
Développement de modules python PDFminer et PyPDF et collection d’une liste de mots clés.
Extraction des informations pertinentes sur les contrats sinistres à l’aide des bibliothèques PDFminer et PyPDF
Construire une base de sortie contenant les informations pertinentes qui facilitent le traitement rapide des recours