Stage de fin d’études
• Création de bases de données sur Airtable à destination des différentes équipes en interne :
récolte des données par les API Google, Zoho, Hubspot, Facebook, LinkedIn (et autres) via des
scripts automatisés.
• Pour les projets clients : extraction de données via notre API pour former des jeux de données
servant à créer des reporting pour nos clients sous forme de dashboard.
• Mise en place d’automatisations pour assurer la mise à jour régulière des données utilisées
par les équipes en interne et pour les dashboard des clients.
• Participation à un benchmark de solutions de Business Intelligence : Tableau, Power BI, Whaly,
Preset, Metabase.
Projet de Machine Learning : Prédiction de retards de vol
L’objectif de ce projet était d’arriver à prédire des retards de vol sur un dataset contenant l’historique
sur une année des vols aériens de nombreuses compagnies. Le travail a été réalisé en équipe de 3
personnes. Nous avons utilisé Pyspark pour faire l’exploration de données, le data processing, le feature
engineering ainsi que l'entraînement des modèles et les prédictions. Les algorithmes utilisés ont été :
Linear Regression et Random Forest Regressor. Pour l’optimisation des paramètres des algorithmes,
nous avons employé le système de GridSearchCV. Ce projet m’a permis de prendre en main
l’écosystème AWS avec l’utilisation de S3 pour le stockage et d’un cluster sur Amazon EMR pour
l’entrainement et les prédictions des modèles. Cliquez ici pour accéder à notre code sur Github.
• Création d’une plateforme de cartographie pour représenter le prix de l’immobilier en Ile-deFrance en fonction des axes de circulation (GPE, Metro, Tramway…) : frontend et un prototype
d’espace admin pour ajouter ses jeux de données.
• Réalisation d’un dashboard « from scratch » pour l’Agence nationale de la sécurité des
systèmes d'information (ANSSI). Choix des bibliothèques, implémentation et documentation
du code. L’architecture est aujourd’hui encore en place et à permis de faire passer un cap à la
cartographie.
• Rédaction d’un livre blanc expliquant mon code à destination des futurs développeurs
poursuivant le travail de cartographie chez Cassini.
Projet de fin de 4ème année
Création d’une application d’achat et de vente de NFT avec la blockchain Avalanche (AVAX). Le travail
a été réalisé en équipe de 8 personnes. Nous avons codé un système de vente aux enchères via la
rédaction de smart contracts en langage Solidity. Le backend était en Node.js, la base de données
MongoDB Atlas, le code en TypeScript. Le frontend en React et notre API codé avec Express. Les NFT
proposés étaient des tableaux créés à partir d’un transfert de style généré grâce à des réseaux de
neurones convolutifs (CNN) avec TensorFlow.
Projet de data science sur la Covid-19
L’objectif de ce projet réalisé en équipe de 4 personnes et dans le cadre du cours de « Data Processes »
était de proposer un plan d’action pour catégoriser les patients atteint de la Covid-19 pour les orienter
vers le bon service hospitalier. En plus d’être un projet de data science avancé (bivariate analysis,
survival curves, predict the survival…), ce travail nous a demandé d’élaborer un projet d’entreprise
détaillé et par conséquent, la rédaction d’un business plan. Voici le lien vers le rapport de notre projet :
********?id=1WhdSul_bCxeFmoi63878_bZA1v8RP9FZ