Hm Growth - Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA
Ref : 201014A002-
Domicile
75001 PARIS
-
Profil
Data Scientist, Data Analyst, Chef de projet (39 ans)
-
StatutFreelance
-
Tarif Journalier MoyenVoir le tarif
-
Data Scientist And Big Data
Casablanca Engineer at ALTRAN MAROCJan 2019 - aujourd'huiNettoyage, Analyse et valorisation des données véhicule big data.
Analyse et traitement des donnés issues du big data (Scala, Python,
Apache spark, Hadoop, Pandas ...)
Developpement des algorithmes de la data science, IA sur les
donnés des roulages véhicule.
Visualisation et analyse des résultats sous Tableau Et Power Bi.
Compréhension et analyse des besoins métier/client afin d’apporter
des solutions innovantes.
Conception et développement des solutions algorithmiques /
statistiques via (Python/Matlab/R).
Elaboration des modèles prédictifs et identifier les comportements
client à l'aide des algorithmes du Machine Learning / Deep Learning.
Développement des scripts python pour transformer, Nettoyer,
Filtrer, Structurer automatiquement les données non structurées et
les préparer pour power BI.
Configuration / Programmation des requêtes sous power BI afin de
transformer les données.
Automatisation des Traitements de fichiers massifs à l'aide de
python & R.
Développement des application VBA & MACRO.
Développement des Bibliothèques métier pour l'analyse des
TimeSeries sous Matlab. -
Stage - Data Science
PFE chez ALTRAN MAROCJan 2019 - aujourd'huiDéveloppement d’une plateforme web de deep learning, pour
la reconnaissance des images /vidéos en python/Flask.
Clustering des frames extrait à partir des videos pour la création de
la dataset.
Développement d’un outil d’annotation des images.
Développement d’une interface friendly-user en python/Flask pour
la création des modeles (Classification et detection des objets) de
deep learning sous KERAS.
Développement d’un module de mise en production des modeles
deep learning creer dans la platforme.
PROJETS
Projet Big Data
UNE APPLICATION BIG DATA D'ÉTUDE DES TEMPÉRATURES
OBSERVÉES SUR TOUTE LA PLANÈTE
- Création d’une interface web en PHP pour récupérer les
paramètres transmis par le formulaire de l'internaute,
- utilisation du HDFS (HADOOP Distributed file system ) pour
stocker les données puis on va faire un import en
MapReduce Dans HBase et ça sera HBase qui fera l'agrégation des données, pour mettre les résultats dans MySQL.
MySQL sera alors interrogé par PHP pour faire les
traitements et l'affichage graphique directement en web.
FORMATION
2017-2019
Casablanca
Master Big Data et Cloud Computing
Faculté des Sciences Ain Chock
Université Hassan II Casablanca
2014-2017
Casablanca
Licence fondamentale Mathématiques et Informatique option
Base de données
Faculté des Sciences Ain Chock
Université Hassan II Casablanca
2013-2014
Casablanca
Baccalauréat Sciences de la Vie et de la Terre (SVT)
Lycée Ibn Rochd
ÉDUCATION
Education Ingénieur Informatique et Mathématiques
appliquées
Institut National Polytechnique -TOULOUSE ENSEEIHT 2017
COMPÉTENCES
Informatique Big Data - Data Engineering
Spark Scala / Spark Streaming,
Apache Kafka / Kafka Streaming
Apache Nifi, ElasticSearch, Cassandra
HDFS, Scalatra / Scala
Amazon AWS
Data Science
Natural Language processing ( Python Scikit-learn, NLTK )
Spark MLlib ( Scala / Python )
Intégration continue
Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
Azkaban
Organisation et méthode
Travail en équipe, méthode agile, montée en compétence rapide
Ecosystème de Big Data: Hadoop (HDFS - Yarn -
MapReduce) - Pig Latin - Hive - Spark / Spark
MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
Languages de programmation: Python, R,
Matlab, Java, Scala, C, C#, C++, Query
Languages (SQL/PL-SQL, DAX, MDX ...)
Cloud et virtualisation: KVM - Libvirt - Docker -
configuration management tools (Ansible -
Puppet - Chef - Vagrant), Jenkins, kubernetes,
Xen, Snort, Nagios, Consul, SaltStack ...
Méthodes statistiques, Analyses de données,
Algorithmes de Machine Learning,
Algorithmes d’optimisations: Algorithmes
évolutionnaires
Deep Learning ( CLASSIFICATION - OBJECT
DETECTION - SEGMENTATION - NLP ) :
Artificial, Convolutional and Recursive neural
network, MLP ...
Deep Learning Tools : keras - tensorflow -
PyTorch - Theano - OPENCV ...
Techniques de stockages: DAS, NAS (NFS), SAN
(iSCSI), Raid
Systèmes d’exploitation: Linux, Windows, OS X
Solution BI: Suite Pentaho - Power BI - Tableau
Dévelopement web: PHP (Laravel - Zend) -
JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...
LANGUES
Arabe
français
Anglais
2017-2019
Casablanca
Master Big Data et Cloud Computing
Faculté des Sciences Ain Chock
Université Hassan II Casablanca
2014-2017
Casablanca
Licence fondamentale Mathématiques et Informatique option
Base de données
Faculté des Sciences Ain Chock
Université Hassan II Casablanca
2013-2014
Casablanca
Baccalauréat Sciences de la Vie et de la Terre (SVT)
Lycée Ibn Rochd
ÉDUCATION
Education Ingénieur Informatique et Mathématiques
appliquées
Institut National Polytechnique -TOULOUSE ENSEEIHT 2017
COMPÉTENCES
Informatique Big Data - Data Engineering
Spark Scala / Spark Streaming,
Apache Kafka / Kafka Streaming
Apache Nifi, ElasticSearch, Cassandra
HDFS, Scalatra / Scala
Amazon AWS
Data Science
Natural Language processing ( Python Scikit-learn, NLTK )
Spark MLlib ( Scala / Python )
Intégration continue
Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
Azkaban
Organisation et méthode
Travail en équipe, méthode agile, montée en compétence rapide
Ecosystème de Big Data: Hadoop (HDFS - Yarn -
MapReduce) - Pig Latin - Hive - Spark / Spark
MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
Languages de programmation: Python, R,
Matlab, Java, Scala, C, C#, C++, Query
Languages (SQL/PL-SQL, DAX, MDX ...)
Cloud et virtualisation: KVM - Libvirt - Docker -
configuration management tools (Ansible -
Puppet - Chef - Vagrant), Jenkins, kubernetes,
Xen, Snort, Nagios, Consul, SaltStack ...
Méthodes statistiques, Analyses de données,
Algorithmes de Machine Learning,
Algorithmes d’optimisations: Algorithmes
évolutionnaires
Deep Learning ( CLASSIFICATION - OBJECT
DETECTION - SEGMENTATION - NLP ) :
Artificial, Convolutional and Recursive neural
network, MLP ...
Deep Learning Tools : keras - tensorflow -
PyTorch - Theano - OPENCV ...
Techniques de stockages: DAS, NAS (NFS), SAN
(iSCSI), Raid
Systèmes d’exploitation: Linux, Windows, OS X
Solution BI: Suite Pentaho - Power BI - Tableau
Dévelopement web: PHP (Laravel - Zend) -
JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...
LANGUES
Arabe
français
Anglais