Hm Growth - Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA

Ref : 201014A002
Email vérifié
Photo de Hm Growth, Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA
Compétences
APACHE HADOOP
APACHE KAFKA
MONGODB
Expériences professionnelles
  • Data Scientist And Big Data

    Casablanca Engineer at ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Nettoyage, Analyse et valorisation des données véhicule big data.
    Analyse et traitement des donnés issues du big data (Scala, Python,
    Apache spark, Hadoop, Pandas ...)
    Developpement des algorithmes de la data science, IA sur les
    donnés des roulages véhicule.
    Visualisation et analyse des résultats sous Tableau Et Power Bi.
    Compréhension et analyse des besoins métier/client afin d’apporter
    des solutions innovantes.
    Conception et développement des solutions algorithmiques /
    statistiques via (Python/Matlab/R).
    Elaboration des modèles prédictifs et identifier les comportements
    client à l'aide des algorithmes du Machine Learning / Deep Learning.
    Développement des scripts python pour transformer, Nettoyer,
    Filtrer, Structurer automatiquement les données non structurées et
    les préparer pour power BI.
    Configuration / Programmation des requêtes sous power BI afin de
    transformer les données.
    Automatisation des Traitements de fichiers massifs à l'aide de
    python & R.
    Développement des application VBA & MACRO.
    Développement des Bibliothèques métier pour l'analyse des
    TimeSeries sous Matlab.

  • Stage - Data Science

    PFE chez ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Développement d’une plateforme web de deep learning, pour
    la reconnaissance des images /vidéos en python/Flask.
    Clustering des frames extrait à partir des videos pour la création de
    la dataset.
    Développement d’un outil d’annotation des images.
    Développement d’une interface friendly-user en python/Flask pour
    la création des modeles (Classification et detection des objets) de
    deep learning sous KERAS.
    Développement d’un module de mise en production des modeles
    deep learning creer dans la platforme.

    PROJETS

    Projet Big Data
    UNE APPLICATION BIG DATA D'ÉTUDE DES TEMPÉRATURES
    OBSERVÉES SUR TOUTE LA PLANÈTE
    - Création d’une interface web en PHP pour récupérer les
    paramètres transmis par le formulaire de l'internaute,
    - utilisation du HDFS (HADOOP Distributed file system ) pour
    stocker les données puis on va faire un import en
    MapReduce Dans HBase et ça sera HBase qui fera l'agrégation des données, pour mettre les résultats dans MySQL.
    MySQL sera alors interrogé par PHP pour faire les
    traitements et l'affichage graphique directement en web.

Études et formations
  • FORMATION

    2017-2019
    Casablanca
    Master Big Data et Cloud Computing
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2014-2017
    Casablanca
    Licence fondamentale Mathématiques et Informatique option
    Base de données
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2013-2014
    Casablanca
    Baccalauréat Sciences de la Vie et de la Terre (SVT)
    Lycée Ibn Rochd


    ÉDUCATION
    Education Ingénieur Informatique et Mathématiques
    appliquées
    Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

    COMPÉTENCES

    Informatique Big Data - Data Engineering
    Spark Scala / Spark Streaming,
    Apache Kafka / Kafka Streaming
    Apache Nifi, ElasticSearch, Cassandra
    HDFS, Scalatra / Scala
    Amazon AWS
    Data Science
    Natural Language processing ( Python Scikit-learn, NLTK )
    Spark MLlib ( Scala / Python )
    Intégration continue
    Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
    Azkaban
    Organisation et méthode
    Travail en équipe, méthode agile, montée en compétence rapide

    Ecosystème de Big Data: Hadoop (HDFS - Yarn -
    MapReduce) - Pig Latin - Hive - Spark / Spark
    MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
    Languages de programmation: Python, R,
    Matlab, Java, Scala, C, C#, C++, Query
    Languages (SQL/PL-SQL, DAX, MDX ...)
    Cloud et virtualisation: KVM - Libvirt - Docker -
    configuration management tools (Ansible -
    Puppet - Chef - Vagrant), Jenkins, kubernetes,
    Xen, Snort, Nagios, Consul, SaltStack ...
    Méthodes statistiques, Analyses de données,
    Algorithmes de Machine Learning,
    Algorithmes d’optimisations: Algorithmes
    évolutionnaires
    Deep Learning ( CLASSIFICATION - OBJECT
    DETECTION - SEGMENTATION - NLP ) :
    Artificial, Convolutional and Recursive neural
    network, MLP ...
    Deep Learning Tools : keras - tensorflow -
    PyTorch - Theano - OPENCV ...
    Techniques de stockages: DAS, NAS (NFS), SAN
    (iSCSI), Raid
    Systèmes d’exploitation: Linux, Windows, OS X
    Solution BI: Suite Pentaho - Power BI - Tableau
    Dévelopement web: PHP (Laravel - Zend) -
    JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

    LANGUES
    Arabe
    français
    Anglais

Autres compétences
FORMATION

2017-2019
Casablanca
Master Big Data et Cloud Computing
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2014-2017
Casablanca
Licence fondamentale Mathématiques et Informatique option
Base de données
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2013-2014
Casablanca
Baccalauréat Sciences de la Vie et de la Terre (SVT)
Lycée Ibn Rochd


ÉDUCATION
Education Ingénieur Informatique et Mathématiques
appliquées
Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

COMPÉTENCES

Informatique Big Data - Data Engineering
Spark Scala / Spark Streaming,
Apache Kafka / Kafka Streaming
Apache Nifi, ElasticSearch, Cassandra
HDFS, Scalatra / Scala
Amazon AWS
Data Science
Natural Language processing ( Python Scikit-learn, NLTK )
Spark MLlib ( Scala / Python )
Intégration continue
Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
Azkaban
Organisation et méthode
Travail en équipe, méthode agile, montée en compétence rapide

Ecosystème de Big Data: Hadoop (HDFS - Yarn -
MapReduce) - Pig Latin - Hive - Spark / Spark
MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
Languages de programmation: Python, R,
Matlab, Java, Scala, C, C#, C++, Query
Languages (SQL/PL-SQL, DAX, MDX ...)
Cloud et virtualisation: KVM - Libvirt - Docker -
configuration management tools (Ansible -
Puppet - Chef - Vagrant), Jenkins, kubernetes,
Xen, Snort, Nagios, Consul, SaltStack ...
Méthodes statistiques, Analyses de données,
Algorithmes de Machine Learning,
Algorithmes d’optimisations: Algorithmes
évolutionnaires
Deep Learning ( CLASSIFICATION - OBJECT
DETECTION - SEGMENTATION - NLP ) :
Artificial, Convolutional and Recursive neural
network, MLP ...
Deep Learning Tools : keras - tensorflow -
PyTorch - Theano - OPENCV ...
Techniques de stockages: DAS, NAS (NFS), SAN
(iSCSI), Raid
Systèmes d’exploitation: Linux, Windows, OS X
Solution BI: Suite Pentaho - Power BI - Tableau
Dévelopement web: PHP (Laravel - Zend) -
JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

LANGUES
Arabe
français
Anglais

D'autres freelances
Data Scientist PYTHON

Ces profils pourraient vous intéresser !
CV Data Scientist PYTHON
Deniz

Data Scientist PYTHON

  • LILLE
PYTHON DATA Data science LLM DOCKER SQL Deep Learning Cloud AWS GIT JAVASCRIPT
Disponible
CV Expert IA generative
Philippe

Expert IA generative

  • GUYANCOURT
PYTHON Data science APACHE SPARK SCALA
Bientôt disponible
CV Data Analyst
Kouceila

Data Analyst

  • BAGNOLET
EXCEL PYTHON SQL BIG DATA Microsoft Power BI APACHE SPARK
Disponible
CV Chef de projet AGILE
Anas

Chef de projet AGILE

  • PARIS
DATA AGILE SQL PROJECT MANAGEMENT OFFICE Microsoft Power BI R PYTHON
Disponible
CV Data Scientist
Fried-Junior

Data Scientist

  • MAUREPAS
BIG DATA SQL Microsoft Power BI R DATAVIZ PYTHON AZURE
Disponible
CV Data Scientist JAVA
Bastien

Data Scientist JAVA

  • MONTPELLIER
PyTorch PYTHON SQL Data science Microsoft Azure Machine Learning TensorFlow R JAVA MONGODB
Disponible
CV Data Scientist/Models specialist/Analyst quantitatif
Sylvie

Data Scientist/Models specialist/Analyst quantitatif

  • NANTERRE
DATAVIZ R PYTHON SAS SAS Viya BIG DATA Microsoft Power BI SQL MYSQL Cloud AWS
Disponible
CV Data Scientist Python Azure | GenAI
Adham

Data Scientist Python Azure | GenAI

  • SAVIGNY-SUR-ORGE
PYTHON SQL Data science Microsoft Power BI AZURE Google Cloud Platform Generative Pre-trained Transformer BIG DATA PYSPARK
Disponible
CV Data Scientist SQL
Charlotte

Data Scientist SQL

  • CERGY
Dataiku SQL PYTHON GITLAB Google Cloud Platform Microsoft Power BI Cloud AWS DOCKER Kubernetes AZURE
Disponible
CV CONSULTANT DATA
Méryl

CONSULTANT DATA

  • STRASBOURG
PYTHON SQL APACHE SPARK EXCEL SAS GIT DOCKER BASH Microsoft Power BI AZURE
Disponible