Hm Growth - Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA

Ref : 201014A002
Email vérifié
Photo de Hm Growth, Senior Data Engineer APACHE HADOOP APACHE SPARK SCALA APACHE KAFKA
Compétences
APACHE HADOOP
APACHE KAFKA
MONGODB
Expériences professionnelles
  • Data Scientist And Big Data

    Casablanca Engineer at ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Nettoyage, Analyse et valorisation des données véhicule big data.
    Analyse et traitement des donnés issues du big data (Scala, Python,
    Apache spark, Hadoop, Pandas ...)
    Developpement des algorithmes de la data science, IA sur les
    donnés des roulages véhicule.
    Visualisation et analyse des résultats sous Tableau Et Power Bi.
    Compréhension et analyse des besoins métier/client afin d’apporter
    des solutions innovantes.
    Conception et développement des solutions algorithmiques /
    statistiques via (Python/Matlab/R).
    Elaboration des modèles prédictifs et identifier les comportements
    client à l'aide des algorithmes du Machine Learning / Deep Learning.
    Développement des scripts python pour transformer, Nettoyer,
    Filtrer, Structurer automatiquement les données non structurées et
    les préparer pour power BI.
    Configuration / Programmation des requêtes sous power BI afin de
    transformer les données.
    Automatisation des Traitements de fichiers massifs à l'aide de
    python & R.
    Développement des application VBA & MACRO.
    Développement des Bibliothèques métier pour l'analyse des
    TimeSeries sous Matlab.

  • Stage - Data Science

    PFE chez ALTRAN MAROC
    Jan 2019 - aujourd'hui

    Développement d’une plateforme web de deep learning, pour
    la reconnaissance des images /vidéos en python/Flask.
    Clustering des frames extrait à partir des videos pour la création de
    la dataset.
    Développement d’un outil d’annotation des images.
    Développement d’une interface friendly-user en python/Flask pour
    la création des modeles (Classification et detection des objets) de
    deep learning sous KERAS.
    Développement d’un module de mise en production des modeles
    deep learning creer dans la platforme.

    PROJETS

    Projet Big Data
    UNE APPLICATION BIG DATA D'ÉTUDE DES TEMPÉRATURES
    OBSERVÉES SUR TOUTE LA PLANÈTE
    - Création d’une interface web en PHP pour récupérer les
    paramètres transmis par le formulaire de l'internaute,
    - utilisation du HDFS (HADOOP Distributed file system ) pour
    stocker les données puis on va faire un import en
    MapReduce Dans HBase et ça sera HBase qui fera l'agrégation des données, pour mettre les résultats dans MySQL.
    MySQL sera alors interrogé par PHP pour faire les
    traitements et l'affichage graphique directement en web.

Études et formations
  • FORMATION

    2017-2019
    Casablanca
    Master Big Data et Cloud Computing
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2014-2017
    Casablanca
    Licence fondamentale Mathématiques et Informatique option
    Base de données
    Faculté des Sciences Ain Chock
    Université Hassan II Casablanca

    2013-2014
    Casablanca
    Baccalauréat Sciences de la Vie et de la Terre (SVT)
    Lycée Ibn Rochd


    ÉDUCATION
    Education Ingénieur Informatique et Mathématiques
    appliquées
    Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

    COMPÉTENCES

    Informatique Big Data - Data Engineering
    Spark Scala / Spark Streaming,
    Apache Kafka / Kafka Streaming
    Apache Nifi, ElasticSearch, Cassandra
    HDFS, Scalatra / Scala
    Amazon AWS
    Data Science
    Natural Language processing ( Python Scikit-learn, NLTK )
    Spark MLlib ( Scala / Python )
    Intégration continue
    Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
    Azkaban
    Organisation et méthode
    Travail en équipe, méthode agile, montée en compétence rapide

    Ecosystème de Big Data: Hadoop (HDFS - Yarn -
    MapReduce) - Pig Latin - Hive - Spark / Spark
    MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
    Languages de programmation: Python, R,
    Matlab, Java, Scala, C, C#, C++, Query
    Languages (SQL/PL-SQL, DAX, MDX ...)
    Cloud et virtualisation: KVM - Libvirt - Docker -
    configuration management tools (Ansible -
    Puppet - Chef - Vagrant), Jenkins, kubernetes,
    Xen, Snort, Nagios, Consul, SaltStack ...
    Méthodes statistiques, Analyses de données,
    Algorithmes de Machine Learning,
    Algorithmes d’optimisations: Algorithmes
    évolutionnaires
    Deep Learning ( CLASSIFICATION - OBJECT
    DETECTION - SEGMENTATION - NLP ) :
    Artificial, Convolutional and Recursive neural
    network, MLP ...
    Deep Learning Tools : keras - tensorflow -
    PyTorch - Theano - OPENCV ...
    Techniques de stockages: DAS, NAS (NFS), SAN
    (iSCSI), Raid
    Systèmes d’exploitation: Linux, Windows, OS X
    Solution BI: Suite Pentaho - Power BI - Tableau
    Dévelopement web: PHP (Laravel - Zend) -
    JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

    LANGUES
    Arabe
    français
    Anglais

Autres compétences
FORMATION

2017-2019
Casablanca
Master Big Data et Cloud Computing
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2014-2017
Casablanca
Licence fondamentale Mathématiques et Informatique option
Base de données
Faculté des Sciences Ain Chock
Université Hassan II Casablanca

2013-2014
Casablanca
Baccalauréat Sciences de la Vie et de la Terre (SVT)
Lycée Ibn Rochd


ÉDUCATION
Education Ingénieur Informatique et Mathématiques
appliquées
Institut National Polytechnique -TOULOUSE ENSEEIHT 2017

COMPÉTENCES

Informatique Big Data - Data Engineering
Spark Scala / Spark Streaming,
Apache Kafka / Kafka Streaming
Apache Nifi, ElasticSearch, Cassandra
HDFS, Scalatra / Scala
Amazon AWS
Data Science
Natural Language processing ( Python Scikit-learn, NLTK )
Spark MLlib ( Scala / Python )
Intégration continue
Docker, Ansible, Git, Jenkins, Rundeck, Mesos, Marathon,
Azkaban
Organisation et méthode
Travail en équipe, méthode agile, montée en compétence rapide

Ecosystème de Big Data: Hadoop (HDFS - Yarn -
MapReduce) - Pig Latin - Hive - Spark / Spark
MLlib - kafka - storm - Oozie - NoSQL (Cassandra - mongodb - Hbase) - Sqoop/Flume ...
Languages de programmation: Python, R,
Matlab, Java, Scala, C, C#, C++, Query
Languages (SQL/PL-SQL, DAX, MDX ...)
Cloud et virtualisation: KVM - Libvirt - Docker -
configuration management tools (Ansible -
Puppet - Chef - Vagrant), Jenkins, kubernetes,
Xen, Snort, Nagios, Consul, SaltStack ...
Méthodes statistiques, Analyses de données,
Algorithmes de Machine Learning,
Algorithmes d’optimisations: Algorithmes
évolutionnaires
Deep Learning ( CLASSIFICATION - OBJECT
DETECTION - SEGMENTATION - NLP ) :
Artificial, Convolutional and Recursive neural
network, MLP ...
Deep Learning Tools : keras - tensorflow -
PyTorch - Theano - OPENCV ...
Techniques de stockages: DAS, NAS (NFS), SAN
(iSCSI), Raid
Systèmes d’exploitation: Linux, Windows, OS X
Solution BI: Suite Pentaho - Power BI - Tableau
Dévelopement web: PHP (Laravel - Zend) -
JS(ReactJS - AngularJS - VueJS ) - Html5/Css3/JQuery/Bootstrap - Django/Flask - WordPress ...

LANGUES
Arabe
français
Anglais

D'autres freelances
Data Scientist PYTHON

Ces profils pourraient vous intéresser !
CV Data Analyst PYTHON
Nihal

Data Analyst PYTHON

  • BEZONS
DATA PYTHON Microsoft Power BI BIG DATA SQL
Disponible
CV Data Scientist PYTHON
Fousséni

Data Scientist PYTHON

  • CERGY
PYTHON DATA SQL BIG DATA SCALA EXCEL AZURE
Disponible
CV Data Analyst
Ilyass

Data Analyst

  • LYON
Looker DATAVIZ MYSQL Power BI PYTHON SQL QUERY MATLAB
Disponible
CV Data Scientist | PYTHON
Florian

Data Scientist | PYTHON

  • LE TAMPON
PYTHON DATA
Disponible
CV Data Scientist PYTHON
Camille

Data Scientist PYTHON

  • LE MANS
SAS SQL DATA Data science EXCEL PYTHON DATAVIZ
Bientôt disponible
CV Data Scientist Google Cloud Platform
Loïc

Data Scientist Google Cloud Platform

  • PARIS
SQL PYTHON Google Cloud Platform Cloud AWS DATA Dataiku BIGQUERY AZURE DEVOPS Rust
Disponible
CV Data Analyst PYTHON
Mohamed

Data Analyst PYTHON

  • LYON
PYTHON SAS R
Disponible
CV Business/Data Analyst
Saad

Business/Data Analyst

  • CRÉTEIL
SQL JIRA AGILE Microsoft Power BI DATA PYTHON
Disponible
CV Data Scientist - Docteur en statistique
Joseph

Data Scientist - Docteur en statistique

  • STRASBOURG
PYTHON DATA Data science Deep Learning
Disponible
CV Data Engineer Semarchy xDI
Amine

Data Engineer Semarchy xDI

  • ANTONY
PYTHON Microsoft Power BI SQL SEMARCHY EXCEL SQL SERVER APACHE SPARK TALEND
Disponible