Triki - Data Analyst JAVA
Ref : 210310S001-
Domicile
3001 SFAX (Tunisie)
-
Profil
Data Analyst, Data Scientist, Business Analyst (30 ans)
-
MobilitéTélétravail uniquement
-
StatutBientôt freelance
-
Tarif Journalier MoyenVoir le tarif
-
Projet Fin d’étude: Ingénieur chercheur en science des données ( application à la pharmacologie)
Institut Pasteur de rechercheJan 2020 - Jan 2021• appliquer plusieurs méthodes pour la prédiction des propriétés des molécules thérapeutiques (toxicité,
• tools: SQL, python (pandas, Tensorflow, RDKit, numpy, Deepchem, . . .), excel Tunisie Telecom
effets secondaires . . .).
• étude des avancées scientifiques pour la transformation des données (molécules chimiques sous forme
de ’SMILES’ en des descripteurs moléculaires ( descripteurs RDKit, empreintes moléculaires, descripteurs
pour réseaux de neurones graphiques)
• après la transformation, l’étude statistique des données et une recherche approfondie dans la literature,
j’ai utilisé pour la prédiction plusieurs méthodes des apprentissages automatiques comme les forets aléatoires et les SVM.
• Pour les architectures de l’apprentissage profond, j’ai utilisé le méta-learning, cette technique vise à comprendre le fonctionnement d’une molécule sur des objectifs pour ensuite prédire son comportement dans
d’autres objectifs via la similarité entre les molécules.
• en utilisant les bonnes manipulations sur les inputs (ou pré-traitement), les modèles ont atteint une
justesse (accuracy) de 96 % et une précision de 85 % avec des données balancées de 3 % et 9 % sur les
données de test.
• Pour plus voir mon travail, contacter moi par mail pour un rapport en français -
Stage en Data science(application à la télécommunication)Jan 2019 - Jan 2019
• Toute firme dans la télécommunication vise à conserver ses clients à travers des packages de promotions.
• outils: SQL, SAS, python(pandas, sklearn, numpy, . . .).
La date de proposition des promotions est cruciale car il peut présenter un manque à gagner.
• Le but du projet est construire des modèles pour prédire la prochaine date de recharge pour ensuite proposer le meilleur timing pour envoyer les packages de promotions et minimiser le risque de tout manque
à gagner pour l’entreprise.
• Il a été prouvé après l’implémentation des modèles que 83 % des offres de promotions étaient non nécessaires et donc représentaient un manque à gagner pour l’entreprise. -
Stage d’insertion
Conseil du marché financierJan 2017 - Jan 2017• Le CMF contrôle tour opération financière dans le pays et en particulier les activités boursières.
• Direction d’une équipe de stagiaires sous la supervision de mon encadrant du CMF pour révolutionner
la gestion des bases de données dans le CMF à travers la conception et la mise en place d’un data warehouse qui permet de faciliter la circulation de l’information entre les différents département du CMF.
• La base de données a été testées pour identifier les opérations douteuses de manière instantanée dans la
bourse de Tunis (BVMT). -
PROJETS ACADÉMIQUES (GITHUB)aujourd'hui
PROJET 1: analyse d’une série temporelle décrivant la variation EUR/USD et extraction du
meilleur modèle SARIMA par les meilleurs score AIC/BIC (méthode de Box Jenkins)R
PROJET 2: scoring pour une compagnie d’assurance pour prédire la solvabilité des clients en
appliquant plusieurs algorithmes: Arbres de décision, forets aléatoires, Réseaux de neurones,
régression logistique
PROJET 3: Analyse en composante principale d’une base de données de vins et prédiction des
scores des différents vins par régression logistique.
PROJET 4: Application des réseaux de neurones convolutionnels (CNN) sur la base de données MNIST pour prédire le label d’une image contenant un chiffre
SKILLS
• Software : Python (Pandas, Sklearn, Plotly, keras, ...),
R, RShiny, SAS, C, EViews, Stata, SQL, SQLlite, JAVA.
• Theoretical Skills: Algébre linéaire, théorie des probabilités, Statistique inférentielle (Estimation, Tests à
hypothèses), Econométrie, Statistique Bayésienne,
gestion de risque, gestion de l’entreprise, microéconomie, macro-économie, ingénierie financière,
économie monétaire.
• machine learning and deep learning : apprentissage
supervisé / non supervisé, ACP, K-means, KNN,
méthodes de régression, Arbre de décision, forets
aléatoires, SVM, Réseau de neurones, CNN.
EDUCATION
Ecole supérieure de la statistique et de
l’analyse de l’information
spécialité: statistique et analyse de
l’information
Sept 2016 – Novembre 2020
Institut préparatoire aux études
d’ingénieurs de Sfax : classe prépa
spécialité: mathématique théorique et
physique(MP)
Sept 2013 – June 2016
LANGUAGES
English ○ ○ ○ ○ ○
French
• Software : Python (Pandas, Sklearn, Plotly, keras, ...),
R, RShiny, SAS, C, EViews, Stata, SQL, SQLlite, JAVA.
• Theoretical Skills: Algébre linéaire, théorie des probabilités, Statistique inférentielle (Estimation, Tests à
hypothèses), Econométrie, Statistique Bayésienne,
gestion de risque, gestion de l’entreprise, microéconomie, macro-économie, ingénierie financière,
économie monétaire.
• machine learning and deep learning : apprentissage
supervisé / non supervisé, ACP, K-means, KNN,
méthodes de régression, Arbre de décision, forets
aléatoires, SVM, Réseau de neurones, CNN.
EDUCATION
Ecole supérieure de la statistique et de
l’analyse de l’information
spécialité: statistique et analyse de
l’information
Sept 2016 – Novembre 2020
Institut préparatoire aux études
d’ingénieurs de Sfax : classe prépa
spécialité: mathématique théorique et
physique(MP)
Sept 2013 – June 2016
LANGUAGES
English ○ ○ ○ ○ ○
French