Mission :
Contribution au développement et optimisation du moteur de recherche intégré à la plateforme Neuradata.
Réalisations / Exemple de projets :
● Reprise de code, investigation et bug fix
● Mise en place de nouvelles fonctionnalités (synonymes, recherche linguistique)
Mission :
Contribution au développement de projets d’intégration d'Elasticsearch sur solutions :
● moteur de recherche du site ********
● moteur de recherche pour les produits non-alimentaires, destiné aux vendeurs Carrefour
Réalisations / Exemple de projets :
● Reprise de code, investigation et bug fix
● Refactoring et évolutions métier
● Assistance aux équipes QA et Ops
Mission :
Au sein du département Architecture et Innovation de la DSI, en charge de la réalisation du moteur de recherche de Notilus, un projet de refonte du SI documentaire de l’institut. Contexte de forte volumétrie avec un modèle de données complexe.
Réalisations :
Conception et développement d’une solution basée sur un pipeline de transformation de données Talend et un outils de templating avancé.
Mise en application sur un ensemble de moteurs de recherche métier
Mission :
Au sein du département Architecture et Innovation de la DSI, en charge de la migration du moteur de recherche du site public ******** d’Exalead vers Elasticsearch.
Réalisations :
Etude d’impact sur les différents backends du SI documentaire
Plugin d’intégration Elasticsearch
Mise en place d’une UI pour tuner / bencher la pertinence du moteur de recherche
Consultant Expert Elasticsearch
Groupe Pomona, Antony, France, 03/2017 à 04/2016 à 03/2017
Mission :
Au sein de l’équipe web de la DSI, assistance à l’équipe de développement pour :
améliorer la pertinence du moteur de recherche Elasticsearch
mettre en place des fonctionnalités avancées du moteur (suggestions de correction orthographique, synonymes, facettes contextualisées)
amélioration de l’architecture
Réalisations :
Web service de recherche REST (plugin Elasticsearch)
socle de configuration simplifiée pilotant la génération des settings/mappings Elasticsearch ainsi que des requêtes de recherche
Mission :
Contribution au développement de projets d’intégration d'Elasticsearch autour de différents sites e-commerce du groupe Carrefour (Drive, RueDuCommerce, ********). Spécifications techniques, développement.
Réalisations / Exemple de projets :
● Développement d’une API de chargement et d’aggrégation de données pour flux multiples
● Spécification et mise en place d’évolution sur le moteur de recherchee-commerce (gestion de catalogues multiples, tris contextuels, suggestions contextualisées)
Mission :
Développement et pilotage de projets d’intégration d'Elasticsearch dans le système d’informations Generali. Spécifications techniques, développement, suivi des déploiements.
Réalisations / Exemple de projets :
● Développement d’un service de dédoublonnage client utilisé au fil de l’eau lors de l’ajout d’un client le référentiel
● Migration du moteur de recherche du référentiel client / contrat d’Elasticsearch 0.90.5 vers la version 2.3.x
● Spécifications et développement d’une solution générique d’indexation pour diverses sources du SI
Mission :
Architecture technique, développement et déploiement de solutions Elasticsearch/Logstash/Kibana. Développement et exploitation de moteurs de recherche. Conseil, expertise et formation Elasticsearch et Solr.
Réalisations :
● Développement et exploitation des plateformes Cloud hébergeant des services de recherche, navigation, analyse et segmentation pour plusieurs sites e-commerce ou boutique en ligne :
◦ ******** – recherche et réservation d'appartements haut de gamme (********/).
◦ ******** – 2 millions d'offres sur le catalogue ********
◦ Sparkow – moteur en mode Saas derrière les sites e-commerce de Decathlon, Truffaut, Camaïeu, But, etc. avec plus de 300 millions de documents en cible.
● Conseil, développement et déploiement de plusieurs solutions basées sur Elasticsearch, Kibana et Logstash pour des clients d'Adelean et Elasticsearch dans le domaine de l'e-commerce, de l'éducation et de l'infogérance (Université Paris Descartes, Groupe E. Leclerc, Docapost, Sacem)
Mission :
Développement et pilotage de plusieurs projets d’intégration d'Elasticsearch dans le système d’informations d’Axa. Spécifications techniques, développement, suivi des déploiements.
Réalisations / Exemple de projets :
● Statistiques et reporting sur les mouvements contrats, intégration des sources de données publiques (INSEE, liens capitalistiques, BODACC, alerte presse) dans les systèmes informatiques internes.
● Recherche de personnes dans le référentiel clients de AXA (30 millions de documents Lucene)
● Création de dashboards pour le suivi des campagnes Marketing (utilisation intensive des facettes et agrégations Elasticsearch)
Mission :
Développement des outils et évaluation, déploiement et modification des logiciels open-source utilisés pour l'archivage du web : définir et conduire les collectes, évaluer la qualité post-collecte, stocker et indexer les archives, accéder aux sites archivés.
Collaboration étroite et pilotage des experts fonctionnels, ingénieurs en charge de la production et administrateurs systèmes.
Projet inscrit dans le cadre du consortium international IIPC (********/). Intégration de l'équipe de développement de NetArchiveSuite en mai 2009. Contribution à plusieurs releases publiques.
Réalisations :
● Déploiement de Wayback Machine open-source, avec développement d'extensions et refonte complète de l'interface web, pour l'accès public aux archives du web. Mise en production initiale en février 2009, actuellement en service.
● Déploiement et évaluation de NetArchiveSuite, un logiciel open-source de gestion des collectes du web, construit autour du robot Heritrix. Bug fixes et développement d'extensions.
● Mise en production de NetArchive Suite pour la réalisation des collectes en interne (i.e. non outsourcée) à la BnF :
◦ collecte automatiques (environ 100To de données compressées collectées par an).
◦ collectes continues (sites d'actualités, journaux en ligne, etc..)
◦ collectes « snapshot » annuelles (domaine .fr essentiellement)
● Réalisation et mise en production d'une application web permettant la gestion documentaire des collectes du web par un groupe de bibliothécaires internes et externes (une centaine d'utilisateurs).
● Développement des logiciels requis par l'activité : outils de transformation et de chargement de données, sur de gros volumes, massivement parallèles
● Volumétrie 2013 : 18 milliards de documents, index plat de 4To, 450 To de données compressées.
● Etude de refonte de l'indexation, comparatif ElasticSearch / Solr 4 sur un échantillon de 60 millions de documents, déploiement sur un cluster virtualisé.
Business Objects, Levallois-Perret, France,
Mission :
Intégré à l’équipe d’une société récemment acquise par Business Objects, développement de Data Federator Designer, un nouveau produit réalisant de l’intégration de données en temps réel, et proposant des connectivités vers de nombreuses sources de données.
● Spécification de nouvelles fonctionnalités et refactoring
● Développement, test et debugging
● Sustaining post-release et contribution aux service packs
● Collaboration avec les équipes externes pour intégration avec les autres produits de BO
Réalisations :
● Livraison de trois versions majeures de BusinessObjects Data Federator Designer - IDE permettant la conception, la validation et le déploiement des projets d'intégration de données