L’entreprise
NOTRE CLIENT
Pionnier dans le domaine des solutions de plateforme, notre client offre une suite innovante permettant aux sociétés de transformer leur e-commerce pour accélérer leur croissance de manière durable et rentable. Depuis le début des années 2010, il accompagne les entreprises B2C et B2B en leur fournissant des technologies avancées, sécurisées et évolutives pour digitaliser leur activité, étendre leur offre via la marketplace ou le dropship, optimiser la gestion des catalogues et paiements de fournisseurs, offrir une expérience d’achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.
LES EQUIPES
Les équipes techniques et produits, regroupées sous la bannière de notre division technique, sont réparties entre Paris et Bordeaux. Travaillant en étroite collaboration, elles s’attaquent aux problématiques clients en relevant divers défis liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie.
Opérant en mode agile, ces équipes sont organisées en Squads. Chaque Squad se concentre sur un périmètre fonctionnel spécifique pour concevoir et réaliser de nouvelles fonctionnalités, leurs évolutions et des APIs en utilisant une architecture en micro-services. Les équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support apportent leur expertise et garantissent la cohérence de l’ensemble des produits.
LE POSTE
La solution SaaS de notre client est le moteur derrière les marketplaces des plus grands e-commerçants à travers le monde. Elle gère et produit de grands volumes de données, ce qui présente des défis passionnants pour les experts en données (produits, commandes, clients, stocks, prix, messages, appels API, données de navigation, séries temporelles, données géolocalisées, etc.).
Voici quelques sujets actuels et futurs sur lesquels l’équipe Data Science travaille :
– Enrichissement des données produit à partir des images et des descriptions.
– Modération automatique des produits.
– Mapping automatique des données produit.
– Identification des produits à fort potentiel.
– Détection de comportements frauduleux.
– Analyse de sentiments dans les messages échangés entre clients et vendeurs.
– Détermination de prix optimaux.
– Monitoring de la qualité de service des vendeurs.
– Applications d’inférence synchrones de nos modèles de ML.
En tant que Data Engineer (Senior) au sein de l’équipe Data, vos principales missions consisteront à :
– Contribuer à l’enrichissement de la plateforme de données (ETL).
– Améliorer la robustesse des pipelines de production pour les applications de –
– Machine Learning (inférence en temps réel, etc.).
– Intégré(e) dans une équipe de spécialistes en données (data engineers, machine – learning engineers, data scientists, data analysts), vous jouerez un rôle clé pour garantir la position dominante de la solution sur son marché.
STACK ET OUTILS
Technologies : Apache Spark, Kafka, AWS, Databricks, Python, Airflow, Mlflow, TensorFlow, Delta Lake, Superset, Kubernetes, Redshift, SQL, Terraform, Ansible.
Les responsabilités
LES MISSIONS
– Concevoir et implémenter une architecture performante, robuste, scalable et avec des coûts maîtrisés pour les applications Spark ainsi que pour les pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow).
– Accompagner les Data Scientists lors de la mise en production (relecture de code, pair programming) et établir les meilleures pratiques.
– Optimiser et améliorer la CI/CD de l’équipe en collaboration avec l’équipe SRE.
– Assurer la montée en compétences des membres de l’équipe sur les sujets de MLOps et Data Engineering.
– Explorer les meilleures façons d’intégrer les données Google Analytics dans la plateforme de données.
– Partager vos connaissances et présenter les travaux devant toutes les équipes techniques.
Profil Recherché
– Vous avez au moins 4 ans d’expérience dans un environnement Machine Learning et/ou Data.
– Vous êtes passionné(e) par les données et les technologies modernes permettant d’en exploiter le potentiel.
– Vous vous intéressez à la data science et avez des connaissances générales sur les algorithmes de Machine Learning.
– Vous avez un background en développement et avez évolué dans un environnement Data.
– Vous avez mis en production avec succès des applications Big Data utilisant le Machine Learning, le NLP ou le traitement d’images, dans des projets d’envergure à fort volume de données.
– Vous maîtrisez Python, les frameworks data de la fondation Apache, et vous êtes à l’aise dans un environnement AWS.
– Vous maîtrisez au moins un outil d’orchestration (Airflow, Data Pipeline ou tout autre outil similaire).
– Vous savez présenter vos travaux de manière simple et accessible.
– Vous avez un bon relationnel et aimez mentorer vos collaborateurs.
– Vous parlez couramment anglais et français.
BONUS POUR CE POSTE
– Expérience significative dans le domaine du e-commerce.
– Mise en place d’un Data Lake, Data Warehouse ou d’une Data Platform.
– Déploiement d’applications en environnement Kubernetes.
– Mise en place de pipelines d’ingestion de données avec une approche CDC à l’aide de Debezium ou autre.
– Maîtrise de Java/Scala.