Développeur Python H/F

E-santé

Freelance | Septembre 2023 | TJM Selon Profil | Paris | 3 jours sur site

AzurePythonSpark

 

  L’entreprise

Cette entreprise met à disposition une plateforme qui permet d’accéder de manière facilitée, unifiée, transparente et sécurisée à un catalogue de
bases de données de santé françaises.
Comment ?
L’entreprise a mis en place une plateforme technologique ultra performante permettant aux porteurs de projets d’intérêt public de
– mobiliser des sources de données très volumineuses,
– les croiser entre elles,
– utiliser une puissance de calcul assez grande pour faire tourner des algorithmes de recherche complexes.
En résumé, avec cette entreprise, vous accompagnerez des porteurs de projets ambitieux qui contribuent à trouver les solutions de demain pour améliorer la santé de tous les citoyens.

  La Mission

Au sein de la Direction Technique et en lien avec le pôle  Gestion des données  , vous serez le(la) principal(e) impliqué(e) dans la création d’une bibliothèque Python / PySpark qui sera intégrée dans la plateforme d’analyse de données (plateforme sur le cloud Azure) du projet.

 

En pratique, cette librairie sera utilisée au cœur des actions liées à la gouvernance des données (description/documentation des données, vérification de la conformité, de l’intégrité et de la confidentialité des données ingérées sur la plateforme).

Elle devra répondre aux caractéristiques suivantes :

● Fonctionner sur des données particulièrement volumineuses ( 10 To) et diverses

(CSV, JSON, images JPEG, des fichiers DICOM, textes libres, etc.) ;

● S’intégrer dans une pipeline d’ingestion automatisée dans la plateforme cloud du

Health Data Hub, par exemple grâce à un ordonnanceur à définir (e.g., Airflow) –

cette logique sera à concevoir en collaboration avec l’équipe technique de la plateforme ;

● Être utilisable et configurable par l’équipe interne de data custodian/engineers (aussi

appelée équipe référents données) pour répondre aux spécificités des données ingérées.

 

Vos missions seront les suivantes :

● Etablir ou challenger le cahier des charges,

● Rédiger les spécifications techniques,

● Définir l’architecture de la librairie,

● Développer, documenter, tester et maintenir ces librairies en s’appuyant sur des

pratiques de développement à l’état de l’art,

● Optimiser le traitement de jeux de données de grande taille (plusieurs téraoctets)

pour minimiser les coûts et délais de traitement,

● Adapter les librairies pour permettre le traitement de données diverses

(comptes-rendus médicaux, images d’IRM, bases hospitalières, bases nationales),

● Mentorer des profils développeurs moins expérimentés,

● Collaborer avec les équipes Produit, de la Direction Technique et de la Direction des

données en suivant la méthodologie agile (scrum ou kanban) (gestion d’un backlog,

rituels, etc.),

 

 

  Profil recherché

 

Compétences techniques

● Maîtrise du langage python3 avec 3 à 6 ans d’expérience en développement backend

python, permettant d’avoir une connaissance approfondie du langage, y compris ses

fonctionnalités avancées, ses bibliothèques standard et ses meilleures pratiques,

● Architecture logicielle : comprendre les principes de conception logicielle tels que les

designs patterns, l’organisation du code en modules réutilisables et la mise en œuvre

de bonnes pratiques d’architecture,

● Performances et optimisations : Savoir identifier les goulots d’étranglement et les

problèmes de performances dans le code Python, et être capable d’optimiser le code

pour améliorer ses performances,

● Tests unitaires et CI/CD : Être autonome dans l’écriture de tests unitaires robustes

pour assurer la qualité du code et intégrer des pratiques d’intégration et déploiement

continu (eg. pytest),

● Traitement des données :

○ Avoir des compétences en manipulation de données, y compris l’utilisation de

bibliothèques telles que NumPy, Pandas, (Py)Spark pour l’analyse et le

traitement de données volumineuses,

○ Connaissance du fonctionnement d’un ordonnanceur (eg. Airflow),

○ Maîtrise dans un environnement cloud de l’utlisation du stockage objet (eg. AWS S3 ou Azure Blob Storage),

● Maîtrise des principes agiles,

 

 

Compétences personnelles et relationnelles

● Vous êtes force de proposition tant sur des sujets techniques que sur des

améliorations organisationnelle,

● Pédagogue,

● En capacité à donner et recevoir des feedbacks constructifs,

● Vous prenez du plaisir à produire du code propre et des architectures solides et

performantes,

● Vous êtes exigeant(e) et rigoureux(se),

 

● Curieux(se) 

 

     

    Pierre Verbal

    06 31 75 65 92