L'intégration des infrastructures de calcul intensif dans les pratiques médicales soulève des enjeux inédits en matière de conformité, de sécurité et de robustesse opérationnelle. Dans le cadre de nos activités de génétique médicale hospitalière, nous avons structuré une chaîne de traitement bioinformatique reposant sur un mésocentre régional certifié HDS (Hébergement de Données de Santé) : le MesoBFC hébergé au sein du green datacenter de l'Université de Bourgogne Europe à Dijon, afin de répondre aux exigences réglementaires du secteur tout en assurant une capacité d'analyse suffisante pour le traitement de plusieurs centaines de génomes par mois.
Notre retour d'expérience couvre l'ensemble du cycle d'analyse : récupération et intégration des données brutes issues du séquençage NGS, traitements alignement-annotation-variant calling, stockage intermédiaire, et restitution vers les LIMS hospitaliers. L'utilisation du mésocentre nous a permis de mutualiser les ressources de calcul tout en maintenant un cloisonnement strict des données, conforme au RGPD et aux obligations HDS.
Nous détaillerons les contraintes techniques spécifiques imposées par le cadre médical : traçabilité, auditabilité, haute disponibilité, politique de sauvegarde, segmentation réseau, cloisonnement des comptes utilisateurs, etc. Nous présenterons également les adaptations nécessaires du pipeline bioinformatique standard à cet environnement : compatibilité SLURM, gestion des erreurs, automatisation, reprise, monitoring.
Sur le plan opérationnel, nous avons observé une réduction significative des délais d'analyse par rapport à des solutions on-premise, avec un meilleur suivi des métriques de performance. Le mésocentre a également offert une souplesse dans l'évolution des besoins de stockage, passant d'environ 100 To initiaux à plus de 400 To en moins de 18 mois, de solutions d'archivage de données à forte volumétrie (> 2 Po), ainsi que la mise à disposition de moyens de calculs innovants tels que des GPU H100 (Nvidia) permettant l'accélération de certaines parties de l'analyse bioinformatique d'un facteur de plus de 60.
Enfin, nous évoquerons les perspectives à moyen terme qui permettront de faciliter l'interopérabilité des analyses et le partage contrôlé de données entre établissements, la portabilité accrue des workflows via l'usage de conteneurs (Singularity/Apptainer) et de standards comme Snakemake ou Nextflow, permettant une meilleure reproductibilité et une adaptation rapide à l'évolution des logiciels et des normes. La future intégration d'outils d'intelligence artificielle ou d'apprentissage automatique dans les étapes de tri et de priorisation des variants pathogènes figure également parmi les axes de développement envisagés, avec l'objectif d'augmenter la pertinence clinique tout en réduisant la charge d'interprétation humaine.
Ce retour d'expérience illustre concrètement comment une infrastructure académique mutualisée peut répondre aux exigences les plus strictes du secteur médical, tout en garantissant une efficience technique, financière et humaine. Ce résumé est relié au résumé « Certification ISO-27001 & HDS du mésocentre Bourgogne-Franche-Comté » déposé par Didier Rebeix.
- Poster