Rapport Marchand-Arvier "Fédérer les acteurs de l’écosystème pour libérer l’utilisation secondaire des données de santé"

J’ai enfin pris le temps de lire le rapport de la mission Marchand-Arvier sur l’utilisation secondaire des données de santé, remis en décembre aux Ministres de l’ESR, de la santé et de l’économie. C’est très instructif sur :

  • les difficultés du Health Data Hub (augmentation de 56 % du délai médian d’accès entre 2020 et 2022, conduisant à des renoncements et des projets qui se détournent du HDH, en raison notamment de l’impossibilité de copier la base principale du SNDS depuis la CNAM vers la plateforme du HDH en raison du choix de MS Azure)
  • le manque d’interopérabilité des données de santé (pas d’API, pas de standardisation des schémas de données)
  • le modèle économiques des entrepôts de données de santé (les redevances perçues ne couvrent et ne couvriront qu’une faible part du coût des bases de données),
  • les difficultés à contractualiser l’accès aux données (il s’écoule en moyenne 53 semaines entre le dépôt de la demande d’un chercheur n’appartenant pas à l’INSERM et la mise à disposition des données de la cohorte Constances)
  • et les « réflexes propriétaires » des producteurs de données qui rechignent à ouvrir largement l’accès aux données (l’AP-HP demande par exemple que tout projet de recherche requérant un accès aux données de son entrepôt soit réalisé en partenariat avec un médecin de l’AP-HP ; et moins de 20% des registres mettent leurs résultats en accès libre).

J’ai développé sur #TeamScienceOuverte ce dernier point.

Rien d’étonnant quand on voit déjà toutes les frictions sur les données qui ne posent aucun problème légal à être ouvertes…

Le coût des bases de données, c’est souvent avant tout un coût lié au choix cloud.

L’avis du Comité de veille et d’anticipation des risques sanitaires (COVARS) du 26 juin 2024 sur le développement, la gouvernance et l’accès aux bases de données de santé humaine en anticipation des crises sanitaires fait les mêmes constats, qu’ils résument ainsi :

Après auditions des acteurs concernés, le COVARS fait les constats suivants :
i) le terme de données de santé est utilisé avec des sens différents selon les acteurs ;
ii) les champs contribuant aux données sur la santé (surveillance, statistique publique, soin, recherche) sont inégalement structurés ;
iii) la gouvernance actuelle des données de santé est centrée sur les aspects techniques, certes importants, mais qui conduisent à reléguer au second plan les objectifs associés à ces données que sont les questions de santé publique, de recherche et d’innovation ;
iv) les principaux acteurs contribuant à la production et à l’analyse des données de santé sont peu coordonnés et leurs rôles pas toujours explicites ;
v) le recueil et l’interconnexion de données de surveillance et du soin utiles pour guider la décision publique, comme les causes d’hospitalisation en réanimation, ou le lien entre génome viral et données cliniques – ne sont pas organisés;
vi) durant la pandémie de la COVID-19, la mise en place de grandes études de recherche, qui se sont révélées informatives, a été lourde, difficile et tardive pour partie en raison de l’absence d’infrastructures préexistantes ;
vii) la surveillance environnementale est peu développée et structurée.