Interopérabilité et standards

Bonjour,

Je travaille depuis plusieurs années sur la question de l’interopérabilité (insuffisantes) des données environnementales (voir partage GitHub ici) et je souhaite pouvoir valider les solutions proposées (standardisation et connecteurs).

Auriez-vous connaissance de groupe de travail qui pourraient être intéressés par ce sujet ou bien d’exemples représentatifs / cas tests sur lesquels je pourrai m’investir ?

Merci d’avance et bonne journée

→ Pour mieux comprendre mes travaux, je vous joins ci-dessous l’introduction du document de synthèse établi (document ici).

Introduction

Données environnementales

Le Conseil National du Numérique dans son avis de juillet 2020 intitulé « Faire des données environnementales des données d’intérêt général » définit les données environnementales de la façon suivante :

« Les données environnementales peuvent être définies de manière extensive comme toute donnée, par nature ou par destination, relative à l’environnement, à son état et/ou à ses flux d’interaction. Cette définition présente l’avantage de pouvoir qualifier plusieurs types de données – à l’instar des données agricoles, des données naturalistes ou des données relatives à la mobilité – comme des données environnementales. »

« L’interopérabilité et la qualité des données, ainsi que leurs structure authenticité et intégrité, sont essentielles pour le partage des données d’intérêt général. Dès lors, le régime d’ouverture des données d’intérêt général implique la prise en compte de la lisibilité et l’interopérabilité des formats et des données. »

Cette définition donne un cadre étendu à la notion de données environnementales.

Contexte

On constate une grande diversité de solutions traitant de données environnementales et paradoxalement, l’interopérabilité entre ces solutions reste très faible, ce qui oblige à mettre en œuvre des interfaces spécifiques et conduit à dénaturer les données d’origine par des retraitements successifs.

Cette absence d’interopérabilité a pour conséquence une absence de solution transversale aussi bien au niveau des cas d’usage (intégration des contextes personnels, familiaux, professionnels, régionaux) qu’au niveau du cycle de vie des données environnementales : (1) de la production des données (acquisition, observation, modélisation), (2) de leur partage (réseaux, stockage), (3) de l’exploitation des informations (restitution, analyse).

La mise en place d’une interopérabilité forte, est conditionnée par :

  • L’existence d’une structure de données unique et partagée (standard)
  • La disponibilité d’outils ouverts d’exploitation de cette structure (connecteurs),

Trois conditions supplémentaires sont nécessaires pour que cette structuration soit adoptée et appliquée :

  • Une mise en œuvre simple et adaptée à chaque besoin,
  • Une construction de « convergence » plutôt que de « remise en cause » de l’existant,
  • Une compatibilité avec la qualification « d’intérêt général » des données environnementales

Attentes

Les données environnementales (y compris mobilité et énergie) sont identifiées comme données « d’intérêt général » et sont donc soumises à une exigence d’interopérabilité croissante.

Le développement des métropoles et plus généralement de systèmes intelligents, plus adaptatifs et efficaces nécessite une gestion technique renforcée s’appuyant sur des données ouvertes de plus en plus nombreuses.

L’accès à une information environnementale localisée, fiable et compréhensible est une demande citoyenne relayée au travers de collectifs toujours plus importants.

Objectifs

Ce document propose une solution d’interopérabilité des données environnementales applicable aussi bien au niveau de données unitaires (ex. émises par un capteur) que de données agrégées à différentes échelles de temps ou d’espace.

Elle permet de :

  • Faciliter l’usage et le partage des données environnementales
  • Optimiser le volume des données échangées
  • Banaliser aussi bien les équipements d’acquisition de données (capteurs) que les applications de traitement,
  • Mettre en œuvre une architecture logicielle remplaçant toutes les opérations de codage/décodage (interfaces) par l’utilisation de connecteurs standards,
  • Respecter et s’appuyer sur les principaux standards existants
  • Partager et développer collectivement un ensemble de connecteurs open-source répondant à toutes les situations (plateforme)

La structure de données proposée s’appuie sur les standards existants qu’elle complète en assurant une convergence.

Cette structure est implémentée au travers de connecteurs utilisables sur toute la chaîne de traitement (du capteur produisant une donnée au système d’analyse et de restitution d’un ensemble de données) incluant les interfaces avec les équipements réseau, les systèmes de calcul et les bases de données.

Les modèles de données et les connecteurs sont partagés et accessibles en open-source (licence Creative Commons BY-SA).

Contenu

Ce document précise le contexte lié aux notions d’interopérabilité appliquées aux données environnementales (chapitre 2).

Il décrit les bénéfices attendus d’une solution sur la base d’exemples de cas d’usage (chapitre 3).

Il présente ensuite les principes mis en œuvre et nécessaires à l’atteinte des objectifs ci-dessus (chapitre 4 et 5) et en particulier :

  • la structure de données permettant de prendre en compte les différentes données environnementales définies,
  • les opérations de traitement sur ces structures (création, formatage, assemblage, extraction),
  • les formats d’échanges (fichiers, textuels, binaires),
  • les connecteurs pour les interfaces (réseaux, stockage, visualisation, traitement)

Il présente enfin quelques exemples et principes de mise en œuvre.

3 Likes

Bonjour, côté biodiv les travaux GBIF et Darwin Core sont remarquables.

1 Like