Pour un référentiel de l'open data 🇫🇷

multi (anciennement Jailbreak) apporte depuis ses débuts un soutien technique aux travaux d’OpenDataFrance sur l’Observatoire open data des territoires. Ceux-ci nous semblent d’utilité publique afin d’avoir un état des lieux de l’ouverture des données en France et connaître d’année en année l’évolution des collectivités qui ont déjà ouvert des données, conformément à la loi République numérique.

image

La cartographie réalisée par multi avec Datami vous permet d’explorer les données de l’Observatoire.

Dans le sillon de l’édition 2022 de l’Observatoire qui vient d’être publiée, nous mettons aujourd’hui à disposition la première version du fichier des organisations soumises à l’obligation d’ouverture des données, voulu comme un référentiel de l’open data français que nous proposons de construire avec la communauté.

Miroir et complémentaire de l’Observatoire, il se concentre pour l’instant exclusivement sur les organisations territoriales : communes, départements, régions, intercommunalités et autres organisations chargées par celles-ci d’une mission de service public.

22 845 organisations concernées par l’obligation sont recensées, dont 683 la respectent déjà et sont cartographiées par l’Observatoire.

Pour aller plus loin, nous mettons à disposition un outil pour analyser ces données. L’outil d’Etalab vous permettra lui de les explorer.

image

A ce stade il s’agit d’un travail avant tout exploratoire et nous avons conscience des limites actuelles de notre méthodologie. Tout d’abord, il s’agirait d’élargir le périmètre au-delà des organisations des « territoires » pour ajouter toutes les unités légales correspondant à l’Etat (ministères, administrations centrales, services déconcentrés…) afin d’espérer se rapprocher de l’exhaustivité d’un « référentiel ». Une autre faiblesse réside dans le fait de s’appuyer principalement sur la base Sirene et en particulier sur ses catégories juridiques. En effet, faute de recensement des organisations « chargées d’une mission de service public » au sens du CRPA, nous avons supposé que certaines catégories juridiques correspondaient à des organisations qui entraient dans cette définition (liste des catégories juridiques prises en compte dans le référentiel). Des exceptions plus ou moins nombreuses existent certainement. Pour le critère des 50 ETP on utilise les tranches effectifs de la base Sirene, réputées mal renseignées (même si c’est censé s’améliorer bientôt !). Le critère de population mériterait aussi d’être mieux pris en compte.

Cependant un tél référentiel nous paraît utile pour comprendre les problématiques liées au respect de l’obligation d’ouvertes des données et, in fine, mieux accompagner les acteurs vers l’open data. Aurait-il selon vous sa place dans le service public de la donnée ?

Tous les commentaires, signalements d’anomalie et suggestions d’amélioration seront les bienvenus ! :heart:

Et nous vous proposons de venir en discuter avec nous lors de notre prochain café multi-facettes, mercredi prochain 12 avril de 13h30 à 14h. :coffee:

5 « J'aime »

Waow, génial ! Ca va de mon côté grandement faciliter la recherche des collectivités qui gagneraient à être accompagnées dans l’ouverture des données. Pour celles qui n’en feraient pas parties, bien qu’ayant déjà ouvert des données (plateforme open data ad hoc, mauvais référencement sur data.gouv, etc.), est-ce qu’il est prévu un worflow pour demander à intégrer le référentiel en tant que collectivité « conforme aux obligations d’ouverture » ?

L’usage que je vois est justement de pouvoir montrer aux collectivités qui sont en train de se lancer, que leurs efforts vont avoir un résultat concret (et politiquement valorisable) : intégrer le référentiel open data français. Un élu pourrait tout à fait dire/écrire :

Grâce au travail acharné de toutes les équipes de la collectivité, nous avons intégré le référentiel open data français et sommes désormais reconnus comme une « collectivité conforme aux obligations l’ouverture des données »

On pourra réflechir après à faire fabriquer des panneaux « conforme à l’obligation d’open data » que les communes afficheront fièrement à côté de « ville internet @@@ » et « ville de vélo :biking_woman: »

2 « J'aime »

est-ce qu’il est prévu un worflow pour demander à intégrer le référentiel en tant que collectivité « conforme aux obligations d’ouverture » ?

Le recensement des organisations qui ouvrent leurs données se fait dans l’Observatoire open data des territoires sur une table Airtable. OpenDataFrance propose pour l’instant un formulaire pour y contribuer.

On compte 1183 organisations recensées par OpenDataFrance dont seulement 683 sont présentes dans notre référentiel, ce qui signifie à priori que 500 (près de la moitié !) ont déjà ouvert leur données sans être pourtant soumises à l’obligation. Il serait intéressant d’analyser ce phénomène s’il est avéré.

Définir ce que signifie objectivement « ouvrir ses données » serait pertinent aussi, quand on voit par exemple que 11 825 communes sont couvertes par la Base adresses locales, devenue une véritable infrastructure de données, qui plus est locales, qui est aujourd’hui je crois bien souvent la première occasion pour les communes de produire, et ouvrir, des données. Peut-on considérer que toutes les communes dont les adresses sont dans la BAL « font de l’open data » ? A priori, c’est plus compliqué. C’est un indicateur cependant, un premier palier à franchir, qui doit ensuite se confirmer en suivant d’autres étapes peut-être plus complexes. Délibérations, subventions, budgets, marchés publics… bref : c’est le Socle commun des données locales qui préfigurait en fait ce « label open data » à plusieurs niveaux dont tu parles ici Arthur.

Bonsoir Johan
Merci d’avoir ouvert ce sujet, qui revêt de multiples facettes en réalité et qui touche de nombreux acteurs pour différentes raisons.

Ce passage est un symptôme d’une mauvaise pratique, légitime certes, mais mauvaise.
Nous parlons du déploiement d’un processus qui n’a pas encore 10 ans et pour lequel nous sommes tenus de tenir une double, voire triple comptabilité des participants. Ce n’est pas normal d’avoir à reconstituer des tables d’organisations et autres joyeusetés à ce stade. Je salue également @loichay qui s’y est adonné à de nombreuses reprises.
Il s’agit plutôt de méta-données qui devraient être présentes directement dans les organisations data.gouv ou de toute autre plateforme pour les confronter à Banatic, Sirene.

Les collectivités ont un SIRET, des identifiants INSEE de multiples natures. Elles devraient être saisies sur la plateforme sur laquelle les données sont publiées, de sorte à pouvoir établir un lien irréfutable et surtout de ne pas en oublier lors du recensement.

Bien sûr je sais qu’individuellement nous ne sommes pas responsables de cet état de fait et que chacun fait avec les moyens dont il dispose.
L’écosystème entier devrait s’accorder sur ce constat et cesser de passer du temps à compter les organisations. Nous avons beaucoup mieux à faire.
Ne serait-ce que parce que quelques collectivités ont plusieurs organisations différentes, pour différentes directions, etc…

Certes ma réponse est dure au regard du travail exceptionnel que tu nous présentes. Il est d’utilité publique. Nous devons avant tout cibler les étapes qui nous coûtent du temps.
Il me semble extrêmement urgent de relancer l’intégration des méta-données aux organisations des plateformes de données de ce point de vue. On en a besoin pour hier.

Avant d’aller plus loin dans la direction salutaire de ce référentiel, je nous suggère à toutes et tous de demander ces évolutions sur data.gouv et consorts.

Bonne soirée

5 « J'aime »