Chez Etalab, nous avons consolidé une liste de cas d’usage du service public de la donnée, que nous aimerions proposer sous la forme d’un tableau qui s’apparenterait au suivant. Voir le tableau
Celui-ci est amené à évoluer et nous sommes donc très preneurs de vos retours, notamment sur :
Merci, c’est très intéressant comme démarche ! Vous partez d’une liste de jeux de données de base encore réduite, j’imagine qu’elle est en réalité plus étendue dans votre esprit ? Par exemple citer le COG comme base de réutilisation pour l’Observatoire des territoires semble un peu réducteur, tant cet observatoire mobilise de sources multiples, issues du SPD.
Il est en effet accessible uniquement à des utilisateurs Airtable identifiés Il faudrait partager cette vue par un lien (create a shareable grid view link) @thanh-ha.le et ce d’autant plus qu’il existe déjà : Airtable - Grid view
Pour aller plus loin dans le recensement collaboratif des cas d’usage des données du SPD, envisagez-vous d’ouvrir ce tableau aux contributions ?
Le COG par exemple, déjà réutilisé par tous les autres jeux de données du SPD (sauf ROME).
Je vois très peu de réutilisations internes de l’administration, or elles sont bien plus nombreuses.
Le COG intégré au RNIPP (le numéro de sécu), qui doit aussi être présent à de très nombreux endroits.
Les identifiants SIREN/SIRET provenant de SIRENE par exemple, sont d’usage prioritaire (mais malheureusement pas obligatoire) pour identifier toute entreprise… on doit donc avoir un cas d’usage de SIRENE dans toute administration en lien avec des entreprises…
En fait, je ne comprends pas le but de ce tableau. Quel est-il ?
Ce qui me semblerait surtout pertinent, c’est de savoir qui utilise les identifiants des jeux de référence, car l’enjeu de ces jeux de données c’est ce pivot qu’il constituent.
OpenStreetMap utilise à minima: COG, PCI, SIRENE, RPG, RGE.
Sur le contenu du tableau quelques éléments de contexte :
L’objectif premier est de lister quelques cas d’usages du SPD et de les developer dans une approche éditoriale pour exemplifier l’importance de l’ouverture. L’incarnation a des limites pour des jeux de référence mais présente aussi certaines vertus pédagogique. Il s’agit de fournir aux acteurs des exemples concrets de l’utilité de l’ouverture.
Dans ce travail de référencement, nous avons pu lister un certains nombres d’usages et il nous semble intéressant de partager également cette « externalité négative ».
Pour ce qui est de l’ouverture du tableau à la contribution c’est un point interessant mais il nous semble, à priori, qu’il n’est pas opportun de créer une catégorie différente des réutilisations qui ont pour vocation de constituer un catalogue des usages.
De quels acteurs s’agit-il ? Des producteurs de ces jeux de référence essentiels ?
Je ne comprends vraiment pas la démarche. J’ai même l’impression que c’est la notion même de données de référence/pivot qui a été perdue, du pourquoi on a créé ce régime particulier à l’occasion de la Loi Lemaire, des travaux initiaux de réflexion en prenant modèle sur les Basic data danoises.
Bonjour Christian,
Peut être me suis-je mal exprimé.
Cette mission ne remet en aucune façon l’importance primordiale de données de référence et il ne s’agit pas de dire que ces exemples sont exhaustifs et représentent les usages du SPD.
Par acteurs j’entends ici :
Les producteurs de données, en particulier les producteurs novices qui ont souvent du mal à se figurer quels peuvent être les usages des données ouvertes.
Les producteurs du SPD sont aussi une des cibles. Selon les producteurs le niveau d’intérêt et de connaissance des usages est variable.
Les réutilisateurs novices qui peuvent s’inspirer des cas d’usages pour se lancer et référencer leur travaux.
Quiconque veut comprendre l’open data.
Les professionnels de l’open data que ce soit dans les administrations centrales et locales qui sont souvent en manque de cas usages pour argumenter l’importance de l’ouverture et convaincre.
Je ne pense pas dans ce cas qu’on puisse faire un parallèle entre un jeu de données lambda et un jeu de référence national. Ces jeux de données de référence sont vraiment à part, parfois même d’usage obligatoire (le SIRET/SIREN de SIRENE est un bon exemple).
On avait appelé ça « la pyramide de Chignard »… les 10 jeux de référence (SPD), les 100 jeux majeurs, les 1000 jeux à connaître…
Inciter les producteurs du bas de la pyramide en leur montrant le haut ne me semble pas pertinent car ils ne se reconnaîtront sûrement pas. Il me semble par exemple impossible de faire une comparaison entre les usages de la base SIRENE et le registre des co-propriétés.
Là non plus je ne comprends pas.
Ces producteurs se sont engagés à produire ces données et les diffuser.
Cela fait l’objet d’une loi, d’un décret et d’un arrêté.
L’amélioration nécessaire pour ces acteurs, c’est de sortir justement d’une logique « d’ouverture » d’une donnée qui historiquement était souvent une donnée métier et d’aller vers une vraie logique le producteur de référentiel où le producteur peut aussi avoir un usage métier, mais qui devrait presque passer au second plan et ne pas impacter la partie référentielle.
Tout à fait d’accord là dessus. Les cas d’usage du SPD font en cela plutôt office d’exemple « parfait ». Il faut enrichir les exemples par d’autres cas d’usages sur d’autres types de données.
Nous avons menés des entretiens avec les producteurs du SPD. En fonction de la maturité et des moyens la mesure des usages passe souvent en second plan. Ces cas d’usages ont vocation a démontrer l’intérêt de leur ouverture. A moyen terme il s’agit aussi pour nous de fournir d’avantage de ressources méthodologique et pratique pour mesurer les usages.
On ne cherche en aucun cas à remettre en question la logique de référentielle ou encore la posture agnostique sur l’usage des données.
J’ai l’impression que c’est une grande préoccupation actuelle des directions de l’Etat de montrer aux services producteurs quelle utilisation est fait de leurs données pour montrer qu’ils ne le font pas « pour rien »
J’ai justement eu une visio avec la DGFIP il y a quelques semaines dans cet optique sur ma réutilisation de leurs données avec un angle « a permis de se créer son activité indépendante » en permettant la « création d’une application » à destination des collectivités et autres organismes du service public local et complémentaire de celles déjà proposées par la DGFIP.
Réflexion annexe sur la com° autour des cas d’usage : De manière général, j’ai tout de même l’impression que souvent, les cas d’usage qui intéressent le plus sont surtout ceux qui font émerger des initiatives « citoyennes et/ou ouvertes » plutôt que des réutilisations « à but lucratif » car l’histoire est sûrement plus belle à raconter. Alors que je pense qu’il y a au moins autant sinon plus de réutilisations « non visibles » dans un usage d’enrichissement de services pro et « générateur de business ». Peut-être parce que le public n’est pas forcément fan de l’histoire racontant que son travail permette au secteur privé de « gagner de l’argent ». Peut-être aussi parce que beaucoup de ces ré-utilisateurs « à but lucratif » n’assument pas toujours de communiquer sur le fait qu’ils facturent des prestations basées sur la réutilisation de données gratuites librement disponibles.