Renseigner la destination des données

Hello,

En me baladant sur le site de Telabotanica (le réseau francophone des botanistes) qui produit de très nombreuses bases de données botaniques ouvertes, j’ai été intrigué de voir ce formulaire sur la page des téléchargements qui propose aux visiteurs d’indiquer l’usage prévue des données :

Je précise que c’est facultatif pour accéder aux données. Je trouve que c’est une initiative très intéressante, les producteurs des données ouvertes disposent toujours de très peu d’informations sur les usages. @CharlesNepote a longtemps plaidé dans Open Data Impact pour qu’on expérimente ce genre de dispositif facultatif pour comprendre les usages.

Est-ce que vous avez connaissance d’autres initiatives similaires ? Des organisations partantes ont-elles déjà expérimenté un tel dispositif ? Ou sont partantes pour le faire ?

6 J'aimes

Bonjour,

Il s’agit là d’une question essentielle.

Avoir un retour sur la réutilisation effective des données mises en Open Data est primordial pour maintenir la dynamique : la seule bonne volonté aveugle ne peux pas tenir dans le temps. C’est particulièrement vrai pour les administrations et les collectivités où la diffusion en Open Data est perçue comme une contrainte réglementaire.

La plateforme data.gouv.fr permet d’ailleurs aux réutilisateurs de déclarer une réutilisation des données, afin de valoriser la démarche : https://www.data.gouv.fr/fr/reuses/. Est-ce suffisant ?

Peux-t-on se satisfaire de démarches basées uniquement sur la bonne volonté des ré-utilisateurs ? Cela risque de rouvrir le débat des initiatives nécessitants l’identification et l’authentification pour accéder aux données…

La difficulté avec le recensement des réutilisations sur data.gouv.fr c’est que ça suppose qu’elle soit publique. Or, beaucoup de réutilisations sont faites en interne ou pour des expérimentations qui ne sont pas publiques. Dans d’autres cas, les réutilisations ne sont pas finalisées donc difficile de les rendre visibles.

Par ailleurs, les usages les plus visibles ne sont pas forcément les plus utiles. J’ai vu récemment qu’Open Food Facts se réjouissait de l’usage de leurs données par l’équipe en charge de l’étude Nutrinet et que cet usage peu visible aurait probablement un impact bien plus grand que les applications de scan très médiatisées.

L’utilisation de la base Open Food Facts par les équipes de recherche est moins visible et médiatisée que l’utilisation par des millions de personnes des applications nutritionnelles qui se basent sur nos données, mais c’est très probablement celle qui à long terme aura le plus d’impact sur la santé de tous (y compris celle de toutes les personnes qui n’utilisent pas d’applis).
https://fr.blog.openfoodfacts.org/news/participez-a-l-etude-nutrinet-sante-pour-faire-avancer-la-recherche-en-nutrition

J’aime bien dans cette idée le caractère facultatif : pas besoin de s’enregistrer donc ça ne crée pas de barrière à l’entrée.On propose à l’usager d’informer le producteur de son usage afin d’adapter au mieux l’offre à la demande et de rendre visible que l’ouverture était utile, a servi à qqun pour des usages précis.

Cela crée aussi un lien entre le producteur et le réutilisateur.

J’aimerai savoir qui utilise des données que je publie ou republie après amélioration.
Cela me permettrait d’informer d’un futur changement… car actuellement j’ai des retours quand quelque chose est cassé, rarement dans les autres cas plus nombreux (enfin j’espère).

Bien sûr le côté facultatif est à conserver car il est dans la logique du libre.

1 J'aime

Bonjour,

Je trouve, souvent, que les réutilisations, telles qu’apparaissant dans data.gouv.fr ou d’autres portails sont souvent associées à une haute technicité. Finalement, on ne connaît que les usages pointus techniquement, alors que ce ne sont pas forcément les plus représentatifs. Les usages les plus simples peuvent être très intéressants, voire inspirants à connaître, mais ils ne sont pas forcément connus.

Je serais aussi en faveur de l’intégration dans les portails OpenData d’un formulaire assez simple associé au téléchargement des données, mais aussi post-téléchargement, permettant de connaître les usages associés à la donnée. On pourrait à partir de ça imaginer pouvoir rechercher des jeux de données ayant été utilisés pour un usage donné. Aussi, réaliser des stats par usages de la data, voire des analyses spatiales des usages de l’OpenData qui pourraient renseigner sur les problématiques territoriales les plus prégnantes.

Si l’on pouvait connaître la qualité ressentie par l’utilisateur (voire même mesurée) pour un usage établi de la donnée, nous pourrions alors savoir si la donnée paraît adaptée à l’usage que l’on souhaiterait en faire.

Juste pour info, il existe un standard pour collecter l’usage en même temps que la qualité. C’est le GUF (Geospatial User Feedback) de l’opengeospatial

Un exemple d’implémentation ici

2 J'aimes