Open Data impact #1 : formulation des défis de l'open data [compte-rendu]


(Charles Nepote) #1

Un des ateliers de la journée Open Data impact #1, animé par Simon Chignard et Hubert Guillaud, a porté sur la production de défis pour améliorer l’impact de l’open data. Les voici présentés ici au complet. Ils ne sont pas figés et on attend vos commentaires pour les enrichir et corriger ! Ils seront la base d’un appel à projet lancé dans les prochaines semaines.

Les défis ont été découpés par thèmes et débutent par une série de mots-clés, suivis de l’expression du défi et d’une éventuelle reformulation a posteriori.

1. Défi producteur
#engagement #obligation #envie #valorisation #réglementation #bénéfice #stratégie #feedback #coopération #capacité et motivation (OSM, OFF) #Produire <> diffuser #Besoin d’engagement durable #Processus de production et d’automatisation.

Comment inciter les producteurs à s’engager, autrement que par la contrainte ?

2. Défi réutilisabilité
#favoriser #normalisation #documentation #médiation #qualité #contenu #engagement #trouvabilité #reliabilité

Rendre les jeux de données vraiment réutilisables.

3. Défi réutilisation
#connaître #on s’interdit de demander car frein à la réutilisation # complexité vs utilisation #mesurer les impacts #collaboration #impact éco/pol #incitation #acteurs-privés #coopération publique

Tracer la réutilisation sans l’entraver !
Se donner des métriques pertinentes !

Commentaire de la Fing a posteriori :

“Tracer la réutilisation sans l’entraver !” est un défi intéressant car il touche à un des dogmes de l’open data : tracer les usages contribuerait à les entraver. Cependant, la réutilisation étant la matière première de l’impact de l’open data, peut-on la résumer à la traçabilité et la mesure ?

4. Défi publics
#élargir ou pas ? #publics éloignés #à quoi ça répond ? #médiation #adresser différents publics #besoins #problématiques #engagement #différents publics #usages #autres demandes

Partir des usages pour répondre à la demande.
Open data tiré par la demande.
(C’est compliqué.)

Reformulation de pure forme :

Pour un open data tiré par la demande !

5. Défi littératie ou généralisation (relié aux publics et aux interfaces)
#vocabulaire #vulgarisation #données ouvertes vs open data #données numériques vs open/big/self

Formulation a posteriori

Les données ouvertes, pilier de la ville intelligente, enfin expliquées et expérimentées par le plus grand nombre : indifférents, curieux, amateurs et professionnels de tous bords et de tous âges

6. Défi interfaces
#accessibilité (à qui ?) #fin des portails #sortir les données des données #dataviz

Quitter les données pour l’information.
Open data sans plateforme, ni application.

Proposition de reformulation :

Expérimenter d’autres formes d’open data : open data sans plateforme ni application, quitter les données pour l’information, etc.

7. Défi irritants / politique
#politiquement/socialement/économiquement sensible #pourquoi ouvrir #données inoffensives #objectivité vs subjectivité

Pour un open data qui ne soit pas inoffensif !
Pour un scandale de l’open data !

Vu sous un angle plus politique :
#communs #droite/gauche #… données # effets de transparence #performance #gouvernance #désaccords et débats

Comment remettre de la politique dans l’open data ?

Reformulation :

Des données qui grattent : pour un open data qui ne soit pas inoffensif !

Trois autres défis ont été proposé mais sans être approfondis, les nous les donnons ici.

Défi “open”
#ce qui n’est pas ouvert #lien avec le reste de l’open #dépossession

Défi traitements
#frontières #algorithmes #NosSystèmes

Défi “marche arrière” (comment l’éviter)
#effets cliquets #la fin de l’open de l’open data #administration trump


Benchmark des softwares/portails Open Data
Open Data impact #1 : premières propositions pour 3 défis
(Joël Gombin) #2

C’est stimulant, je suis curieux de savoir ce que ça pourrait bien signifier concrètement !


(Samuel Goëta) #3

Est-ce que le défi 3 inclut la création d’emplois ou le développement économique à partir des données ouvertes ? C’est selon moi le domaine dans lequel les promesses (et parfois les déceptions) ont été les plus fortes.
Je rajoute un défi très lié à mes recherches sur le travail invisible de l’ouverture des données : peut-on mesurer le temps passé sur l’ouverture d’un jeu de données ? peut-on mieux l’intégrer dans le travail des agents ?


(Charles Nepote) #4

Oui il faut explorer car c’est peut-être des cas limites. Ça pourrait faire l’objet d’un bel atelier le juillet prochain. Plus concrètement voici quelques idées :

  • il y a par exemple l’open data diffus où les jeux des données sont publiés là où ils rencontrent le mieux leur public et pas sur une plateforme ; exemple : les jeux de données sur les déchets rejoignent la page sur les déchets de la collectivité
  • à la frontière de l’open data et de l’information, il y a l’open de circonstance ou de contexte qui vise à extraire et afficher des données là où elles vont le mieux rencontrer leurs publics ; par exemple, les résultats des élections de ma commune publiés à l’aide d’un petit javascript ; par exemple des données affichées à la main par un concierge dans une entrée d’immeuble (qu’il préalablement reçu par email le matin)
  • il y a l’open data des bots qui republient de la donnée sous une forme à peine habillée (data ou information?) ; exemple le https://twitter.com/Ferry_bote

Etc. Je pense qu’on peu creuser pas mal de cas, toujours guidés par la question de l’impact. Peut-être @schignard aura d’autres idées je crois qu’on avait évoqué ensemble quelques pistes il y a longtemps.


(Bruno Mathis) #5

Défi 1 : motiver les producteurs en faisant d’abord d’eux des consommateurs. Par ex : la cour des comptes pourrait être intéressée par le catalogue open data de Bercy ou de l’INSEE. Les administrations françaises pourraient aussi être intéressées par des sources open data communautaires. Peut-on faire l’inventaire des besoins en données d’administrations qui seraient susceptibles d’être fournis en open data par d’autres administrations?


(Charles Nepote) #6

Oui je suis bien d’accord, c’est pour ça que je trouve le défi formulé un peu réducteur. Je suggérerais une réécriture de la sorte :

Comprendre et développer des réutilisations durables : anticiper, susciter, mesurer, accompagner les usages dans le temps ; dans la recherche, l’enseignement, les affaires, etc.

(Un peu long peut-être, on peut sans doute faire plus percutant.) La question de la mesure actuellement formulée dans le défi 3 est très intéressante mais ça me paraît être un sous-défi (@schignard ?) .

Oui ! C’est vrai qu’il manque un défi sur la production en plus de celui sur les producteurs. La production de données (entendre la publication, l’ouverture) présente de nombreux défis que les producteurs ne peuvent résoudre seuls : les éditeurs de logiciels, les utilisateurs (par le retours), sont partis prenantes de ce sujet de l’open data. Les problèmes sont multiples : temps passé, process d’amélioration, process de retours utilsateurs, etc. Sans travailler ces aspects on risque d’avoir des producteurs démotivés vivant l’open data comme une contrainte, etc., produisant moins de données de moindre qualité et donc moins d’impact pour l’open data !
Du coup je pense qu’il faut élargir ta proposition qui serait un sous-défi d’un défi plus global. Par exemple :

Une ouverture des données plus simple, plus rapide, plus sûre et plus ouverte aux parties prenantes.

Ça me paraît pas mal mais je suis preneur de toute reformulation.


(Charles Nepote) #7

Bien d’accord avec vous Bruno. On a coutume de dire “qu’un bon producteur est un bon réutilisateur” : c’est vrai au niveau individuel mais c’est vrai aussi au niveau des organisations. Je pense que l’open data contribue à acculturer un peu les organisations sur l’existence de données ouvertes, mais ce n’est pas suffisant. Votre proposition de défi me paraît être un bon sous-défi pour ma proposition de défi 3 (réutilisation) dans ma réponse à Samuel :

Comprendre et développer des réutilisations durables : anticiper, susciter, mesurer, accompagner les usages dans le temps ; dans la recherche, l’enseignement, les affaires, etc.

Mais du coup je constate qu’elle est incomplète et qu’il faut y ajouter “dans l’action publique” et pas seulement “dans la recherche, l’enseignement, les affaires, etc.”


(Asselin) #8

En fait plus c’est d’Edition des données dont il s’agit ici;
L’édition de données c’est le processus impliquant la création des métadonnées et l’ajout des ressources complémentaires permettant de replacer ces données brutes dans leur contexte, afin d’en comprendre les raisons pour lesquelles ces données ont été produites.

  • Les producteurs des données ont parfois besoin d’un éditeur de donnée qui va vulgariser et décrire les données pour les rendre accessibles et les sortir du jargon métier.
  • L’édition des donnée peut être exécutée manuellement, ou automatisée ou les deux
  • Les réutilisateurs, peuvent contribuer à donner du sens à ces données publiées, soit en signalant leur réutilisation positive, soit en signalant des erreurs (le plus souvent). Dans les deux cas c’est le fait d’un acte volontaire il faut trouver la manière d’inciter les ré utilisateurs à manifester leur besoin. car c’est avec ces signalements que l’Editeur de donnée peut retourner voir un Producteur et corriger la donnée, la métadonnée, obtenir une mise à jour et valoriser le rôle du producteur