Palmarès des arguments anti open data et comment vous y avez répondu

Bonjour à toutes et tous,

Hier, Datactivist était à Data On Board pour tester l’Open Data Canvas et collecter des demandes de méthodes et outils à intégrer.

Une idée nous a été suggérée à plusieurs reprises : lister les arguments que l’on pouvait entendre qui s’opposent à l’ouverture des données, ou qui justifient l’inaction.

L’objectif serait de récolter ici tous ces arguments, qu’ils soient justifiés, ou au contraire tout à fait irrationnels, et de comprendre comment vous y avez répondu.

  • Quel était l’ensemble de données en question ?

  • Quel était l’argument pour ne pas le publier ?

  • Comment avez-vous contré cet argument / ou avez-vous éprouvé des difficultés pour y répondre ?

Grâce à vos réponses, nous vous proposerons une synthèse : palmarès des arguments, principaux types de données concernés, propositions de contres argumentations… et d’intégrer une composante dédiée dans l’Open Data Canvas.

Merci d’avance pour vos contributions (directement sous ce post) : nous sommes certains que beaucoup d’entre-vous ont des histoires à raconter, et qu’elles seront d’une grande utilité !

6 « J'aime »

Hello,

il y a ce travail qui avait été fait par l’université John Hopkins :
http://labs.centerforgov.org/open-data/addressing-concerns/

J’ai traduit rapidement les 7 arguments :

  1. Quelqu’un remaniera les données pour obtenir des renseignements personnels.
  2. Nos données nous exposeront aux critiques du public et montrerons nos faiblesses.
  3. Les données seront mal interprétées par les utilisateurs finaux.
  4. Nous n’avons pas le temps pour l’ouverture des données, nous sommes assez débordés pour ajouter une autre chose à faire."
  5. Nous pourrions être poursuivis si nous divulguons des informations protégées.
  6. Le coût de maintenir le projet d’open data sera trop élevé.
  7. L’utilisation d’un portail de données ouvert crée un risque de cybersécurité pour nos systèmes d’information internes, les rend vulnérables et mettra nos données en danger.

Ca rejoint pas mal de préoccupations que j’entends régulièrement.

Je rajouterais quand même :

  • « On sait maintenant que l’open data n’a pas tenu ses promesses en matière d’innovation et de transparence. »
  • « On ne risque rien à ne pas ouvrir ses données, pourquoi je le ferais ? »
  • « Mes données ne sont pas de qualité suffisante, il faut que je les retravaille mais la tâche est trop grande. »
  • « Mes données n’intéresseront personne, c’est une perte de temps. »
1 « J'aime »

Bonjour,
L’opendata sans openmodèle c’est comme une boite de légos sans mode d’emploi.

Cas précis de refus d’opendata. :
Le cadastre napoléonien données ouverte et publique.
Nous géoréférençont ces plans sur budget interne.
Demande de publication des plans géoref :
Réponse non car cela va déclencher des conflits.
Compte tenu de la situation foncière de notre région, des imprécisions de correspondance du référentiel actuel et napoléonien, de la non technicité du grand public, il y a un gros risque d’interprétation et d’affirmation par un tiers (erronée) de dire ce terrain est à moi or seuls des pros agréés peuvent trancher cette question.

Autre exemple d’opendata : #DVF
Quand on constate l’utilisation, quand on lit les guides méthodo pour l’utilisation . On s’aperçoit que le producteur de la donnée est très peu bavard, et que tous les gens qui écrivent sur le sujet sont des non spécialistes. Résultat les modèles proposés ne tiennent pas compte des méthodes donc de la qualité de production des données et ils leurs font dire n’importe quoi. Le prix moyen du m² en dehors des copropriétés est une hérésie statistique par exemple.(que veut dire une moyenne pour une population dont la distribution est une Loi de Puissance ?).
OPENDATA OUI Mais :
-sensibilité de la donnée
-MCD
-Fourniture par le producteur du process de fabrication et du contrôle qualité (en gros un ISO-9001 de l’opendata ?)

[Edit] Autre exemple funeste d’opendata, le premier Registre Parcellaire Graphique, couche diffusée sur des sites officiels mais quasi inutilisable car les géométries ne respectent pas les standards ISO (self intersection et autres …). Il ne devrait pas être possible de diffuser une couche opendata si elle ne respecte pas les normes en vigueur.[/Edit]

1 « J'aime »

J’avais écrit cet article sur open data, crises et sécurité où je discute des arguments pour ou contre l’ouverture des données https://inhesj.fr/evenements/tous-les-actualites/open-data-risques-et-crises

2 « J'aime »

Je rajouterais aussi la liste d’Andrew Stott, le papa de l’open data au UK

image

Voir toutes ces présentations https://www.slideshare.net/dirdigeng/presentations

3 « J'aime »

Ne pas oublier les arguments sécuritaires… cas typique des périmètres de protection des points de captage d’eau potable.

La CADA a tranché en faveur de la publication, je ne sais pas si c’est fait.

Sur l’espace aérien on m’oppose aussi des arguments de sécurité aérienne, alors que sans connaitre les limites des espaces aériens, on ne peut pas respecter les règles de sécurité !

Un cas que je tourne en dérision: à propos des places réservées de stationnement, une collectivité ne pouvait pas inclure les emplacements pour les transports de fonds « pour des raisons évidentes de sécurité ». J’ai donc répondu « en effet, on pourrait savoir où se trouvent les banques ». Ils se sont (heureusement) sentis ridicules.

5 « J'aime »

Hello @EtiennePichotDamon ,

Au Royaume-Uni il y a une initiative très intéressante, l’open data bingo. Je te laisse juger par toi même : https://docs.google.com/document/d/1nDtHpnIDTY_G32EMJniXaOGBufjHCCk4VC9WGOf7jK4/edit# .

5 « J'aime »

Une idée nous a été suggérée à plusieurs reprises : lister les arguments que l’on pouvait entendre qui s’opposent à l’ouverture des données, ou qui justifient l’inaction.

Je me dénonce : j’étais parmi les requérants :slight_smile:

+1 avec Christian, les arguments sécuritaires en tout genre sont légions sur tous les sujets d’infrastructures.
D’ailleurs la blitzkrieg c’était parce que les cartes routières étaient à jour, bref.
Dans le domaine de l’eau, sur les bornes à incendie, on m’a opposé deux raisons principales :

  • Les gens pourraient identifier des bornes à incendie à rendre inopérantes avant de mettre le feu volontairement quelque part.
  • Les mêmes gens pourraient injecter des produits divers dans l’eau potable du réseau (sans déconner essayez d’ouvrir à fond de robinet de la cuisine et de souffler dedans).

Dans les deux situations j’invite les exploitants concernés à ne plus peindre les bornes à incendie en rouge bien conscient des risques que nous courrons chaque jour.
Le plus souvent, ces arguments sécuritaires sont l’aveu même d’une faiblesse dans l’infrastructure ou plus simplement de la non pertinence de l’argument plutôt que les dangers apportés par l’opendata.

A la deuxième place c’est le plus classique « les données ne sont pas de qualité/à jour et ne permettraient pas à l’utilisateur de s’y retrouver ».
Dans ce cas c’est inquiétant (et le plus souvent assez faux) : comment font les services qui doivent les utiliser pour bosser aujourd’hui ?

3 « J'aime »

Bonjour,

Entendu lors d’un colloque juridique national, de la bouche d’un avocat bien connu du monde territorial : « je conseille à mes clients de ne pas faire d’open data car il n’y a aucune sanction prévue par la loi. Il faut donner priorité au RGPD pour lequel il y a un risque pénal »

3 « J'aime »

Après contact avec le directeur adjoint de l’ARS locale, confirmation du risque bioterroriste sur les captages eau potable.
Content de voir que le débat compte plusieurs participants, et de nouvelles têtes pour moi =)

Je reste convaincu que l’opendata doit répondre à une norme de qualité et doit être diffusée avec un modèle. J’insiste car il est trop fréquent de voir les utilisateurs se référer à quelques jeux actuels au format shp ou tout autre format « à plat » alors que l’enjeu des années futures est une données ouverte et complexe. La couche 0+ des SIG en 1990 était et reste une donnée complexe. Il va y en avoir d’autre, et chaque jour je constate dans mon travail quotidien la nécessité de faire accompagner la donnée de son modèle et de sa « charte qualité ». Pour caricaturer la donnée ouverte ou non n’est pas synthétisable à un csv.

Dans ce cas, pourquoi ne sont-ils pas gardés en permanence ?

Oui, il y a un risque pour ces captages et il est pire par le non respect des zones de protections aux limites qui sont difficilement accessibles, bien plus que par un fantasme terroriste.

La communicabilité a été confirmée par la CADA: https://www.cada.fr/20180003

La commission estime, comme elle l’a déjà fait dans ses avis n° 20150070 et n° 20152820, qu’eu égard à l’objet et à l’étendue des périmètres de protection des captages d’eau destinée à la consommation humaine, qui ont fait l’objet de publicité dans les conditions prévues par les dispositions rappelées ci-dessus, la protection de la sécurité publique ne s’oppose pas à la communication des données relatives à ces captages et périmètres de protection à toute personne qui en fait la demande, en application de l’article L311-1 du code des relations entre le public et l’administration (CRPA) et des articles L124-1 à L124-8 du code de l’environnement.

1 « J'aime »

En réalité, la vraie question derrière le bingo de l’open data, c’est :

  • Quels arguments pour y faire face ?
  • Exemple :

Que répondre ?

Et les autres, que répondez-vous en général ? Quels sont les arguments qui font mouche, et les autres ? :wink:

1 « J'aime »

Cet avocat a malheureusement raison !

A moins de démontrer un préjudice né de l’inaction de la collectivité par rapport à ses obligations d’opendata, il n’y a pas de sanction prévue (à part le name and shame).

On peut voir le sens de la sanction différemment.
De l’aveu même d’Axelle Lemaire, les enjeux dépassent le besoin de sanction.
On va brûler des ressources qu’on aurait pas pour ouvrir dans des sanctions financières ?

Les pires des sanctions restent tout de même le retard accumulé, la perte d’efficacité et la mauvaise qualité des données dans le giron de leurs propriétaires.
Ce qui n’est pas partagé n’existe pas. Je démonte systématiquement toute tentative de communication sans données publiques associées.
Il faudra relever les défis de la crédibilité et de la prise de compétence en partageant, quoi qu’en disent les avocats.

1 « J'aime »

Qualité de l’opendata : Je viens de charger le RPG 2017 région Corse sur IGNpro, intégration dans postgresql/postgis . Résultat 37 « parcelles_graphiques » en anomalie sur st_isvalidreason() :
« Self-intersection[2165091.60213844 1229577.10992371] »
« Nested shells[2164579.75675565 1249811.62784049] »
« Ring Self-intersection[2228899.80297798 1236992.23091244] »

De qui se moque t on chez IGN ? Cette institution contribue avec des arguments de poids !!

Bonsoir,

Cet argument ne peut être opposé à l’ouverture des données. Je suis d’accord avec vous.

Dans ce cas c’est inquiétant (et le plus souvent assez faux) : comment font les services qui doivent les utiliser pour bosser aujourd’hui ?

En revanche, la qualité et la mise à jour peuvent hélas avoir des conséquences dans l’utilisation par « les services ». Pour exemple le TA annule une partie du PADDUC de Corse sur la base de la cartographie des espaces stratégiques agricoles. Sur le fond certains ESA étaient des lotissements depuis longtemps. Il existait une donnée à jour, une vieille de plus de 12 ans toutes deux en open data.

Sur le fond certains ESA étaient des lotissements depuis longtemps. Il existait une donnée à jour, une vieille de plus de 12 ans toutes deux en open data.

Je ne dis pas que ce n’est pas un défi de le gérer. Ce sont bien souvent des processus complexes à mettre en oeuvre pour faire travailler tout le monde, citoyens et services en harmonie.
En revanche dire que les données ne sont pas de qualité est peu crédible, puisque des gens travaillent avec aujourd’hui.

En revanche dire que les données ne sont pas de qualité est peu crédible

L’exemple des données RPG 2017 que je cite plus bas est effectivement peu crédible, ce jeux de données étant de plus « retravaillé » par un EPA bien connu dans le cadre d’un marché public.

Je rejoins @CecileLG, il serait bon d’avoir davantage des plans de réponse à ces poncifs qu’on retrouve dans le bingo.

la pauvre qualité des données n’empêche probablement pas les gens qui bossent avec de bosser avec, c’est juste qu’ils pourraient peut être répondre mille fois plus vite aux besoins des citoyens. ça ne m’étonnerait pas du tout que la plupart des jeux de données dont disposent les administrations soient réellement de piètre qualité et presque inutilisable. tout est dans le presque, c’est l’occasion d’améliorer tout cela et de répondre a des modèles de données propres.

que donner aux administrations alors comme modèle ? l’ISO-9001 suffit il ?

2 « J'aime »

Bonjour,
Après trente cinq années de code je suis victime de déformation professionnelle et j’ai tendance à voir les choses sous l’angle « object modeling ». :face_with_raised_eyebrow:
ISO ou autre : Objectif : obtenir une traçabilité de la donnée. Méthode de prod en fonction de l’époque.
(saisie manuelle, scan, injection par système info …).
Certification de la données : publique, déclarative (from user), industrielle …
Interface : implémenter les interfaces standard : géomètries ISO, proj légales, règles codage chaîne de caractères, formats standards ouverts.
Il faut distinguer deux argumentaires, l’un pour le producteur d’opendata, l’autre pour le consommateur (ou utilisateur).
Trois types de producteurs
Acteur public, Citoyen, entreprise.
Qui sont aussi les trois types de consommateurs. L’argumentaire pour ou contre varie selon le rôle, le même acteur peut être pour en tant que consommateur et contre en tant que producteur :upside_down_face:
Pour établir un argumentaire solde et positif, il faut aussi aborder l’opendata sous la forme du flux entre acteurs. Le consommateur doit toujours devenir producteur : soit en corrigeant le dataset original, soit en l’enrichissant. C’est la qualité et la richesse des flux de circulation de données ouvertes qui fait la viabilité et la richesse (au sens économique) du modèle.

2 « J'aime »