7 commandements de la qualité des données


(Charles Nepote) #1

À l’occasion d’un atelier que j’animais la semaine dernière, j’ai pondu 7 commandements ou règles d’or de la qualité des données. Comme j’ai fait ça un peu dans mon coin (avec tout de même plusieurs années d’observations terrain), je vous les partage ici-même pour avoir vos retours.

  1. producteurs et utilisateurs tu associeras
  2. le jeu de données tu documenteras : aspect, limites, manques, choix, etc.
  3. des données facilement réutilisables, tu produiras
  4. les standards tu adopteras :
    • syntaxe des champs : dates, …
    • format de fichier : GTFS, Socle commun des données locales (SCDL)…
    • des données pivot tu utiliseras (codes INSEE…)
  5. la qualité tu contrôleras : la sémantique, les manques, la surabondance, la pertinence, la réglementation
  6. la correction, tu organiseras
  7. trop de qualité, tu éviteras

Ces 7 règles sont explicitées dans le document suivant, à partir de la vue “La qualité des données : règles d’or, outils et méthodes” :
https://docs.google.com/presentation/d/1RcFECCyv7UOTRqbffWt7wcSexprOM45imU_FZn0UM-M/edit#slide=id.g3c73ebfbcf_0_364


Atelier qualité des données : 2h30 pour démarrer