Quelle est la bonne date pour un jeu de données?

Bonjour à toutes et tous,

Le sujet des dates est un challenge technique (notamment liée au moissonnage et aux ressources distantes) et UX pour datagouv depuis longtemps.

De nombreuses dates sont disponibles et la distinction entre elles n’est pas évidente ce qui crée de la confusion pour les usagers :

  • date de création du jeu de données
  • date de modification du jeu de données
  • date de création de la ressource/fichier
  • date de la publication de la ressource/fichier
  • date de modification de la ressource/fichier

Mon intuition et mes quelques recherches me poussent à penser qu’il s’agit de cacher la complexité aux utilisateurs en proposant deux dates :

  • Une date à l’échelle du jeu de données : date qui correspond à la dernière mise à jour de ressource. Cette date peut être formulée de manière relative (jeu de donnée mis à jour il y a 3 mois). La date de création du jeu de données peut être présente dans les métadonnées, mais ne pas être mise en avant.

  • Une date à l’échelle de la ressource/fichier : qui fonctionne comme la date à l’échelle du jeu de données (date de dernière mise à jour de la ressource formulée de façon relative, la date de création peut être conservée, mais “cachée” dans les métadonnées). Si la fréquence de mise à jour est spécifiée, on peut également imaginer afficher une “date de mise à jour prévue”.

Ceci implique des changements importants pour les réutilisateurs et les producteurs.
Pour ces derniers, cela les dépossèderait notamment de la seule date qu’ils peuvent modifier à l’envi (la “date de publication” des ressources).

Nous allons mener des tests pour comprendre le rapport et la compréhension des dates par les usagers, et je suis curieux d’avoir vos avis et remarques sur le sujet (que ce soit en tant que producteur ou réutilisateur). :slight_smile:

Très bonne journée à toutes et tous,

C’est peut être un problème de choix de mots…

  • date de création du jeu de données → première publication
  • date de modification du jeu de données → descriptif du jeu de données modifié le
  • date de création de la ressource/fichier → contenu datant du
  • date de la publication de la ressource/fichier → ressource publiée le
  • date de modification de la ressource/fichier → descriptif de la ressource modifié le

Le terme « ressource » est aussi à revoir je pense… « fichier » semble plus parlant, non ?

2 « J'aime »

Merci pour ton retour !
Suite à des tests utilisateurs nous avons effectivement renommé les ressources pour « Fichiers » (exemple).

3 « J'aime »

Même avec la proposition de Christian, je trouve que ca reste encore compliqué à comprendre.
Il s’agit surtout de distinguer:

  • les données (lignes)
  • la structure des données (colonnes)
  • le descriptif/métadonnées

Du coup, je vous dis ce que j’aimerai lire pour que je comprenne correctement ce qui a été modifié et qu’il n’y ai pas de confusion:

  • date de 1ère publication du fichier
  • date de dernière modification de la structure des données (nouvelles colonnes, réagencement, format des données…)
  • date de dernière mise à jour des données (suppression, ajout, modification de données,…)
  • date de dernière mise à jour du descriptif (licence, URL, format de fichier,…)

Il me semble que tu as rajouté une notion: les changements sur la structure d’un fichier (les colonnes)

Si on liste chronologiquement on a typiquement:

  • une collecte d’informations qui représente une situation à une certaine date
  • un export de ces données à une certaine date (qui représente une ressource/fichier)
  • une documentation du jeu de données (qu’on devrait pouvoir confondre avec la structure car dans un monde idéal si la structure change la doc aussi)
  • une publication en tant que jeu de données (qui peut contenir plusieurs ressources/fichiers)

Pour tout ça on a une première date et une dernière date (mise à jour).

Bonjour,
Il me semble que parler de date de validité des données serait plus clair. Elle peut différer de la date de création. Les données du recensement INSEE en sont un bon exemple.
Bonne journée

3 « J'aime »