Dommage que 3/4 des jeux de données soient des reprises… au final une petite cinquantaine de nouveaux jeux de données. Je vais voir si ma détection des « reprises » fonctionne sur opendatArchives… important pour éviter d’archiver N fois la même chose ! Les To ne sont pas gratuits.
Les archivistes ont un truc qui peut aider. On distingue le « producteur » du « versant » et on a des tableaux qui nous donnent des informations sur qui a le « dossier maître » qui doit être archivé. ça évite effectivement les doubles mais surtout savoir lequel est l’original, le plus complet, etc…
Opendatasoft facilite la republication sur un portail de données filtrées provenant d’un autre chez eux, dans ce cas il y a un champ « federated » qui l’indique. Le problème c’est quand la donnée republiée ne passe pas par ce mécanisme.
Je comprends (un peu) l’intérêt de compléter ses données par quelques données auxquelles on fait référence dans ses propres données, mais quand ça représente les 3/4 d’un portail, ça fait plus remplissage qu’autre chose.
Je suis assez d’accord sur le côté un peu « remplissage » des reprises.
J’ai uniquement regardé ce qui est dans mon « focus », les finances locales, et si effectivement dans ce cas, l’extraction filtrée des jeux de l’OFGL réalisés à partir des balances publiées par la DGFIP a un intérêt, on peut regretter qu’il n’y a aucun jeu de données « original », hors reprises de jeux nationaux.
Par exemple, on peut regretter l’absence de publication des documents budgétaires BP / BS / DM / CA qui pourraient être aisément produits en quelques minutes donc sans réelle « charge de travail » au format SCDL grâce à DataClic .
Le portail n’est pas éditorialisé et en apparence la ville d’Aix en Provence n’y a publié que 2 jeux de données qui ont la ville comme producteur : Explore — OpenDataAixEnProvence
En fait, il y en a plus mais il n’y a pas de producteur renseigné et parfois aucune documentation. Par exemple ici les pistes cyclables : Pistes cyclables — OpenDataAixEnProvence