Annoncé par @cquest, un webinaire DCANT destiné aux collectivités locales et consacré au moissonnage des données territoriales aura lieu jeudi à 16:00 sur la plateforme de formation à distance du CNFPT. Ce webinaire permettra de présenter les évolutions récentes des moissonneurs disponibles sur data.gouv.fr et de mieux faire connaître les mécanismes de référencement automatique sur le portail national des jeux de données publiés en open data sur les portails locaux.
La documentation sur ce sujet, plus claire et précise, a été mise à jour sur une page dédiée, qui peut être améliorée par contribution (fork) sur Github.
La collecte de données pour l’observatoire open data des territoires a permis de détecter des problèmes de référencement qui ne pourront être qu’en partie résolus par les améliorations techniques apportées aux moissonneurs.
Les nouvelles possibilités offertes, notamment le paramétrage de filtres, permettent d’activer des moissonneurs au producteur et non plus seulement à la plateforme (ODS, CKAN, DCAT mais aussi GEO). De fait, les données référencées sur une page d’organisation pourront désormais refléter ce qui est effectivement produit et publié en open data par cette organisation.
Cet alignement ne pourra toutefois se réaliser pleinement que si les utilisateurs disposant de droits d’administration paramètrent correctement le (ou les) moissonneur(s) chargé(s) d’alimenter leur page d’organisation et sont en mesure de nettoyer l’historique des jeux de données qui y sont déjà référencés.
Or, il apparaît que :
-
Certaines pages d’organisation avec référencement automatique ont été directement créées par l’équipe de data.gouv.fr … Comment rendre les droits d’administration de ces pages à des utilisateurs qui représentent effectivement les organisations concernées ?
-
Le référencement de jeux de données par les mécanismes de moissonnage, anciens et nouveaux, est historicisé et cumulatif. De fait, les ressources de certains jeux de données référencés automatiquement ne sont plus accessibles. De même, de nombreuses pages d’organisation référencent la totalité des jeux de données disponibles sur une plateforme territoriale, tous producteurs confondus (y compris dans le cas d’une plateforme mutualisée). Comment déréférencer des jeux de données ? Comment écraser le référencement de jeux de données issus de moissonnages antérieurs ? Comment synchroniser le référencement automatique et sa mise à jour avec les plateformes sources ?
-
A partir d’une page d’organisation, comment savoir si les jeux de données présentés sont seulement référencés (issus d’un mécanisme de moissonnage) ou hébergés, c’est-à-dire effectivement publiés sur data.gouv.fr ? Dans le cas du référencement, comment identifier le mécanisme utilisé pour chaque jeu de données et la plateforme source d’où il est issu ?
Nous pouvons engager la discussion à partir de ces premiers éléments. Si le moissonnage des données territoriales sur data.gouv.fr suscite d’autres interrogations, n’hésitez pas à poursuivre et compléter ce fil