CONTEXTE
Les données dupliquées et redondantes consomment des ressources matérielles (les disques de stockage) et de façon récurrente de l’énergie (pour la redondance). Elles polluent donc considérablement les systèmes d’information.
Cette pratique vise à privilégier l’optimisation du référencement plutôt que la duplication de jeux de données afin de libérer de l’espace sur le stockage et d’optimiser l’utilisation de données ouvertes.
Plus la donnée est référencée, plus elle est utilisée. Optimiser le référencement permet pour le producteur de données de :
- Faciliter et mieux suivre les réutilisations des données,
- Favoriser la découvrabilité des données,
- Améliorer la cohérence des données publiées (contenu et présentation),
- Permettre les agrégations territoriales ou thématiques,
- Faire des économies d’échelle (technique et financières) par la mutualisation,
- Sortir de l’anonymat.
DESCRIPTION DE LA BONNE PRATIQUE
1 - Eviter la duplication des données
Afin de réduire l’impact environnemental et le coût de stockage de données ouvertes, il convient de limiter leur duplication et de privilégier le moissonnage des données. Une première étape peut s’intéresser à identifier les redondances des jeux de données volumineux et stratégiques : où les données sont publiées, dupliquées …
2 - Identifier les lieux de publications de données
Des plateformes de données peuvent référencer et moissonner les (méta)données entre portails. Plutôt que de dupliquer un jeu de données, il est donc préférable d’optimiser son référencement en indexant le jeu de données sur d’autres portails. Par exemple :
- plateforme nationale (data.gouv),
- plateformes territoriales (échelon régional, départemental, …),
- plateforme thématique (transport.data.gouv.fr, data.tourisme, geoportail, …).
3 - Demander à data.gouv.fr de moissonner votre portail
Un moissonneur permet d’importer toutes les données d’un portail d’open data. Vous pouvez aussi demander au moissonneur de n’importer que certains jeux de données, au moyen de filtres.
Demander à data.gouv.fr de moissonner votre site
4 - Maintenir l’accès et la qualité des données produites
Pour maintenir à jour les données référencées et limiter le risque de problème de version des jeux de données sur d’autres plateformes, privilégier un accès aux données par API. Voir la fiche 8 - Proposer un accès aux données par API.
RETOUR D’EXPÉRIENCE
La ville de Castelnaudary publie ses données ouvertes directement sur le portail data.gouv.fr. L’exposition et la valorisation des données se fait localement, sur le site officiel de la ville : https://ville-castelnaudary.fr/fr/mairie/open-data
Le portail OpenData de la Région Occitanie référence l’ensemble des données produites par le Conseil Départementale de l’Hérault et facilite ainsi leur découvrabilité et le croisement de cas d’usages. https://data.laregion.fr/pages/accueil/
ÉVALUATION
Priorité :
- prioritaire,
- recommandée,
- pour aller plus loin
Mise en œuvre :
- facile,
- moyenne ,
- difficile
Exemple de pilote : Délégué ou référent aux données ouvertes et responsables
Exemple(s) d’indicateur(s) de pilotage
- nombre (ou %) de jeux de données récupérés par API
- nombre (ou %) de jeux de données référencés sur plus d’un portail
Lien vers la fiche : 9 - Optimiser le référencement des jeux de données - GREENDATA pour un impact maîtrisé des données
Votre avis nous intéresse.
Que pensez-vous de ces propositions ?
- D’accord,
- Mitigé,
- Pas d’accord.
0 votant
Vous avez des suggestions ?
Commentez ci-dessous !