Normalisation du format des noms de Champs (entête colonne)

Bonjour,

je suis référent open data dans ma collectivité et représentant technique de cette dernière auprès du Copil mené par l’ANTIC Pays-Basque missionnée par notre agglomération. Dans ce cadre, cotre forum et l’outil Validata nous ont été présentés et proposés pour nous aider à fiabiliser nos jeux de données.

Je travaille actuellement sur les jeux de données essentielles ainsi que les subventions et j’ai un petit souci concernant les modèles de données proposés dans le SCDL, notamment la normalisation du format des noms de Champs (entête colonne).

En effet pour les “marché publics” la forme est du type “MARCHE_ID” (tout en majuscule et underscore) alors que la norme proposée pour les “Subventions” est du type “nomAttribuant” (premier mot sans majuscule deuxième mot avec ?!). Cela me paraît un peu “confusant”… d’autant que l’outil Validata est sensible à la casse.

Ne serai-t’il pas possible de normaliser cela ?

Bien cordialement,

Christophe

2 « J'aime »

Il est difficile d’harmoniser les modèles de données et notamment les libellés des champs car ils sont parfois issus de textes réglementaires.

Par exemple pour le modèle de données des subventions il y a un arrêté qui définit comment doivent être mises à disposition les données : https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000036040528

Au-delà de ça, il n’est pas forcément souhaitable de graver dans le marbre ce genre de choses, et fixer trop de règles sur l’écriture de ces modèles de données car cela rajoute une rigidité, des frictions et des opportunités de faire des erreurs humaines. Par exemple est-ce qu’un champ ayant le même libellé dans deux modèles différents reposerait sur les mêmes contraintes ? D’un point de vue utilisateur cela pourrait entrainer ce genre de raisonnements pas forcément corrects.

Voici les règles du SCDL : https://scdl.opendatafrance.net/docs/CONTRIBUTING.html
Vous constaterez qu’elle sont relativement peu contraignantes ce qui permet à la communauté et par exemple à Etalab d’écrire de nouveaux schémas facilement.

Bonjour,

Je suis l’auteur des schémas réglementaires pour les données essentielles de marchés publics et les données de subventions.

Pour les trois schémas produits (XML et JSON pour les marchés publics, CSV pour les subventions), j’ai pris le parti d’utiliser la casse chameau (camel case), avec le premier caractère en minuscule, car elle allie compacité et lisibilité.

Malheureusement, le gouvernement n’ayant pas de doctrine sur le sujet, il est possible que d’autres pratiques soient utilisées pour les schémas de données à venir (à moins que je participe de nouveau à leur création).

1 « J'aime »