Création d'un identifiant unique pour les structures de l'ESS

Bonjour,
Pourquoi ? Cela permet d’exporter le modèle non ? Si le format opendata produit est un dump d’une BD postgresql postgis cela sera le cas non ?

Bonjour,
Comme l’a écrit @cquest les parcelles cadastrales sont une piste. Il faut pour cela avoir accès aux données MAJIC et identifier pour chaque copropriété (PDL) la parcelle de référence (champs GPDL = 1) et les éventuelles parcelles appartenant à la copro mais n’étant pas la parcelle d’assise (GPDL=2).
Attention, il peut exister plusieurs copropriétés sur la même parcelle d’assise.

1 « J'aime »

la question des identifiants est présente à plein d’endroits : https://github.com/etalab/schema.data.gouv.fr/issues/135# !!!

Si je peux me permettre mon petit grain de sel… Quel serait l’usage d’un tel « identifiant unique » ?

Un « identifiant unique » voire UUID se doit d’être unique et pérenne (inchangé) dans le temps. Il ne peut donc être une simple concaténation d’informations, ou alors il faut que celles-ci soient fixes dans le temps. L’adresse postale d’une structure peut changer, les longitudes/latitudes sont donc à éviter (au passage, il faudrait préciser la projection utilisée)

Le premier usage d’un tel identifiant est interne à un système, et n’a pas vocation à être communiqué en dehors du système.
Le second permet d’échanger d’identifier de façon cohérente une entité entre plusieurs systèmes.
La règle de l’identifiant unique et pérenne s’applique aussi, pour conserver la cohérence dans cet agglomérat de systèmes, qui devient, en fait, un nouveau système plus large :slight_smile:

Une première piste est de comparer les façons dont sont identifiées les structures dans les différents systèmes concernés, et de choisir celle qui répond au besoin (ID unique + pérenne).
Si cette piste n’est pas valable, il reste à créer un catalogue d’ID commun qui identifie de façon unique les différentes structures et permet de retrouver l’ID global à partir ID locaux, possiblement vides (ex: SIRET), ou d’infos supplémentaires (métadonnées comme le champ adresse postale ou URL par exemple).

Il peut paraître intéressant de se baser sur un système d’identification existant (comme le SIRET), mais c’est s’imposer une dépendance par rapport au créateur de l’identifiant, et demande de pallier de façon ad hoc aux « défaillances » (comme ici, l’absence de SIRET pour certaines structures).
Une alternative est de se baser sur un système d’identification externe et universel, de type DOI, mais cela peut être payant.
Le plus simple est de générer soi-même l’identifiant (attention à bien dimensionner ce champ).

La CNIG a publié un document sur le sujet des identifiants, ça me paraît intéressant:
http://cnig.gouv.fr/wp-content/uploads/2016/02/GuideIRU-corrigé-v2.pdf

Un des usages est l’intéropérabilité entre les données - es-tu familier avec la notion ?
Les cartographies se multiplient, territoriales, thématiques, thématico-territoriales.
Cette multiplication entraîne des défauts de qualité de la donnée (car multiplication, copies, plus de maintenance, etc.). Utiliser un identififiant unique (URI, SIREN, RNA, etc.) pour pouvoir référencer à un autre endroit dont la mise à jour se ferait automatiquement suite à la mise à jour de la source.

Y a une jolie vidéo qui explique certains enjeux par ici

Ce document décrit surtout les identifiants des jeux de données INSPIRE, pas les identifiants à utiliser au sein même des données (ou alors j’ai loupé quelques chose).