Bonjour à tous,
Lorsque je construis un jeu de données à partir de multiples sources (producteurs et licences différents) auxquelles j’ajoute de nouveaux champs calculés. Je deviens le producteur du jeu mais qu’en est il de la licence ? Comment citer toutes les sources ? Est ce qu’il existe des règles claires (et simples). Je me fais aussi la réflexion sur des fichiers type contour (IGN) des communes pour lesquels l’attribut population est ajouté. J’imagine que cette donnée provient de l’INSEE. Et cela devrait être mentionné dans ce cas ?
Cordialement
Pour la licence, certains mélanges sont possibles, d’autre non.
On rencontre typiquement la Licence Ouverte et l’ODbL, parfois des CC-by-SA.
LO + LO = LO
LO + ODbL = ODbL
LO + CC-by-SA = CC-by-SA
ODbL + CC-by-SA = pas possible
Rappel, l’ODbL ne s’applique que sur les données/bases de données, pas sur ce qu’on produit avec quand ce n’est plus une base de données, au contraire de CC-by-SA qui impose que tout ce qui est fait avec les données soit aussi en CC-by-SA (c’est ce qui les rend incompatibles).
L’attribution… il faut citer ses sources, sans toutefois reciter l’intégralité des sources de ces sources mais au moins les sources majeures.
L’important c’est la traçabilité pour savoir d’où vient, si possible, la donnée initiale (et de quand elle date).
Difficile parfois d’avoir le détail de la provenance (et fraîcheur) de tel ou tel champ.
Pour l’exemple de la population figurant sur les contours des communes de l’IGN (lequel ? Admin Express ? BD Topo ?) c’est peut-être indiqué dans la doc.
Si on veut être sûr de l’info et de son millésime, autant refaire un croisement avec les dernières données de l’INSEE plutôt que des données de seconde main.
Merci Christian pour ton retour très intéressant.
Pour des créations un peu complexe type explorateur de données qui intègre dans une même application web à la fois plusieurs librairies, des briques de code récupérées sur le web, des données en provenance de France et de l’étranger, cela peut devenir particulièrement difficile voir impossible d’être réglo. Le minimum dans tous les cas est effectivement, comme tu le mentionnes, de documenter correctement.