Je déterre ce sujet, car mes collègues de chez MobilityData se demandent d’où vient cette spécificité française (la plupart des flux GTFS dans le monde étant publiés en licence Creative Commons ou sans aucune restriction).
Sachant que de telles conditions de réutilisation, même si allégées ou bien expliquées, sont encore aujourd’hui un ajout de complexité et un frein à la réutilisation, ma question est la suivante : à quoi a servi la licence ODbL exactement pour les GTFS ? (et GBFS)
Depuis plus d’une dizaine d’années, est-ce qu’on a recensé des usages ou mesuré des impacts concrets grâce à du share alike sur ces données spécifiques ?
Je sais que certaines collectivités locales et organisations ont particulièrement défendu ce choix de licence, peut-être qu’aujourd’hui les bénéfices ont été évalués de leur côté ?
Pour ce qui concerne les données de transport, il y a de l’historique là dessous.
La SNCF avait opté pour l’ODbL et ne voulait pas d’une licence de type Licence Ouverte. Vu l’importance à l’époque des données SNCF (il n’y avait pas grand chose d’autre d’ouvert), leur imposer autre chose aurait été contre productif.
J’attire quand même l’attention sur des conditions particulière pour appliquer le partage à l’identique, conditions qui allège celui-ci et qui ne sont pas l’ODbL normale (pour ça que ça a été nommé « conditions particulières », au moins à l’époque).
Plus généralement, le décret faisant suite à la Loi Lemaire a retenu pour les données 2 licences:
la Licence Ouverte (abusivement nommé « Etalab »)
l’ODbL
La Licence Ouverte est équivalente à la CC-BY.
L’ODbL impose du partage à l’identique mais avec moins de conditions que la CC-BY-SA (seules les bases de données dérivées doivent être partagées à l’identique) ce qui est conforme à l’esprit de la Loi alors qu’imposer un partage à l’identique de tout dérivé ne l’était pas.
Là aussi, il y avait à l’époque environ 50% des grosses collectivités qui avaient choisit l’ODbL (par exemple Paris) et j’ai vraiment poussé fort à l’époque pour qu’elle figure dans le décret même si parfois elle était choisit pour une mauvaise raison: son côté « anti GAFAM ».
Aucune idée… je pense surtout qu’elle n’est le plus souvent pas respectée car je vois peu de repartage de données améliorées ou corrigées alors qu’il y a de quoi la plupart du temps !
A un époque au moins, il me semble que Google renvoyait des corrections au STIF…
L’améiioration de la base initiale est la seule justification au partage à l’identique, mais encore faut-il que les producteurs soient preneur des remontées et organisés pour les intégrer.
Ou d’autres réutilisateurs qui pourraient être plus agiles que le producteur, ce mouvement lui bénéficiant in fine lorsque des solutions partagées émergent et dont il peut se saisir.
Il n’y a pas que l’absence de capacités ou de compétences à un instant t qui freine le mouvement mais aussi le manque de vision.
Beaucoup d’acteurs affirment ne pas y croire de manière péremptoire. La licence ne leur demande pas de croire mais de faire.
De mon point de vue, les remontés à la source forment un des parents pauvres de l’open data. Les producteurs se privent d’une source de données très utile et qui améliore significativement la qualité (voire la quantité). Ces remontés sont d’autant plus pertinentes qu’elles viennent de problèmes d’usage et pas d’une logique de sur-qualité.
L’onglet « discussion » de data.gouv.fr fourmille de remontés utilisateurs très utiles. Exemple pris au hasard : Jeu de données | data.gouv.fr
Au passage, souvent la réponse est : « je remonte à notre exploitant », suggérant que le process pourrait être amélioré ?
Chez Open Food Facts sur ~680 000 produits ajoutés à la base, plus des 3/4 l’ont été par des apps tierces qui jouent le jeu de l’ODBL. Je ne parle même des modifications…
Pour des petites collectivités, je comprends néanmoins qu’on peut se poser la question de l’intérêt de l’ODBL pour des jeux de données de quelques centaines d’arrêts.