Licence des données de l'European Transaction Log (EU-ETS / EUTL)

Bonjour à toutes et tous,

Je viens de récupérer les données des installations soumises à quota de CO2 de l’European Transaction Log (https://ec.europa.eu/clima/ets/oha.do) soit près de 18000 fichiers XML (en utilisant l’api non documentée du site) pour en faire un seul fichier CSV.

Il y avait eu une extraction précédente ici: Données 2005-2016 du marché européen des quotas de CO2 (ETS) | 2005-2016 data from ETS - data.gouv.fr mais qui n’a pas été remise à jour récemment, et qui avait procédé par scraping.

Je m’apprête à les publier sur data.gouv.fr, mais je n’arrive pas à trouver la licence originale des données… Sur data.europa.eu il y a des données dérivées de l’EUTL, qui sont en CC BY 4.0, mais je ne sais pas si ça fait foi, et ça ne dit rien sur les données sources.

Quelqu’un en sait plus?

Autre chose: les données de géolocalisation présente dans l’EUTL sont très incomplètes. Pour la France, j’ai géocodé l’ensemble via le code postal (base officielle des codes postaux + Sirene pour les CEDEX) pour réaliser cette carte: https://twitter.com/cedricr/status/1389248127257939974
Est-ce qu’il existe une base exhaustive des codes postaux au niveau européen?

Merci d’avance!
Cedric

1 « J'aime »

A priori c’est bien du CC BY 4.0 comme pour toutes les ressources publiées par l’Union européenne (« sauf indication contraire ») :

Il existe une initiative récente qui a également utilisé (et enrichi) ces mêmes données : EUETS.INFO. Leur géocodage a probablement été fait avec Google Maps mais pourrait aussi être réalisé avec OpenStreetMap.

A priori c’est bien du CC BY 4.0 comme pour toutes les ressources publiées par l’Union européenne

Oh, bon à savoir, merci!

Il existe une initiative récente qui a également utilisé (et enrichi) ces mêmes données : EUETS.INFO

Super travail! Dommage que je ne l’ai pas découvert avant :wink: Je vais regarder les données en détail, mais ça a l’air très bien fait, les miennes seraient donc redondantes.

Merci beaucoup pour ces liens!
Cedric

Il existe une correspondance entre les codes NUTS 3 et les codes postaux fournis pour 34 pays via Eurostat : TERCET

ça devrait au moins permettre de pouvoir affecter à un élément statistique européen qui utilise les NUTS une correspondance en code postal pour un pays donné.

Sinon, on trouvera ici Unités administratives locales - NUTS - Nomenclature des unités territoriales statistiques - Eurostat une liste de tous les codes des « Unités administratives locales ».
C’est exhaustif et à la commune, mais attention il s’agit des codes communes, pas de codes postaux ; par exemple pour la France le code INSEE et pas le code postal, qui diffèrent systématiquement.

Après, pour ce qui est de la géolocalisation, c’est une autre paire de manches…

Si vous voulez utiliser les NUTS (et après les transférer vers les codes postaux avec TERCET) alors vous pouvez utiliser la géométrie des NUTS ici NUTS - GISCO: Informations géographiques et cartes NEW - Eurostat

Si vous voulez utiliser les « Unités administratives locales » (ce qui à mon humble avis est le plus commode), alors vous avec les fichiers SHP de correspondance ici UAL/LAU - GISCO: Informations géographiques et cartes NEW - Eurostat

Dans mon cas, je pars d’un code postal, et non pas d’un NUTS 3. Comme vous le dites, en France ça ne me permet pas de remonter à l’UAL (mais on a la Base des Codes Postaux qui me suffit, ou Sirene pour les CEDEX); j’essayerai de regarder s’il y a une correspondance plus simple dans les autres pays…

Merci de votre aide!

Résultat en utilisant les données de euets.info, et quelques corrections manuelles:

Merci à tous!
Cedric

3 « J'aime »

Après reflexion et different retours, j’ai décidé de publier ma version des données quand même, car:

  • euets.info n’avait pas les données 2020 il y a encore quelque jours (pas revérifié depuis, mais il travaille dessus)
  • les miennes sont dans un seul fichier, plus simples à exploiter rapidement (même si celles d’euets, relationnelles, sont plus complètes).
  • la géolocalisation via l’API Google fait souvent de grosses erreurs (en particulier sur les adresses avec cedex); via les codes postaux on est moins précis, mais c’est dans la bonne commune au moins…

Dispo ici:

et le code est ici:

1 « J'aime »