Données Finess au format CSV

J’ai commencé à regarder un peu ces données qui m’ont l’air bien intéressantes et suscitent pas mal de discussions sur data.gouv.fr. Je télécharge le fichier CSV géolocalisé à partir de cette page et là j’ai mis 20 minutes à comprendre que ce n’en n’était pas un : le premier header ne colle pas aux données, et il y a en fait 2 fichiers CSV plus ou moins concaténés.

Du coup j’ai commencé à bricoler un script pour générer un vrai fichier CSV, avec des entêtes, un encodage en UTF-8 et des séparateurs virgule. Le script est écrit en NodeJS et disponible dans ce repo github : https://github.com/koumoul-dev/finess . Je n’ai pas encore mis de licence, je crois que ça sera MIT (je ne sais pas trop ce qui se fait pour les scripts).

Il reste encore quelques étapes à faire avant que je ne puisse mettre un CSV en téléchargement :

  • Gestion des projections pour les DOM TOM : ce n’est actuellement pas homogène et je compte tout mettre en WGS84
  • Trouver à quoi correspond cette dernière colonne, qui n’est pas documentée, et qui contient de temps en temps des codes comme “0011361Z”

J’ai mis à jour les scripts avec la conversion des coordonnées selon leur projection vers du WGS84.
Le fichier CSV est librement téléchargeable à cette adresse

Les données sont accessibles par API avec une documentation ici : https://koumoul.com/s/data-fair/dataset/etablissements_geolocalises_20180129/api

Pour la dernière ligne, il s’agit des codes UAI (RNE) (voir pour la définition, https://www.edulib.fr/support/faq/quest-ce-que-le-code-uai-rne)

Déduit en faisant une recherche avec “0011361Z”, je tombe sur http://www.onisep.fr/voie-pro/Ressources/Univers-Lycee/Lycees/Auvergne-Rhone-Alpes/Ain/Maison-familiale-rurale-de-la-Dombes

Cela “matche” avec la ligne 101 de ton fichier CSV

010003788,010003739,MAISON FAMILIALE RURALE DE LA DOMBES,,,,,,LA SAULSAIE,,,262,01,AIN,01120 MONTLUEL,0478066433,0478066031,330,Ecoles Formant aux Professions Sociales,6201,Etablissements de Formation des Personnels Sociaux,43918302100013,8532Z,01,Etablissement Tarif Libre,,,1904-01-01,1904-01-01,2013-11-27,0011361Z,5.0174621535082915,45.9048843806245,"2,ATLASANTE,100,IGN,BD_ADRESSE,V2.2,LAMBERT_93",2018-01-25

Super, merci pour le retour, j’ai mis les scripts et les données à jour.

Il est possible que les URLs que j’ai posté changent à un moment car elles contiennent la date de parution des données. Si c’est le cas je mettrai un message ici.

Je me rends compte que je n’ai jamais donné suite à mon précédent message alors que l’URL d’accès aux données a changé depuis le temps.

Les données viennent d’êtres mise à jour et sont accessibles sur notre portail opendata : https://opendata.koumoul.com/datasets/etablissements-finess-france

1 Like

Ah trop bien, je ne connaissais pas. Je m’étais cassé les dents sur ce fichier tout pourri (et j’avais pleuré en voyant qu’ils prévoyaient d’en faire un de meilleure qualité en 2023), et j’avais trouvé comme solution un « pseudo » package R et un vrai package R qui n’existe plus qui était sur le github de « jomuller », et permettait d’accéder rapidement à une liste des établissements…

1 Like