Demande de données à des administrations


(walter) #1

Bonjour,

je souhaite avoir accès aux données suivantes, situées sur le site de la sécurité routière.
Malheureusement, ces données sont sous un format PDF (ce ne sont pas des données compliquées, mais assez inexploitables dans ce cas).

Sachant que ces données sont de simples tableaux, je souhaiterais ainsi pouvoir demander à ce que ces données soient mises à disposition sous un autre format exploitable (csv, à la limite excel).

Quelle serait la meilleure façon de procéder :

  • prendre contact directement sur le site de la sécurité routière ?
  • demander à un tiers de faire la démarche (CADA, dododata.io, autre ???) ?

Merci de vos réponses.


(Christian Quest) #2

Si pas pressé… demande de communication du document bureautique original.

Si pressé: tabula (ou excalibur) pour récupérer les données depuis le PDF vous même… ce qui prendra sûrement beaucoup moins de temps… et que vous pourrez publier en opendata :wink:


(walter) #3

j’ai essayé avec tabula, mais le rendu n’est pas tip top pour certains fichiers (pas le même nombre de colonnes rendu dans un même fichier, …)

je vais tenter de les contacter directement.
à suivre…


(Samuel Goëta) #4

Attendez… j’ai trouvé la solution, j’arrive avec les données :slight_smile:


(Samuel Goëta) #5

J’ai trouvé une solution ! Je voulais tester ce que ça donnait avec un outil qui s’appelle PDFpen et j’ai trouvé que ça marchait mieux que Tabula sur ce cas là.

La difficulté ce sont les quelques cas où l’emplacement du radar est sur plusieurs lignes :

Pour avoir le détail exact des emplacements, il faut aller sur ce fichier le réseau de données opendatasoft qui a scrappé les données de https://radars.securite-routiere.gouv.fr/#/. Puis copier l’emplacement du radar.

Pour les radars tronçons et discriminants, c’était facile :
Radars tronçons 2017.csv (5,0 Ko)
Radars discriminants 2017.csv (19,0 Ko)

Pour les radars fixes, c’est plus compliqué à corriger vu le nombre. J’en suis à la Haute-Garonne (31) mais ça me semble jouable de corriger le fichier entier.
radars fixes 2017.csv (101,5 Ko)

La suite arrive donc… Dès que j’ai fini, je mets ça sur data.gouv.fr, ça les forcera à ouvrir les données pour de vrai.


(walter) #6

J’ai finalement pris le temps d’extraire les données en utilisant Tabula (PDFpen ne semble utilisable que sur Mac).
Il n’y a globalement que les données de 2017 qui posaient problème, et en utilisant les fichiers des autres années, on arrive à retrouver ses petits.
Les données sont maintenant dispo sur data.gouv.fr


(Christian Quest) #7

ça serait TOP en indiquant une licence su https://www.data.gouv.fr/fr/datasets/radars-automatiques-bilans-annuels-du-nombre-de-flashs/ :wink: