Crowdsourcing des geoloc des accidents de la route à Paris 2005-09

Hello,

Mon premier post ici, sur la reco de l’excellent Joël.
Je travaille au Parisien, et pas mal sur les accidents de la route, et j’aimerais bien pouvoir travailler sur les données antérieures à 2014-5, à Paris, quand la géolocalisation a été imposée, semble t il, aux forces de l’ordre qui abondent le fichier.
J’ai fait quelques modifications dans le champ adresse afin de pouvoir permettre à la ban de reconnaître « q de valmy » comme le quai de Valmy,par exemple.
J’ai cherché la façon la plus facile de faire rentrer par quelqu’un des coordonnées.
J’ai mis en place ce Google Doc
https://docs.google.com/spreadsheets/u/0/d/1Yv-9yILBQNwYIa3Kdhtn_iepOKj2t_YZILhS9hQBVYA/htmlview#gid=943646158

L’idée est évidemment de proposer sur datagouv un fichier de données avec des coordonnées améliorées.

Merci et bravo à tous !
Victor

1 « J'aime »

Beaucoup de croisements de rues, mal pris en compte actuellement par les géocodeurs.

C’est quelques chose que je compte ajouter sur mes géocodeurs (BAN/BANO/OSM) et qui nécessite de repartir du filaire de voirie pour calculer les intersections et générer des POI correspondants.
Ensuite, addok peut très bien indexer ça.

L’autre souci c’est la longueur insuffisante du champ (pour ne pas dépasser les 40 colonnes du Minitel ?) qui fait qu’on a souvent le deuxième nom tronqué. addok pourra le gérer en partie avec l’autocomplétion mais ça ne pourra pas faire de miracles.

Il y a par contre beaucoup d’adresses où un géocodage devrait passer sans problème, il faudrait déjà faire un géocodage du CSV et voir les scores insuffisants.

Merci Christian,
J’ai fait tourner les adresses sur banR, poke Joël et Paul Antoine, pas mal sont reconnues mais pas forcément où il faudrait.
Par exemple les porte de clichy sont tous mis avenue de la porte de Clichy.
C’est quoi addok ?

banR appelle une API… addok fait tourner cette API :wink:

« Porte de Clichy » n’est pas connu de la BAN, qui ne contient que des adresses au numéro. C’est un lieu-dit…

En gros toutes les adresses sans numéro sont à vérifier pour cette raison. On peut refaire une passe sur les POI d’OSM, exemple: http://poi.addok.xyz/search/?q=porte+de+clichy&citycode=75056 (75056 = code INSEE global de la Ville de Paris)
On trouve les stations de métro… c’est pas parfait.

Il faut que je complète ces POI avec les intersections, car ça on ne les a pas actuellement.

1 « J'aime »

Si ça te prend du temps dans une de tes nombreuses activités d’utilité publique, je peux m’occuper de générer un geojson avec les intersections des rues de Paris.

Je comptais le faire, vu qu’il faudra le refaire tourner régulièrement… et qu’on n’utilise sûrement pas la même caisse à outils :wink:

1 « J'aime »

J’ai généré le json des intersections sur l’Île de France, donc Paris.

Cela fait un peu moins de 200000 intersections, que j’ai ajouté sur demo.addok.xyz qui contient par ailleurs la BAN et les POI d’OSM.

Du coup on trouve désormais: http://demo.addok.xyz/search/?citycode=75056&q=R+ETIENNE+MARCEL+R+SAINT <- Rue Saint-Denis

http://demo.addok.xyz/search/?citycode=75056&q=R+DE+RIVOLI+R+DE+L+ARBRE <- Rue de l’Arbre Sec

Le script utilisé pour générer le json destiné à addok est ici: https://gist.github.com/cquest/c0a84e6757d15e66e6ae429e91a74a9e

J’ai publié le fichier généré sur https://www.data.gouv.fr/fr/datasets/intersections-des-voies-de-circulation/

Il n’y a que l’île-de-france, mais on pourra générer ça pour chaque région.

2 « J'aime »

Du coup, j’ai juste a générer des requêtes similaires aux tiennes avec addok et ça va trouver les carrefours ?

Pour faire court: oui

Il n’est pas possible dans banR de changer l’adresse de l’API ? Ce serait plus simple…

Elle est malheureusement hardcodée: https://github.com/joelgombin/banR/blob/master/R/geocode.R#L62

^ Vilain @joel !

2 « J'aime »

Tout le monde n’a peut être pas vu cette contribution… https://twitter.com/tetranos/status/1226254467496058880?s=19

En gros c’est ce qu’on obtient avec un coup de géocodage par addok qui fait entre autre la même chose mais quand même beaucoup plus aussi :wink:
Le résultat obtenu ne gère bien sûr pas les intersections, naturellement nombreuses dans ce jeu de données.

J’ai complété le référentiel des intersections sur la France entière désormais intégré à https://demo.addok.xyz et son API https://demo.addok.xyz/search

Je pense étendre cette liste d’intersections avec les références des routes pour trouver le croisement entre la D40 et la D118… car ce genre de choses est courant en zone rurale.

Autre amélioration en test… trouver les intersections des voies très proches mais qui ne sont pas directement reliées au niveau topologique dans OSM.

1 « J'aime »

on va regarder ça @cquest :wink: je m’étais déjà posé la question d’ailleurs. Les arguments de l’API d’addok sont les mêmes que ceux de l’API Adresses ? c’est quoi du coup l’adresse à utiliser en prod ? demo.addok.xyz/search ?

Même fonctionnement, vu que c’est le même code derrière (addok).
Il n’y a que les données qui peuvent être différentes.

L’appel à l’API fait par banR devrait aussi désactiver l’autocomplétion qui lorsqu’on a une adresse complète (en général le cas sur les données opendata) ne fera que rajouter du bruit lors de la recherche. Permettre le passage de filtre comme citycode serait aussi un plus…

1 « J'aime »

Voici une carte de chaleur avec le résultat de mon géocodage…

Génial! C’est l’ensemble des données présentes dans le BAAC où c’est juste celles qui avaient été mal géocodées ?

C’est tout ce qui est sorti du géocodage, soit plus de 95% de la BAAC.

Il y a encore des améliorations faciles avant de passer au complément totalement manuel.

Ex: BOULEVARD DE L’HOPIT -> rien trouvé (et je pense avoir l’explication)