OpenAQ centralise des données ouvertes sur la qualité de l’air, partout dans le monde.
(Je m’intéresse un peu au sujet alors j’ai fait une petite analyse rapide.)
C’est très intéressant mais (naturellement) un peu décevant.
- Les données sont en réalités produites par des agences officielles (et déjà ouverte en open data pour la France : AirPACA, AirParif, etc.). Ces agences, au niveau européen, sont obligées d’ouvrir ces données.
- Il me semble qu’il manque des capteurs par rapport aux données que ces agences possèdent, mais pas tant que ça : il faut savoir que le nombre de capteurs à Paris intra-muros, par exemple, est de moins d’une quinzaine.
- En dehors de ces données des agences (capteurs à plusieurs dizaines de milliers d’euros), presque rien semble-t-il : “For non-research-grade low-cost sensors, we currently do not have a method to insert them, nor visualize them responsibly. We are proceeding carefully and slowly with adding in low-cost sensor data. It is tricky business.” https://github.com/openaq/openaq-info/blob/master/FAQ.md#suggestions
Ils ont raison de signaler que les capteurs à bas coût sont très médiocres et devraient être ajoutés avec une extrême prudence. Mais c’est aussi dommage de se couper de ces données qui pourraient au moins donner des tendances mêmes si elles ne donnent pas des résultats justes. D’autant que le maillage des capteurs pro est si lâche qu’on n’est par exemple incapables de mesurer des phénomènes à l’échelle d’un quartier. On est donc encore très loin de ces initiatives qui sont capables de mesurer finement des phénomènes mondiaux à l’image de marinetraffic.com ou blitzortung.org.
Ils ont standardisé un format : https://github.com/openaq/openaq-data-format
Ce standard se conforme à certaines bonnes pratiques comme l’usage d’ISO-8601 pour les dates mais on sent aussi un manque de rigueur qui ne va pas faciliter son usage : par exemple ce ne serait pas idiot de mentionner la norme ISO pour les codes pays ; la localisation de la mesure exprimée par le couple ville-pays ne passera pas à l’échelle, sachant que dans un même pays il existe beaucoup d’homonymes ; etc.
Notez au passage que les données sont sous licence CC 4.0 dont nous parlions dans d’autres messages.