Covid-19, opendata... et analyses à partager

Des retours sur les données publiées par Santé Publique France ? https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/

(@samgoeta Salut Samuel, j’espère que tu vas bien )

Sur les données de Santé Publique France, je trouve très compliqué d’utiliser celles qui concernent les taux d’hospitalisations / de SOS Médecins parce qu’il n’y a pas de détail sur ce qu’elles veulent dire où ce qu’il vaut mieux en faire, c’est dommage qu’on n’ait pas non seulement les méta-données et documentation, mais aussi un petit vademecum.

J’ai en revanche utilisé les données sur les hospitalisations / réa / décès publiées quotidiennement qui je l’espère ne vont pas changer de périmètre tout au long de la crise sanitaire. Elles sont plutôt efficace, je vais mettre mon code R sur Github, j’essaie de les augmenter un peu notamment avec des chiffres du nombre de lit, ou la population par département…

1 « J'aime »

Sinon, j’essaie de mettre la main sur les données mobiles d’Orange qui sont distillées dans les médias. Le Figaro a diffusé une carte mais sans les données. Je trouve le papier du Figaro clair, notamment sur les limites de ces données.

Sur les données des opérateurs, lisez cette tribune de la Quadrature : https://www.laquadrature.net/2020/03/28/orange-recycle-son-service-de-geolocalisation-pour-la-pandemie/?fbclid=IwAR1IxqBv-ueHWq6r-9_mTx4m4nbM5IokRz34BI4aHswM5JcBSoCRKnxOSD4

Merci Samuel. Quelque chose me gênait dans cette histoire d’utilisation des données mobiles. La quadrature l’expose très bien.

1 « J'aime »

Que pensez-vous de l’article de Bengio ?

Un dashboard en cours côté Belgique

Bonjour à tous,

l’un de vous connaitrait un open dataset avec les dates de mise en place du confinement par pays ? ceci afin de voir plus clairement la corrélation avec l’infléchissement des courbes après N jours théoriques de confinement

1 « J'aime »

Ici : https://cdonline.articque.com/covid-19.html?map=0_1_0.cartojson

une donnée intéressante et utile pour voir son impact « réel »
mais que je n’ai pas (encore) vu ; John Hopkins ou l’OMS ne le donnent apparemment pas …

J’ai trouvé TV5 (20 mars - https://information.tv5monde.com/info/coronavirus-quels-sont-les-pays-confines-352330 ) ou le Monde (30 mars) - https://www.lemonde.fr/planete/article/2020/03/30/coronavirus-quels-pays-sont-confines_6034936_3244.html

je note que seuls 30 pays (sur 160 ?) sont confinés totalement à ce jour, et vues les variations en terme de couverture ou de rythme (fermeture des frontières; confinement partiel; léger puis total), sans compter l’application plus ou moins rigoureuse du concept (je pense à l’Inde, l’Afrique…) ou plus ou moins facile à appliquer (en guadeloupe ils ont des problèmes … d’eau …), il faudrait définir un biais par pays/régions !

  • les USA ne sont pas confinés : seuls 30 états le sont
  • la Russie ne l’est pas, seul Moscou l’est (10% de la population en russie)
    je pense qu’il serait intéressant de distinguer la fermeture des frontières (ou pas) et les degrés de confinement…et que faire pour des pays comme les USA ou la Russie
    Il y a 160 pays concernés… un tableau assez simple à faire si on s’y mettait …

Bonjour,

J’aimerais partager avec vous une petite appli que j’ai réalisée, qui permet de comparer la population présente sur une carte avec le nombre de cas de COVID-19 enregistrés en France dans le monde.

https://datagistips.shinyapps.io/covid-pop/

L’objet de cette appli et de cette comparaison est de mieux se représenter le nombre de cas.

J’ai mis le code de préparation des données sur github

Je mettrai aussi celui de l’appli une fois que j’en aurai nettoyé le code

1 « J'aime »

L’idée est très bonne, malheureusement le nombre de cas est complètement sous-estimé de l’avis de tout le monde.

1 « J'aime »

Dans mon entourage une douzaine de malades covid (dont moi, en convalescence) et aucun dans les stats officielles.
De même les décès sont incomplets car décomptés uniquement en milieu hospitalier.
Le nombre de patients en réa ? Il est limité par les places de réa… quand c’est saturé ça ne veut plus rien dire, ou alors il faudrait le nombre de patients qu’on n’a pas pu mettre en réa, chiffre hautement sensible car il pointe clairement la saturation du système de santé.

Bref, aujourd’hui, en France on a des chiffres qui ne permettent plus de mesurer exactement l’ampleur de l’épidémie ni sa dynamique.

Le fichier des personnes décédées de l’INSEE permettra dans quelques temps d’y voir plus clair.

En attendant les décisions du gouvernement se basent sur une vue tronquée de la réalité et sont donc inapdaptées et toujours en retard.

Dominique Boulier a assez bien résumé les problèmes de qualité de ces données : https://shs3g.hypotheses.org/574

L’INSEE devrait mettre à jour la base des personnes décédées dans une semaine. Avec ces données, on devrait pouvoir faire des analyses assez précises me semble-il en rapprochant l’age et le lieu de décès.

2 « J'aime »

@guillaume_v Pour les mesures de confinement, etc, il y a une base qui a l’air très riche et bien maintenue ici https://www.acaps.org/covid19-government-measures-dataset
Je compte ajouter ça comme annotations prochainement sur mon interface qui a pas mal bougé depuis mon dernier message cf https://twitter.com/boogheta/status/1244629457547210754

1 « J'aime »

Une question peut-être naïve : qu’est ce qui empêche une ouverture des données Covid de Santé Publique France à un niveau infra-départemental ? Pas forcément communes mais EPCI. J’imagine qu’il y a des enjeux de secret médical et de qualité de données.

1 « J'aime »

Salut ! Je découvre ce site et notamment ce fil. Je me fais mes petites stats dans mon coin depuis le début de l’épidémie en récupérant les données ou j’ai pu (Hopkins, gouvernement, itaile, espagne, etc…). En vrai, j’en avais assez des courbes que je trouve stupides (comparaison d’évolution des cas positifs entre les pays par exemple), et « les allemands sont plus efficaces ». Donc j’ai juste cherché « pourquoi » et je me suis fait mes propres réponses. Mais peu importe. C’était pour faire une petite introduction ^^

Pour info c’est ici https://icit.fr/CNrT
Ce n’est pas destiné à etre spécialement partagé, mais c’est pour arriver à mes questions et peut être que vous saurez me dire.
Concernant la France, les données d’hospitalisations et réanimations sont des données « en cours ». (J’en ai déduis du coup le nombre de « nouvelles admissions » en y ajoutant aussi les personnes sorties (décés et retours à domicile)).

J’ai trouvé des données équivalentes pour l’Italie : https://icit.fr/CNro
Issues de ce flux : https://github.com/pcm-dpc/COVID-19/blob/master/dati-andamento-nazionale/dpc-covid19-ita-andamento-nazionale.csv

Mais pour l’espagne, j’ai un doute : https://icit.fr/CNrs
Issues de ce flux : https://covid19.isciii.es/ (en bas du menu de gauche)
Et ma question : Est-ce que vous savez si le nombre d’hospitalisations de ce flux pour l’espagne, est également un nombre d’hospitalisations « en cours », ou cumulé ? Je n’arrive pas à être certain que c’est « en cours ». Si c’est « en cours » ça fait un nombre de nouvelles admissions assez élevé je trouve. Et si c’est « cumulé », ça fait des nouvelles admissions plutôt faibles vu le nombre de décés en espagne…

Dans les deux cas, comme je me sers de cette donnée pour voir l’évolution des courbes (plus que les valeurs absolues), la réponse n’est pas fondamentale, mais j’aimerais être au plus juste :slight_smile:

Edit : Ah je viens de trouver ma réponse. C’est bien le nombre d’hospitalisation « en cours » car le nombre a baissé dans la région « CM » entre le 01/04 et 02/04 par exemple. désolé pour le bruit ! :slight_smile:

Thanks @boogheta c’était exactement ce que je cherchais !

Bonjour à tous

J’aimerais partager avec vous une carte que j’ai réalisée, de séries temporelles spatialisées des cas COVID

La dimension temporelle est essentielle pour analyser l’évolution du virus. Mais aussi spatiale. C’est pourquoi intégrer ces deux dimensions sur une carte sans forcément faire appel aux animations peut être utile. La carte étant statique, sa lecture est immédiate.

le tweet : https://twitter.com/datagistips/status/1248508331263545344
un projet reproductible sur github : https://github.com/datagistips/sparkline_map
l’article expliquant le code : https://datagistips.hypotheses.org/488
réutilisation datagouv : https://www.data.gouv.fr/fr/reuses/carte-de-levolution-du-covid-en-france/

Aussi, je suis en train de travailler sur une carte mondiale plus stylisée. En voici un extrait :

3 « J'aime »

Sur le sujet des mobilités, le Cerema publie des tableaux de bord et des données pour suivre l’évolution du trafic routier pendant et après le confinement : http://dataviz.cerema.fr/trafic-routier/

2 « J'aime »