Covid-19, opendata... et analyses à partager

Il n’y a que deux points qui me semblent erronés dans l’article, mais ça ne le remet pas globalement en cause (voir mes tweets).

Une autre initiative https://github.com/lperez31/coronavirus-france-dataset

Hello,

Je me permets de pointer également mon mini projet d’interface d’exploration des données d’Hopkins par pays : j’avais commencé à tracer quelques courbes des données par pays la semaine dernière et ça m’a donné envie de les mettre à jour automatiquement et de pouvoir naviguer un peu dedans, alors je me suis motivé sur deux soirées et une bonne partie du week-end pour pondre ce mini datascape :

L’idée est de pouvoir comparer les courbes des différents pays sur les indicateurs publiés par JHU (cas confirmés, guéris, décès et malades actuels), de les superposer, de les aligner automatiquement (comme ce que @cquest pointait dans son premier message), ou de les voir en parallèles (small multiples), avec des urls pour chaque vue permettant de partager directement un réglage.

Par exemple :

etc.

Vous pouvez highlighter une courbe en survolant la légende, voir les valeurs d’une journée dans la légende en survolant les courbes, et zoomer dans le temps avec la molette de la souris.

4 Likes

Vous avez pas une autre idée de service à developer ?

La courbe de moralité ça me déprime :frowning:

Je cherche plutôt un truc pour soigner mon angoisse :slight_smile:

Cet article de Bastien Guerry (Etalab / DINUM) est très intéressant : « COVID19: Développeurs / datascientistes - Comment aider ? »

Des développeurs et datascientistes se mobilisent pour aider dans la lutte contre le COVID19 (Coronavirus.) Cette page vous aide à vous y retrouver.

1 Like

Des retours sur les données publiées par Santé Publique France ? https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/

(@samgoeta Salut Samuel, j’espère que tu vas bien )

Sur les données de Santé Publique France, je trouve très compliqué d’utiliser celles qui concernent les taux d’hospitalisations / de SOS Médecins parce qu’il n’y a pas de détail sur ce qu’elles veulent dire où ce qu’il vaut mieux en faire, c’est dommage qu’on n’ait pas non seulement les méta-données et documentation, mais aussi un petit vademecum.

J’ai en revanche utilisé les données sur les hospitalisations / réa / décès publiées quotidiennement qui je l’espère ne vont pas changer de périmètre tout au long de la crise sanitaire. Elles sont plutôt efficace, je vais mettre mon code R sur Github, j’essaie de les augmenter un peu notamment avec des chiffres du nombre de lit, ou la population par département…

1 Like

Sinon, j’essaie de mettre la main sur les données mobiles d’Orange qui sont distillées dans les médias. Le Figaro a diffusé une carte mais sans les données. Je trouve le papier du Figaro clair, notamment sur les limites de ces données.

Sur les données des opérateurs, lisez cette tribune de la Quadrature : https://www.laquadrature.net/2020/03/28/orange-recycle-son-service-de-geolocalisation-pour-la-pandemie/?fbclid=IwAR1IxqBv-ueHWq6r-9_mTx4m4nbM5IokRz34BI4aHswM5JcBSoCRKnxOSD4

Merci Samuel. Quelque chose me gênait dans cette histoire d’utilisation des données mobiles. La quadrature l’expose très bien.

1 Like

Que pensez-vous de l’article de Bengio ?

Un dashboard en cours côté Belgique

Bonjour à tous,

l’un de vous connaitrait un open dataset avec les dates de mise en place du confinement par pays ? ceci afin de voir plus clairement la corrélation avec l’infléchissement des courbes après N jours théoriques de confinement

Ici : https://cdonline.articque.com/covid-19.html?map=0_1_0.cartojson

une donnée intéressante et utile pour voir son impact « réel »
mais que je n’ai pas (encore) vu ; John Hopkins ou l’OMS ne le donnent apparemment pas …

J’ai trouvé TV5 (20 mars - https://information.tv5monde.com/info/coronavirus-quels-sont-les-pays-confines-352330 ) ou le Monde (30 mars) - https://www.lemonde.fr/planete/article/2020/03/30/coronavirus-quels-pays-sont-confines_6034936_3244.html

je note que seuls 30 pays (sur 160 ?) sont confinés totalement à ce jour, et vues les variations en terme de couverture ou de rythme (fermeture des frontières; confinement partiel; léger puis total), sans compter l’application plus ou moins rigoureuse du concept (je pense à l’Inde, l’Afrique…) ou plus ou moins facile à appliquer (en guadeloupe ils ont des problèmes … d’eau …), il faudrait définir un biais par pays/régions !

  • les USA ne sont pas confinés : seuls 30 états le sont
  • la Russie ne l’est pas, seul Moscou l’est (10% de la population en russie)
    je pense qu’il serait intéressant de distinguer la fermeture des frontières (ou pas) et les degrés de confinement…et que faire pour des pays comme les USA ou la Russie
    Il y a 160 pays concernés… un tableau assez simple à faire si on s’y mettait …

Bonjour,

J’aimerais partager avec vous une petite appli que j’ai réalisée, qui permet de comparer la population présente sur une carte avec le nombre de cas de COVID-19 enregistrés en France dans le monde.

https://datagistips.shinyapps.io/covid-pop/

L’objet de cette appli et de cette comparaison est de mieux se représenter le nombre de cas.

J’ai mis le code de préparation des données sur github

Je mettrai aussi celui de l’appli une fois que j’en aurai nettoyé le code

L’idée est très bonne, malheureusement le nombre de cas est complètement sous-estimé de l’avis de tout le monde.

1 Like

Dans mon entourage une douzaine de malades covid (dont moi, en convalescence) et aucun dans les stats officielles.
De même les décès sont incomplets car décomptés uniquement en milieu hospitalier.
Le nombre de patients en réa ? Il est limité par les places de réa… quand c’est saturé ça ne veut plus rien dire, ou alors il faudrait le nombre de patients qu’on n’a pas pu mettre en réa, chiffre hautement sensible car il pointe clairement la saturation du système de santé.

Bref, aujourd’hui, en France on a des chiffres qui ne permettent plus de mesurer exactement l’ampleur de l’épidémie ni sa dynamique.

Le fichier des personnes décédées de l’INSEE permettra dans quelques temps d’y voir plus clair.

En attendant les décisions du gouvernement se basent sur une vue tronquée de la réalité et sont donc inapdaptées et toujours en retard.

Dominique Boulier a assez bien résumé les problèmes de qualité de ces données : https://shs3g.hypotheses.org/574

L’INSEE devrait mettre à jour la base des personnes décédées dans une semaine. Avec ces données, on devrait pouvoir faire des analyses assez précises me semble-il en rapprochant l’age et le lieu de décès.

2 Likes

@guillaume_v Pour les mesures de confinement, etc, il y a une base qui a l’air très riche et bien maintenue ici https://www.acaps.org/covid19-government-measures-dataset
Je compte ajouter ça comme annotations prochainement sur mon interface qui a pas mal bougé depuis mon dernier message cf https://twitter.com/boogheta/status/1244629457547210754

1 Like