Covid-19, opendata... et analyses à partager

Il y a beaucoup de données disponibles dans le monde pour suivre et tenter de comprendre la désormais pandémie que ce soit la propagation ou sur le plan de l’arbre généalogique du virus et de ses souches diffusés par la propagation.

En France, on ne brille pas trop de ce côté. Des communiqués de presse, des points en PDF, avec quelques jours de retard… des arrêtés préfectoraux en PDF, etc.

Deux analyses me semblent importantes à partager.

La première (par ordre chronologique) est un graphique avec les courbes de progression des cas détectés dans chaque pays/foyer. Ces courbes sont quasiment toutes exponentielles, mais avec un décalage dans le temps pour leur démarrage qui est ici recalé temporellement.

Elle permet de voir que la France a en gros 8 jours de retard sur l’Italie… ce qui ne présage absolument rien de bon. Elle date de plusieurs jours et les chiffres de cas détectés ces derniers jours sont malheureusement bien sur la courbe qu’on pouvait prévoir.

On voit que la mortalité ne suit pas forcément la même progression, peut être à cause de systèmes de soins de niveaux différents (Iran bien au dessus de l’Italie qui se rejoignent quand la saturation de celui-ci arrive).

La seconde est un article bien plus long que j’ai aidé à traduire hier soir et dont je vous recommande la lecture.

Il distingue les cas détectés des cas réels à une date donnée et propose un méthode pour évaluer les cas réels à partir du nombre de décès à une date donnée.

Le ratio décès sur un jour / cas réels à ce même jour serait ainsi de l’ordre de 800. Hier la France a connu 15 nouveaux décès… je vous laisse faire la multiplication.

Il va plus loin que ce constat et analyse les pays où les courbes n’ont pas été exponentielles, des pays d’Asie qui ont retenu les leçons avec l’épidémie passée de SRAS et ont pris des mesures bien plus tôt et bien plus fortes. Il revient aussi plus loin dans le passé sur la grippe espagnole en comparant des villes américaines ayant pris des mesures fortes ou pas.

Bref, la conclusion c’est qu’il faut agir vite et fort, ce qui n’est pas actuellement le cas en Europe.

Qu’aussi bien collectivement qu’individuellement c’est la distanciation sociale qui aujourd’hui est la meilleure des mesures à prendre.

Confinement et quarantaine sont donc prioritaires et vitaux pour repasser à une progression non exponentielle qui indique en fait que les mesures prises sont toujours insuffisantes.

6 « J'aime »

Un nouveau repo github à signaler pour y partager/publier des données en France: https://github.com/opencovid19-fr/data

2 « J'aime »

Pour ceux qui veulent analyser les données italiennes, il y a celui ci : https://github.com/pcm-dpc/COVID-19

EDIT : Et merci pour la co-traduction de l’article, j’ai lu la version originale et c’est super intéressant !

Il n’y a que deux points qui me semblent erronés dans l’article, mais ça ne le remet pas globalement en cause (voir mes tweets).

Une autre initiative https://github.com/lperez31/coronavirus-france-dataset

Hello,

Je me permets de pointer également mon mini projet d’interface d’exploration des données d’Hopkins par pays : j’avais commencé à tracer quelques courbes des données par pays la semaine dernière et ça m’a donné envie de les mettre à jour automatiquement et de pouvoir naviguer un peu dedans, alors je me suis motivé sur deux soirées et une bonne partie du week-end pour pondre ce mini datascape :

L’idée est de pouvoir comparer les courbes des différents pays sur les indicateurs publiés par JHU (cas confirmés, guéris, décès et malades actuels), de les superposer, de les aligner automatiquement (comme ce que @cquest pointait dans son premier message), ou de les voir en parallèles (small multiples), avec des urls pour chaque vue permettant de partager directement un réglage.

Par exemple :

etc.

Vous pouvez highlighter une courbe en survolant la légende, voir les valeurs d’une journée dans la légende en survolant les courbes, et zoomer dans le temps avec la molette de la souris.

5 « J'aime »

Vous avez pas une autre idée de service à developer ?

La courbe de moralité ça me déprime :frowning:

Je cherche plutôt un truc pour soigner mon angoisse :slight_smile:

Cet article de Bastien Guerry (Etalab / DINUM) est très intéressant : « COVID19: Développeurs / datascientistes - Comment aider ? »

Des développeurs et datascientistes se mobilisent pour aider dans la lutte contre le COVID19 (Coronavirus.) Cette page vous aide à vous y retrouver.

1 « J'aime »

Des retours sur les données publiées par Santé Publique France ? https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/

(@samgoeta Salut Samuel, j’espère que tu vas bien )

Sur les données de Santé Publique France, je trouve très compliqué d’utiliser celles qui concernent les taux d’hospitalisations / de SOS Médecins parce qu’il n’y a pas de détail sur ce qu’elles veulent dire où ce qu’il vaut mieux en faire, c’est dommage qu’on n’ait pas non seulement les méta-données et documentation, mais aussi un petit vademecum.

J’ai en revanche utilisé les données sur les hospitalisations / réa / décès publiées quotidiennement qui je l’espère ne vont pas changer de périmètre tout au long de la crise sanitaire. Elles sont plutôt efficace, je vais mettre mon code R sur Github, j’essaie de les augmenter un peu notamment avec des chiffres du nombre de lit, ou la population par département…

1 « J'aime »

Sinon, j’essaie de mettre la main sur les données mobiles d’Orange qui sont distillées dans les médias. Le Figaro a diffusé une carte mais sans les données. Je trouve le papier du Figaro clair, notamment sur les limites de ces données.

Sur les données des opérateurs, lisez cette tribune de la Quadrature : https://www.laquadrature.net/2020/03/28/orange-recycle-son-service-de-geolocalisation-pour-la-pandemie/?fbclid=IwAR1IxqBv-ueHWq6r-9_mTx4m4nbM5IokRz34BI4aHswM5JcBSoCRKnxOSD4

Merci Samuel. Quelque chose me gênait dans cette histoire d’utilisation des données mobiles. La quadrature l’expose très bien.

1 « J'aime »

Que pensez-vous de l’article de Bengio ?

Un dashboard en cours côté Belgique

Bonjour à tous,

l’un de vous connaitrait un open dataset avec les dates de mise en place du confinement par pays ? ceci afin de voir plus clairement la corrélation avec l’infléchissement des courbes après N jours théoriques de confinement

1 « J'aime »

Ici : https://cdonline.articque.com/covid-19.html?map=0_1_0.cartojson

une donnée intéressante et utile pour voir son impact « réel »
mais que je n’ai pas (encore) vu ; John Hopkins ou l’OMS ne le donnent apparemment pas …

J’ai trouvé TV5 (20 mars - https://information.tv5monde.com/info/coronavirus-quels-sont-les-pays-confines-352330 ) ou le Monde (30 mars) - https://www.lemonde.fr/planete/article/2020/03/30/coronavirus-quels-pays-sont-confines_6034936_3244.html

je note que seuls 30 pays (sur 160 ?) sont confinés totalement à ce jour, et vues les variations en terme de couverture ou de rythme (fermeture des frontières; confinement partiel; léger puis total), sans compter l’application plus ou moins rigoureuse du concept (je pense à l’Inde, l’Afrique…) ou plus ou moins facile à appliquer (en guadeloupe ils ont des problèmes … d’eau …), il faudrait définir un biais par pays/régions !

  • les USA ne sont pas confinés : seuls 30 états le sont
  • la Russie ne l’est pas, seul Moscou l’est (10% de la population en russie)
    je pense qu’il serait intéressant de distinguer la fermeture des frontières (ou pas) et les degrés de confinement…et que faire pour des pays comme les USA ou la Russie
    Il y a 160 pays concernés… un tableau assez simple à faire si on s’y mettait …

Bonjour,

J’aimerais partager avec vous une petite appli que j’ai réalisée, qui permet de comparer la population présente sur une carte avec le nombre de cas de COVID-19 enregistrés en France dans le monde.

https://datagistips.shinyapps.io/covid-pop/

L’objet de cette appli et de cette comparaison est de mieux se représenter le nombre de cas.

J’ai mis le code de préparation des données sur github

Je mettrai aussi celui de l’appli une fois que j’en aurai nettoyé le code

1 « J'aime »

L’idée est très bonne, malheureusement le nombre de cas est complètement sous-estimé de l’avis de tout le monde.

1 « J'aime »