Fichier INSEE des personnes décédées

Suite à une saisine de la CADA qui se termine bien, l’INSEE a publié il y a quelques jours, sur data.gouv.fr (ils s’y mettent enfin ?) le fichier des personnes décédées.

Fichier fort intéressant, qui démarre vers 1970 (attention, les premières années ne sont visiblement pas complètes) et va pour l’instant jusqu’octobre dernier.

Les données sont publiées en fichiers texte de format fixe (un par année, puis un par mois à partir de 2019).
J’ai remis ça en un CSV qui va bien:

http://data.cquest.org/insee_deces/

Plus de 24.8 millions de décès y figurent avec:

  • nom, prénoms
  • date et lieu de naissance
  • date, lieu de décès et numéro d’acte

Des idées d’analyse ?

Une première me vient à l’esprit… la « migration »: décède-t-on loin de notre lieu de naissance… est-ce homogène ou bien y a-t-il des disparités géo ou de génération ?

Les amateurs de prénoms seront aussi comblés… certaines personnes en ont tellement que comme pour zézette épouse X, ça dépasse !

Y a-t-il d’ailleurs des prénoms qui font vivre plus longtemps ?

5 J'aimes

Bonjour,

Tout d’abord merci pour le fichier CSV, je n’ai pas vraiment compris l’intérêt de la structuration des fichiers .TXT de l’INSEE compliqué pour un utilisateur lambda pour les manipuler.

Pour les réutilisations, je peux déjà en citer deux dans le secteur marchand de la généalogie. Les portails Geneanet et Filae ont nourri leur moteur de recherche d’ancêtres avec ces fichiers.

Au-delà de ces portails s’adressant plutôt aux amateurs de généalogie familial, je sais par avance que les études de généalogistes professionnels font apprécier l’accès à ces informations pour leur recherche successorale.

Concernant la non complétude des informations, sur quoi basez-vous votre analyse ? Je pense utiliser pour nos lecteurs en archives départementales cette ressource mais si les informations sont lacunaires, je dois aussi les en informer.

2 J'aimes

La non complétude ? Il suffit de voir la taille des fichiers 1970 et 1971 pour se dire que c’est sûrement pas complet (et j’ai pu vérifier en cherchant 2 décès familiaux de juin 1970).

Je pense que c’est la phase de démarrage de la base, qui n’a sûrement pas tout récolter à ce moment.

L’INSEE indique aussi que ce fichier peut être incomplet et ne peut pas servir à s’assurer que quelqu’un est toujours en vie !

1 J'aime

Je partage ici une réutilisation repérée sur twitter qui exploite les données via un dashboard kibana et si je comprends bien grâce au CSV de @cquest