DVF - Données avant 2016

Bonjour,

Il est possible de télécharger les 5 dernière années pour les données de Demandes de Valeurs Foncières : https://www.data.gouv.fr/fr/datasets/demandes-de-valeurs-foncieres/#_. Je ne trouve pas d’informations sur le fait qu’on ai le droit d’accéder ou non aux données des années d’avant, en particulier les années 2014 et 2015 qui étaient au début présentes dans la publication de ces données.

Les données ont sur data.gouv la licence ouverte 2.0, mais il y a en plus des clauses particulière. Je ne vois cependant rien concernant les années avant les 5 dernières, mis à part dans la FAQ la mention :

Conformément au décret du 28 décembre 2018, les fichiers mis à disposition par
l’administration fiscale portent sur les mutations intervenues uniquement au cours des
cinq dernières années.

Cela soulève plusieurs questions :

  • Si nous avons gardé les fichiers de 2014 et 2015, avons nous le droit de les publier en opendata ?
  • Pourquoi Etalab a retiré les version de 2014 et 2015, avec une 404 sur cette page : https://cadastre.data.gouv.fr/dvf , alors que ce n’est pas « l’administration fiscale » ?
  • Nous avons été contacté par une personne qui voulait que nous supprimions une ligne (correspondant a la transaction de son bien) d’un extrait de 2014 que nous avions publié en opendata : il a dit avoir téléphoné « au cabinet du premier ministre » et qu’il était dans son bon droit de nous demander cela, je trouve ca bizarre.
1 « J'aime »

Ce décret impose à l’administration de publier les 5 dernières années. Dans un autre cas (Alim-Confiance = résultat des contrôles d’hygiènes), c’est le dernier contrôle et pendant un an.

Rien n’empêche de conserver les données plus anciennes et de les utiliser à ce que je sache (ce n’est pas explicitement interdit donc c’est autorisé).

Pour DVF, les plus anciennes ouvertes sont ici: http://data.cquest.org/dgfip_dvf/201904/
Pour alim-confiance… http://data.cquest.org/alim_confiance/

Alim-confiance est une des raisons qui m’a poussé à commencer à archiver des données :wink:

7 « J'aime »
  • Nous avons été contacté par une personne qui voulait que nous supprimions une ligne (correspondant a la transaction de son bien) d’un extrait de 2014 que nous avions publié en opendata : il a dit avoir téléphoné « au cabinet du premier ministre » et qu’il était dans son bon droit de nous demander cela, je trouve ca bizarre.

Encore un vieux schnock mal dégrossi.

Il doit y en avoir pas mal… J’avais eu également eu un message du même style en 2020.

Dans le doute, j’avais supprimé leur présence sur mon site « grand public » mais les avait conservé ainsi que les réutilisations correspondantes sur mon site à accès restreint aux collectivités clientes…

Sur le dernier point, le guide CADA-CNIL précise que lorsque la loi autorise la publication en open data de données à caractère personnel (et à mon sens c’est bien le cas des DVF), les droits issus du RGPD demeurent, dont le droit d’opposition des personnes concernées à la diffusion :

le droit d’opposition des personnes concernées à la diffusion : les personnes dont les données seront diffusées en « open data » pourront faire valoir leur droit d’opposition en application de l’article 21 du RGPD pour des raisons tenant à leur situation particulière. L’administration conservera la possibilité de refuser de faire droit à toute demande de suppression en faisant valoir un motif légitime et impérieux supérieur prévalant sur les intérêts et les droits et libertés de la personne concernée (par exemple, dans le cadre de la publication de son organigramme en ligne, une administration pourra refuser de faire droit à une demande d’opposition qui serait formulée par un agent occupant des fonctions nécessitant que son identité soit portée à la connaissance du public).
Par ailleurs, les bases de données mises en « open data » pourraient être marquées par le biais de «tags » afin que chaque réutilisateur puisse identifier précisément les documents pour lesquels des droits d’opposition à certaines réutilisations ont été enregistrés par le responsable du traitement initial

Dans ce cas précis, il n’est pas certain que le « motif légitime impérieux et supérieur » soit bien établi. En revanche, techniquement, ça me semble à peu près impossible de garantir l’effectivité de ce droit vu la manière dont notre open data fonctionne aujourd’hui (sans identifiant unique de jeux de données notamment et donc sans traçabilité…).

1 « J'aime »

Ah bon… pour partir de DVF et remonter à UNE personne, il faut bien bien plus que DVF car on a juste un numéro de parcelle et une adresse. Le lien adresse personne n’est vraiment pas direct.
Si je prends mon adresse, il y a trois personnes qu’on peut rattacher… qui a fait la transaction ? Peut être aucune des trois si nous ne sommes pas propriétaires.

Il faut mobiliser bien d’autres bases pour faire le lien.

Ce problème est la raison pour laquelle j’avais proposé dans la consultation sur la rédaction de la Loi Lemaire, de créer un délit de désanonymisation…

1 « J'aime »

ça ne me plaît pas trop mais je crains qu’on soit bien face à des données « potentiellement réidentifiantes » au sens du RGPD… ce qui ne signifie pas nécessairement qu’il y ait une relation 1 à 1 entre les données publiées et la personne concernée.

Le problème c’est que potentiellement aujourd’hui rares sont les données qui ne sont pas potentiellement réidentifiantes.

C’est bien l’acte de réidentifier qui aurait dû être contrôlé, plus que la possibilité de le faire.

DVF ce ne sont que des attributs luiés à une parcelle, elle même liée à une adresse (qui n’est pas forcément celle du propriétaire)… rien de plus. Si on considère que toute donnée contenant une adresse est potentiellement réidentifiante, ça va faire mal.

Exemple, le RPLS… chaque logement social y figure, avec bien sûr l’adresse. On tombe dans la même catégorie ?

Le principe même de l’opposabilité au tiers qui sous-tend tout acte portant sur des biens immeubles vient en opposition à cette demande.
Cette personne fait partie de la chaîne de propriété qui permet au titulaire de droit actuel d’opposer son droit aux tiers. Donc sauf à ce que la suite de la chaîne (après votre demandeur) possède une période de trente années de possession consécutive, (difficile mais possible) et donc que la chaîne ce réinitialise, votre demandeur je pourrais toujours avoir son nom et sa date de naissance. Via une réquisition aux hypothèques sur la parcelle actuelle et une demande de copies d’actes, s’il n’est pas le « propriétaire » actuel, il apparaîtra dans l’effet relatif ou l’origine de propriété du dernier acte, de vente en l’occurrence puisque c’est DVF le sujet.
Pour une meilleur compréhension cf :
La chaîne de propriété - Base de Connaissances du GIRTEC - Confluence (atlassian.net)
et
Le système foncier - Base de Connaissances du GIRTEC - Confluence (atlassian.net)

Pour répondre à Joël et à Christian : la référence de publication a été supprimée dans ces données pour la rendre open. Ce qui la rend inutilisable, rires. La remplacer par un entier unique eut été utile et intelligent.
La deuxième donnée à virer c’est toute référence de date. Car comme toute donnée cadastrales (et c’est de ça que l’on parle pas des données de FIDJI des hypo) la référence parcellaire et l’adresse sont relatives à la date de la publication de l’acte. Et là ça devient compliqué à réidentifier.
Et là nous avons un superbe dataset qui sert à rien.

Tout le problème est le traitement numérique de masse et l’accès normal à l’information (opposabilité aux tiers).
Quel traitement numérique à partir de quel ensemble de jeu de données peut il permettre la réidentification automatique de DVF ?

Perso je vois pas.

1 « J'aime »

J’ajoute que je publierai bientôt sur cette KB une page sur DVF.
Une donnée à laquelle on fait bien dire des bêtises, car peu ont compris ce qu’elle est réellement, ce qu’elle signifie, comment elle est produite et les qualités des informations contenues.

Normal le producteur n’est pas bavard … et légèrement gêné par le poids de l’histoire (pb classique des système informatiques).

1 « J'aime »

Très intéréssé par ce que tu dis :smiley: , j’exploite DVF, j’ai compris les mutations et transactions mais ça m’interesse de pousser plus loin si tu es toujours présent xD

Bonjour @nicolas-bonnel ,

Je suis un simple utilisateur final des données DVF via des sites « grand public » : en effet, voulant acheter une nouvelle maison et en parallèle revendre ma maison actuelle, les informations issues de ces données me sont très utiles et pertinentes afin de connaître les prix des biens dans mon secteur et ne pas avoir à dépendre des agents immobiliers qui me disent ce qu’ils veulent en fonction de leurs intérêts.

Cependant, la première limite qui apparaît, en utilisant les sites existants pour consulter l’historique des prix des transactions immobilières est l’affichage de ces données uniquement sur les 5 dernières années, ce qui restreint fortement le nombre de transactions affichées.
Or, comme vous le dites, si l’administration ne transmet les données DVF que sur les 5 dernières, comme l’y oblige un décret, rien n’empêche légalement les utilisateurs de ces données de les stocker et de continuer à les exploiter en les mettant à disposition des utilisateurs finaux.
N’ayant trouvé aucun site en accès public permettant de remonter au-delà des 5 ans, connaissez-vous un site web ou application permettant de consulter les données DVF avec un historique supérieur aux 5 ans fatidiques ?
Merci d’avance pour votre aide,

Alan

La réponse est un peu plus haut : Index of /dgfip_dvf/.
Mais se sont des données brutes, plus complexes à prendre en main.

Elles sont également sur Opendatarchives : Index of /cadastre.data.gouv.fr/data/etalab-dvf/2019-04/csv/

1 « J'aime »

Version récupérée automatiquement… là où sur data.cquest.org je le fais manuellement.

Tout est sur le même serveur, qui chauffe ma cave et mon bureau :wink:

Merci.
C’est moins user-friendly que les outils avec carto, mais en filtrant bien sous un tableur, on arrive quand même à les exploiter pour étudier les prix sur un secteur.