Existe-t-il une base de donnée "joinant" les différentes bases SIRENE, Infogreffe, INPI?

rncs

(Julien Fitoussi) #1

Bonjour à tous,

Je cherche à analyser des données d’entreprises en mixant les différentes sources aux formats distincts.
Existe-t-il une plateforme open source qui regroupe ces données en une seule base de données accessible avec SQL?

Merci bcp


(Johan Richer) #2

C’est le but d’entreprise.data.gouv.fr sauf erreur. Les données de l’INPI concernées ne sont pas encore complètement ouvertes comme le demande l’association Ouvre-boîte (dans le simple respect de la loi) :

  • RNCS CA (données non confidentielles des comptes annuels du RNCS) ;
  • RNCS IMR (immatriculations, modifications, radiation enregistrées au RNCS).

Celles-ci ont vocation à être intégrées à entreprise.data.gouv.fr mais on fait face aux habitudes d’un organisme encore peu enclin à l’ouverture…


(Julien Fitoussi) #3

Merci @johan.


(Léonard Michelet) #4

Salut Julien, je me suis lancé dans la création d’une base de données contenant les bilans comptables des entreprises, et une petite fiche d’identité pour chaque entreprise. J’ai le site en ligne et je suis en train de travailler sur l’automatisation d’import d’information. Y’a du python, du javascript et du php et si ce projet peut devenir collectif, je suis preneur:-)
@ bientôt j’espère.


(Christian Quest) #5

Le lien entre ces bases est le code SIREN pour l’entreprise et SIRET pour ses établissements.

Tu peux ajouter dans ta liste, les données publiées en opendata par les greffes sur: https://opendata.datainfogreffe.fr/explore/?sort=modified&refine.theme=Chiffres+cles

Il s’agit des chiffres clé: CA, nombre d’employés.

entreprise.data.gouv.fr fait le lien entre SIRENE et RNCS (et RNA pour les associations), mais n’intègre pas les CA. Tu as une API interrogeable: https://entreprise.data.gouv.fr/api_doc


(Nicolas Bonnel) #6

Il y a aussi des données issue du Bodacc qui peuvent être ajoutées : https://echanges.dila.gouv.fr/OPENDATA/BODACC/