Existe-t-il une base de donnée "joinant" les différentes bases SIRENE, Infogreffe, INPI?

Bonjour à tous,

Je cherche à analyser des données d’entreprises en mixant les différentes sources aux formats distincts.
Existe-t-il une plateforme open source qui regroupe ces données en une seule base de données accessible avec SQL?

Merci bcp

C’est le but d’entreprise.data.gouv.fr sauf erreur. Les données de l’INPI concernées ne sont pas encore complètement ouvertes comme le demande l’association Ouvre-boîte (dans le simple respect de la loi) :

  • RNCS CA (données non confidentielles des comptes annuels du RNCS) ;
  • RNCS IMR (immatriculations, modifications, radiation enregistrées au RNCS).

Celles-ci ont vocation à être intégrées à entreprise.data.gouv.fr mais on fait face aux habitudes d’un organisme encore peu enclin à l’ouverture…

Merci @johan.

Salut Julien, je me suis lancé dans la création d’une base de données contenant les bilans comptables des entreprises, et une petite fiche d’identité pour chaque entreprise. J’ai le site en ligne et je suis en train de travailler sur l’automatisation d’import d’information. Y’a du python, du javascript et du php et si ce projet peut devenir collectif, je suis preneur:-)
@ bientôt j’espère.

Le lien entre ces bases est le code SIREN pour l’entreprise et SIRET pour ses établissements.

Tu peux ajouter dans ta liste, les données publiées en opendata par les greffes sur: https://opendata.datainfogreffe.fr/explore/?sort=modified&refine.theme=Chiffres+cles

Il s’agit des chiffres clé: CA, nombre d’employés.

entreprise.data.gouv.fr fait le lien entre SIRENE et RNCS (et RNA pour les associations), mais n’intègre pas les CA. Tu as une API interrogeable: https://entreprise.data.gouv.fr/api_doc

1 « J'aime »

Il y a aussi des données issue du Bodacc qui peuvent être ajoutées : https://echanges.dila.gouv.fr/OPENDATA/BODACC/

1 « J'aime »

Vu sur data.gouv.fr (passé inaperçu ?) :

Vu le caractère relativement permissif des clauses de la licence (par exemple celle concernant la base RNCS CA), qui autorise à “reproduire, copier, adapter, modifier, extraire, transformer, créer des « Informations dérivées », communiquer, diffuser, redistribuer, publier, transmettre, exploiter à titre commercial ou non commercial…”, je ne comprends pas ce qui justifie de ne pas publier sur data.gouv.fr sous LO, éventuellement avec des mentions légales supplémentaires (le bon compromis trouvé avec la base DVF).

Vivement que tout ça soit librement accessible sur entreprise.data.gouv.fr !

EDIT :
Correction, ça a l’air de bouger du côté du nouveau portail data.economie.gouv.fr.
Pour l’instant seulement des extraits :

A suivre de près.