Bonjour à tous,
Je cherche à analyser des données d’entreprises en mixant les différentes sources aux formats distincts.
Existe-t-il une plateforme open source qui regroupe ces données en une seule base de données accessible avec SQL?
Merci bcp
Bonjour à tous,
Je cherche à analyser des données d’entreprises en mixant les différentes sources aux formats distincts.
Existe-t-il une plateforme open source qui regroupe ces données en une seule base de données accessible avec SQL?
Merci bcp
C’est le but d’entreprise.data.gouv.fr sauf erreur. Les données de l’INPI concernées ne sont pas encore complètement ouvertes comme le demande l’association Ouvre-boîte (dans le simple respect de la loi) :
Celles-ci ont vocation à être intégrées à entreprise.data.gouv.fr mais on fait face aux habitudes d’un organisme encore peu enclin à l’ouverture…
Salut Julien, je me suis lancé dans la création d’une base de données contenant les bilans comptables des entreprises, et une petite fiche d’identité pour chaque entreprise. J’ai le site en ligne et je suis en train de travailler sur l’automatisation d’import d’information. Y’a du python, du javascript et du php et si ce projet peut devenir collectif, je suis preneur:-)
@ bientôt j’espère.
Le lien entre ces bases est le code SIREN pour l’entreprise et SIRET pour ses établissements.
Tu peux ajouter dans ta liste, les données publiées en opendata par les greffes sur: https://opendata.datainfogreffe.fr/explore/?sort=modified&refine.theme=Chiffres+cles
Il s’agit des chiffres clé: CA, nombre d’employés.
entreprise.data.gouv.fr fait le lien entre SIRENE et RNCS (et RNA pour les associations), mais n’intègre pas les CA. Tu as une API interrogeable: https://entreprise.data.gouv.fr/api_doc
Il y a aussi des données issue du Bodacc qui peuvent être ajoutées : https://echanges.dila.gouv.fr/OPENDATA/BODACC/
Vu sur data.gouv.fr (passé inaperçu ?) :
- La licence de réutilisation des informations de l’institut National de la Propriété Industrielle (INPI) est homologuée par la décision d’homologation du 17 avril 2019 pour les données des bases Marques françaises, Brevets français et européens, Dessins et modèles, Jurisprudence judiciaire française, et Décisions d’opposition de l’INPI jusqu’au 16 avril 2022.
- La licence de réutilisation des informations de l’institut National de la Propriété Industrielle (INPI) est homologuée par la décision d’homologation du 17 avril 2019 pour les données du Registre National du Commerce et des Sociétés de l’INPI jusqu’au 16 avril 2022.
Vu le caractère relativement permissif des clauses de la licence (par exemple celle concernant la base RNCS CA), qui autorise à “reproduire, copier, adapter, modifier, extraire, transformer, créer des « Informations dérivées », communiquer, diffuser, redistribuer, publier, transmettre, exploiter à titre commercial ou non commercial…”, je ne comprends pas ce qui justifie de ne pas publier sur data.gouv.fr sous LO, éventuellement avec des mentions légales supplémentaires (le bon compromis trouvé avec la base DVF).
Vivement que tout ça soit librement accessible sur entreprise.data.gouv.fr !
EDIT :
Correction, ça a l’air de bouger du côté du nouveau portail data.economie.gouv.fr.
Pour l’instant seulement des extraits :
A suivre de près.