Récupérer les données de societe.com (scraping Python)

C’est un beau site, mais ma compréhension est :

  • il est issu de la récupération et l’agrégation des bases Sirene, INPI, etc. Donc a priori ne ramène pas spécialement plus de données
  • on ne peut pas récupérer une base de données agrégée de tous les SiRET sur ce site. Ce qui aurait été super utile, mais à mon avis n’existe pas. Je pense que l’agrégation est faite, par SiRET, « en live », au moment de la recherche du SiRET.
  • il semblerait qu’il existe une possibilité d’intégrer ces données agrégées directement dans une autre application, mais uniquement si la dite application est à fin d’intérêt général.

Est ce que je rate quelque chose ?

Hello,

@GuillaumeD effectivement, l’Annuaire des Entreprises n’est pas disponible sous forme d’API.

En revanche on est essaie d’être le plus transparent sur l’origine des données et on met systématiquement un lien « source de données » dans chaque encadré.

En cliquant sur « source de données » → « En savoir plus » on accède à la page de l’administration expliquant notamment quelle API utiliser pour accéder à la donnée librement.

Vous pouvez également retrouver toutes les API utilisées dans l’Annuaire ici : Statut des API partenaires de l'Annuaire des Entreprises

@toto C’est bien cela, l’Annuaire a vocation à centraliser toutes les données open data des entreprises mais ne produit pas de base de donnée aggrégée.

Pour les administration il existe une API d’aggrégation : API Entreprise mais elle est réservée aux administrations et car elle ne contient pas que de la donnée ouverte.

1 Like

Bonjour, merci beaucoup pour ce site. Est ce quelqu’un aurait des indications vis à vis de la signification des chiffres présents dans chaque document pour les comptes. (Lequel correspond au chiffre d’affaire etc).
Merci de votre retour