Quasi-opendata ou opendatafail pour le RNCS diffusé par l'INPI ?

A cause d’une licence vraiment pas ouverte, on ne pouvait par vraiment parler d’opendata pour les données du RNCS provenant des greffes des tribunaux de commerce et diffusées par l’INPI.

Une nouvelle licence a été homologuée en avril par la DINSIC, très proche de la licence ouverte… mais quid de la diffusion et des données ?

La suite (un peu longue) est à lire sur: https://medium.com/@cq94/le-rncs-en-quasi-opendata-57446c6fc8dd

1 Like

Fin avril l’INPI lançait un marché pour la « conception et réalisation d’un portail data » (notez d’entrée l’absence d’open) : https://www.boamp.fr/avis/detail/19-67848 (DCE archivé ici)

La description du cahier des charges et des fonctionnalités attendues donnait peu d’espoir quant à un changement de l’INPI dans sa politique open data actuelle telle que Christian la décrit dans son article. Ainsi, on s’aperçoit vite qu’il faudra toujours passer par leur procédure et signer leur licence désormais homologuée afin d’obtenir le fameux statut de… « licencié open data ». :man_facepalming: Par ailleurs, la mise à disposition des fichiers via un serveur FTP y figure toujours en bonne place, avec comme seule évolution envisagée la mise en place d’un « module d’authentification » et du « filtrage par IP ». :nauseated_face: Comment maintenir le statu quo à tout prix…

Du nouveau aujourd’hui : Saisie et export de comptes annuels du RNCS

On y trouve des informations sur le RNCS et le fonctionnement interne de l’INPI, avec notamment des chiffres de volumétrie :

  • Environ 3 To de données existant actuellement (principalement PDF, métadonnées au format XML)
  • 1,4 million de documents PDF pour les comptes annuels en 2018 (1,2 million en 2017)
  • Sur un total de 5,3 millions de « formalités » du RNCS en 2018 (immatricutions, actes de société et comptes annuels)

L’INPI semble rencontrer de nombreux problèmes dans le traitement de ces documents etcherche de toute évidence à investir pour y mettre de l’ordre et industrialiser leurs processus. C’est une bonne nouvelle, mais est-ce que tout cela ira dans le sens de l’ouverture de ces données ? Vu la gueule de leur futur « portail », on dirait que non. Bref chez l’INPI l’open data c’est deux pas en avant, un pas en arrière.

(Sans oublier les épisodes précédents :arrow_heading_down:)

1 Like

Pour info, l’INPI avait déjà passé des marchés de saisie de données par le passé. Je n’ai pas regardé en détail si le CCTP a significativement évolué. Voir https://ted.europa.eu/udl?uri=TED:NOTICE:44579-2018:TEXT:FR:HTML&tabId=1 ou encore https://www.boamp.fr/avis/detail/16-29308, par exemple.

L’aberration semble provenir du fait que ce sont des scans que reçoit l’INPI qui est obligé de tout (faire) ressaisir (avec toutes les erreurs que ça implique).

J’imagine que ces même infos, sont saisies du côté des greffes… donc chacun dans son silo, comme d’habitude.

Quand on voit la tête des CSV des tribunaux de commerce, ça fait peur et confirme bien qu’ils font vraiment tout pour ne pas ouvrir ces données car en interne il n’utilisent sûrement pas ces CSV différentiels.

Presque 20 ans après l’an 2000, on pourrait s’attendre que les dépôts de compte ne se fassent plus au format papier, que tout ça alimente directement les bases de données… et l’opendata.

1 Like

Merci pour cette intiative et la mise à disposition des données ! Et j’ai bien aimé l’article qui explique toute la démarche et le procédé.

Je partage tes conclusions sur le fait que si on ne veut pas que les données soient réutilisées, on ne n’y prendrait pas autrement. Ce qui me choque le plus, c’est qu’entre un délai d’inscription de 48h et la limitation à 1 Go de transfert par jour avec le fait que les fichiers ne soient pas ou mal compressés, il faille plusieurs jours (une semaine ?) pour accéder aux données brutes.

Oui, à peu près… et encore, je ne découvrais pas le sujet.

Je n’ai pas encore terminé le téléchargement initial. Il me manque les IMR des tribunaux mixtes… mais tout ce que j’ai récupéré est maintenant sur data.cquest.org

Il ne reste plus qu’à automatiser les mises à jour…

Du coup, d’après cette licence ad-hoc, que peut-on faire avec ces données ?

J’ai commencé à jumper d’articles en articles du code du commerce à partir des références que tu donnes ici (en bas), mais c’est très cryptique.

Bonjour,
Certains ont déjà commencé à exploiter avec habilité la licence : https://pappers.spreadpress.fr/tous-les-documents-dinfogreffe-statuts-pv-dag-disponibles-gratuitement

Bonjour,

Je n’ai pas trouvé les bilans PDF sur https://data.cquest.org/, est-on obligé de passer par l’API de l’INPI/RNCS pour récupérer les versions PDF des bilans ?

Oui, et je ne sais même pas si les PDF sont accessible par l’API ou juste sur le site web derrière un captcha.

Il est bien possible d’avoir les PDF via l’API

  1. Il faut se logger
  2. https://opendata-rncs.inpi.fr/services/diffusion/bilans/find?siren=123456789 (une requête par SIREN)
  3. https://opendata-rncs.inpi.fr/services/diffusion/document/get?listeIdFichier=123456 avec les id des fichiers
  4. Ca donne un zip contenant un autre zip qui contient lui-même le pdf.

Pour le côté opendata on va devoir attendre…

1 Like

Mail reçu aujourd’hui de l’INPI :

Chers licenciés,

La parution le 19 juillet 2022 du décret d’application de la loi PACTE relatif au Registre national des entreprises (cf. pièce jointe) conduit à une refonte au 1er janvier 2023 du dispositif de mise à disposition des données sur les entreprises. Le Registre national du commerce et des sociétés, pour lequel vous avez souscrit une ou plusieurs licences, ne sera plus alimenté à cette date et fera place au Registre national des entreprises, avec un périmètre plus large et un format de données différent.

Le nouveau format de données qui sera utilisé sera le JSON en lieu et place des formats XML et CSV utilisés actuellement.

Afin de vous permettre d’adapter vos systèmes informatiques d’ici 1er janvier 2023, il nous a semblé souhaitable de vous fournir dès à présent la documentation technique décrivant le nouveau format des données du Registre national des entreprises.

Nous vous prions d’en prendre connaissance et nous tenons à votre disposition pour toute précision.

décret RNE 19 juillet 2022.pdf (452,6 Ko)
documentation technique API formalités.pdf (275,5 Ko)

1 Like

Aucune période de transition entre les deux ?

Pas d’API beta pour mettre à jour du code existant ?

Comme d’hab… souvenir du changement de diffusion de SIRENE par l’INSEE :frowning:

Bonjour,
savez-vous si c’est possible de « paginer » la réponse au API « https://opendata-rncs.inpi.fr/services/diffusion/actes/find?dateDepotDebut=20221005&dateDepotFin=20221005 » ?

Car la réponse semble être limité à 500 résultats.

Merci pour votre aide

Nouveau mail reçu aujourd’hui de l’INPI :

Bonjour,
Nous revenons vers vous comme convenu sur le nouveau format de mise à disposition des données sur les entreprises au 1er janvier 2023.
Nous avons reçu de nombreuses questions sur le sujet dont vous trouverez ci-dessous une synthèse avec nos réponses.

Question : Pouvez-vous indiquer si la diffusion de la base Sirene gérée par l’Insee sera également stoppée le 1er janvier 2023 ? Et si le périmètre de données du Registre national des entreprises prendra le relais du flux Sirene ?

Réponse : Il s’agit de deux flux différents. Il n’est pas prévu que la diffusion de la base Sirene soit arrêtée au 1er janvier 2023. Nous vous invitons à contacter directement l’Insee.

Q : Existera-il une limitation en nombre de requêtes par jour par exemple ?

R : Oui, il y aura une limite de 10Go par jour et 10 000 fichiers par jour.

Q : Sera-t-il possible d’obtenir le stock des entreprises via cette API ?

R : Un stock sous format Json sera mis à disposition via un serveur SFTP.

Q : Serait-il possible d’obtenir un guide de migration (FTP vs nouvelle API) ?

R : Ce ne sera malheureusement pas possible.

Q : Vous indiquez que le système actuel ne sera plus alimenté au 1er janvier 2023 mais pas la date de mise en fonction du nouveau système ? (Y aura-t-il une période pendant laquelle les 2 systèmes cohabiteront ? Cela permettrait de mener des tests avant le lancement officiel)

R : Le nouveau système sera mis en production au 1er janvier 2023.

Q : Allons-nous recevoir plus de documentation ?

R : Nous vous adresserons en effet une documentation complémentaire pour chaque API et FTP.

Q : Avez-vous un document avec la liste des valeurs possibles par champ ?

R : Un dictionnaire des données sera mis à disposition.

Q : Les bénéficiaires effectifs seront-ils disponibles pour tout le monde ?

R : Seules les données publiques des bénéficiaires effectifs seront disponibles pour tous.

Q : On ne voit pas de champs dans le document fourni en rapport avec les comptes annuels saisis qui proviennent actuellement du RNCS. Serons-ils mis à jour via le nouveau système ?

R : Les comptes annuels seront publiés comme actuellement mais le format changera à terme pour du Json.

Q : A partir du 1er janvier 2023, le FTP contenant les CSV & XML pour IMR_Donnees_Saisies (TC et TITMC) ne sera plus alimenté, voire plus disponible du
tout ?

R : C’est bien cela en effet, les fichiers en CSV ne seront plus livrés.

Q : Ce FTP est très utile pour détecter au jour le jour les « mouvements » sur les entreprises (changements de RBE, nouveaux bilans, cessations, etc.) et est-ce que la recherche différentielle couvre tout le spectre du FTP ?

R : En effet, la recherche différentielle couvrira le tout, mais les champs modifiés ne seront pas visibles.

Q : Disposerez-vous toujours d’un serveur FTP pour récupérer ces informations ? Pour les connecteurs à grand volume c’est bien plus facile à exploiter qu’une API.

R : Oui, un serveur SFTP sera mis à disposition.

Q : Dans le cas où vous ne disposez pas de serveur FTP, il faudra faire un appel à l’API de « RECHERCHE DIFFÉRENTIELLE » quotidiennement, mais y aura-t-il un nombre d’appels limite ? Il est courant qu’il y ait quelques 20 000 Siren impactés par des changements dans le RNCS actuellement (parfois par des émissions de stocks, difficile de savoir en flux pur).

R : Nous aurons également un SFTP pour le flux.

Q : Maintiendrez-vous le RNCS en parallèle ? En particulier si les actes et observations disparaissent du RNE, beaucoup d’entreprises préféreront probablement garder ces informations quitte à rester sur le RNCS plutôt que le RNE.

R : Ce ne sera pas le cas, le RNCS étant voué à disparaître. Le RNE remplacera le RNCS, les actes et les observations seront toujours disponibles.

Q : Aurez-vous une façon de requêter tous les changements du jour (pour toutes les entreprises) ?

R : Oui, il y aura une API différentielle.

Q : « Les entreprises peuvent être recherchées par leur numéro SIREN ou par leur dénomination » : quid de la différence entre l’unité légale (Siren) et l’établissement (Siret). N’est-il pas possible de récupérer les flux différentiels établissements ?

R : Ce ne sera pas possible car les établissements seront compris dans le Json global de la société, donc un changement sur un établissement sera vu comme un changement sur la société.

Q : « Il est à noter que le BlocAdresse, lorsqu’il s’agit de l’adresse d’une personne physique, est soumis à la réglementation sur les données personnelles (RGPD), qui autorise à communiquer uniquement la commune » : actuellement au répertoire Siren, nous avons l’adresse des personnes physiques.

R : Nous vous invitons à contacter directement l’Insee.

Q : « publicationLegale » : cela équivaut-il aux observations IMR ? si oui, allez-vous créer une codification particulière ?

R : Non, il s’agit de la forme sous laquelle la publication de la société a été faite.

Q : « BlocEntrepriseChapeau » : Parlez-vous des liens inter-entreprises / actionnariats ?

R : Non, il ne s’agit pas de l’actionnariat, mais effectivement il peut y avoir des données d’une autre entreprise B dans une entreprise A, si par exemple B fait partie des associés de A, ou si B est une entreprise domiciliataire de A, ou une entreprise de gestion de A.

Q : Pourriez-vous préciser s’il sera toujours possible d’effectuer des interrogations individuelles sur une société ou s’il sera obligatoire de passer via l’API ?

R : L’IHM DATA INPI sera toujours en fonction, vous ne serez pas tenus de passer par les API.

Q : La documentation technique du nouveau RNE ne fait pas état de radiations ou d’actes, ou de moyen de télécharger des actes PDF, et également la liste des représentants (président, directeur général…) d’une entreprise n’a pas l’air d’être disponible.

R : Les actes seront présents, la liste des représentants est dans le Json.

Q : Est-ce que ces données seront toujours disponibles sur le FTP existant à compter du 1er janvier 2023 ?

R : Non, un SFTP remplacera le FTP actuel.

Q : L’API existante permettra-t-elle toujours de récupérer les actes sous format PDF ?

R : Non, l’ancienne API sera remplacée par la nouvelle.

Q : Les données seront-elles reçues directement en Json telles que le fait l’Insee avec son API Sirene par exemple ? Ou bien les données seront dans un fichier Json qu’il faudra décompresser comme actuellement ?

R : Un zip est transmis comprenant tous les différents Json des sociétés.

Q : Qu’en est-il pour les comptes au format XML et les actes en PDF ? Seront-ils toujours disponibles ?

R : En effet, ils seront toujours disponibles. Cependant, les comptes annuels seront au format Json.

Q : Pourriez-vous indiquer si la documentation technique que vous nous avez adressée est disponible en anglais ?

R : Elle n’est pas disponible en anglais.

Q : Est-ce que les paramètres de date seront sous le format ‘date’ ou ‘datetime’ ?

R : Les dates saisies (ex : date de naissance) seront au format date mais les dates techniques générées automatiquement seront sous format datetime.

Q : Il existe actuellement deux façons de recevoir des informations du registre des bénéficiaires effectifs :

1. Récupération d’un .ZIP contenant un XML et un/des PDF

2. Récupération d’un XML

À notre niveau, nous avons mis en place la première solution consistant à récupérer le ZIP et en extraire le(s) PDF.

Ainsi, la communication suivante « Le nouveau format de données qui sera utilisé sera le JSON en lieu et place des formats XML et CSV », s’applique-t-elle uniquement à la solution 2 ou impacte-t-elle également la solution 1 avec le(s) PDF ?

R : Les deux. Les XML seront remplacés par des Json, donc c’est vrai également pour le fichier XML de métadonnées d’un PDF qui sera aussi remplacé par un Json.

Q : Avez-vous une liste des différences de champs (champs ajoutés ou retirés) par rapport à l’ancien format ?

R : Non, nous n’avons pas de liste.

Q : Est-ce que les champs “numéro de gestion” ou bien “code greffe” vont rester ?

R : Le “numéro de gestion” ne sera pas conservé, le “code greffe” sera conservé.

Q : Est-ce que la notion de greffe d’une entreprise sera encore utilisée ?

R : Les entreprises seront rattachées à leur Siren, le nom du greffe sera renseigné.

Q : Peut-on avoir des détails sur les énumérations (conjoint, personne, adresse, établissements) ?

R : Nous vous fournirons le dictionnaire de données.

Q : À quoi servent les “attachmentId” et “typeDocument”

R : “attachmentId” : correspond au numéro d’identifiant du document, pour pouvoir le récupérer et “typeDocument” correspond au type de pièce jointe déposée sur le Guichet unique par exemple s’il s’agit d’un dépôt de comptes annuels, d’un acte, etc.

Nous reviendrons vers vous avec d’autres précisions dès que possible.
Cordialement,
INPI France.
Merci de ne pas répondre directement à cet e-mail. Pour toute question, n’hésitez pas à contacter l’équipe Licences : [email protected]

1 Like