Quasi-opendata ou opendatafail pour le RNCS diffusé par l'INPI ?

A cause d’une licence vraiment pas ouverte, on ne pouvait par vraiment parler d’opendata pour les données du RNCS provenant des greffes des tribunaux de commerce et diffusées par l’INPI.

Une nouvelle licence a été homologuée en avril par la DINSIC, très proche de la licence ouverte… mais quid de la diffusion et des données ?

La suite (un peu longue) est à lire sur: https://medium.com/@cq94/le-rncs-en-quasi-opendata-57446c6fc8dd

1 J'aime

Fin avril l’INPI lançait un marché pour la « conception et réalisation d’un portail data » (notez d’entrée l’absence d’open) : https://www.boamp.fr/avis/detail/19-67848 (DCE archivé ici)

La description du cahier des charges et des fonctionnalités attendues donnait peu d’espoir quant à un changement de l’INPI dans sa politique open data actuelle telle que Christian la décrit dans son article. Ainsi, on s’aperçoit vite qu’il faudra toujours passer par leur procédure et signer leur licence désormais homologuée afin d’obtenir le fameux statut de… « licencié open data ». :man_facepalming: Par ailleurs, la mise à disposition des fichiers via un serveur FTP y figure toujours en bonne place, avec comme seule évolution envisagée la mise en place d’un « module d’authentification » et du « filtrage par IP ». :nauseated_face: Comment maintenir le statu quo à tout prix…

Du nouveau aujourd’hui : Saisie et export de comptes annuels du RNCS

On y trouve des informations sur le RNCS et le fonctionnement interne de l’INPI, avec notamment des chiffres de volumétrie :

  • Environ 3 To de données existant actuellement (principalement PDF, métadonnées au format XML)
  • 1,4 million de documents PDF pour les comptes annuels en 2018 (1,2 million en 2017)
  • Sur un total de 5,3 millions de « formalités » du RNCS en 2018 (immatricutions, actes de société et comptes annuels)

L’INPI semble rencontrer de nombreux problèmes dans le traitement de ces documents etcherche de toute évidence à investir pour y mettre de l’ordre et industrialiser leurs processus. C’est une bonne nouvelle, mais est-ce que tout cela ira dans le sens de l’ouverture de ces données ? Vu la gueule de leur futur « portail », on dirait que non. Bref chez l’INPI l’open data c’est deux pas en avant, un pas en arrière.

(Sans oublier les épisodes précédents :arrow_heading_down:)

1 J'aime

Pour info, l’INPI avait déjà passé des marchés de saisie de données par le passé. Je n’ai pas regardé en détail si le CCTP a significativement évolué. Voir https://ted.europa.eu/udl?uri=TED:NOTICE:44579-2018:TEXT:FR:HTML&tabId=1 ou encore https://www.boamp.fr/avis/detail/16-29308, par exemple.

L’aberration semble provenir du fait que ce sont des scans que reçoit l’INPI qui est obligé de tout (faire) ressaisir (avec toutes les erreurs que ça implique).

J’imagine que ces même infos, sont saisies du côté des greffes… donc chacun dans son silo, comme d’habitude.

Quand on voit la tête des CSV des tribunaux de commerce, ça fait peur et confirme bien qu’ils font vraiment tout pour ne pas ouvrir ces données car en interne il n’utilisent sûrement pas ces CSV différentiels.

Presque 20 ans après l’an 2000, on pourrait s’attendre que les dépôts de compte ne se fassent plus au format papier, que tout ça alimente directement les bases de données… et l’opendata.

1 J'aime

Merci pour cette intiative et la mise à disposition des données ! Et j’ai bien aimé l’article qui explique toute la démarche et le procédé.

Je partage tes conclusions sur le fait que si on ne veut pas que les données soient réutilisées, on ne n’y prendrait pas autrement. Ce qui me choque le plus, c’est qu’entre un délai d’inscription de 48h et la limitation à 1 Go de transfert par jour avec le fait que les fichiers ne soient pas ou mal compressés, il faille plusieurs jours (une semaine ?) pour accéder aux données brutes.

Oui, à peu près… et encore, je ne découvrais pas le sujet.

Je n’ai pas encore terminé le téléchargement initial. Il me manque les IMR des tribunaux mixtes… mais tout ce que j’ai récupéré est maintenant sur data.cquest.org

Il ne reste plus qu’à automatiser les mises à jour…

Du coup, d’après cette licence ad-hoc, que peut-on faire avec ces données ?

J’ai commencé à jumper d’articles en articles du code du commerce à partir des références que tu donnes ici (en bas), mais c’est très cryptique.