Différence dans les fichiers StockEtablissement_utf8 et StockUniteLegale_utf8 (données SIRENE)

Bonjour à tous

Je viens de faire quelques traitements sur les données open data de l’INSEE pour la base SIRENE et sur la version de janvier 2023 j’ai une question pour laquelle je ne trouve pas de réponse.

J’ai filtré les établissements actifs ainsi que les unités légales actives et bizarrement il y a plus d’unités actives (sièges donc) que d’établissements, alors que le fichier établissements intègre les établissements des sièges donc des unités légales…

Voici quelques comptages:

#StockEtablissement_utf8_out.csv
A 13625234
F 20210526
etatAdministratifEtablissement 1

#StockUniteLegale_utf8_out.csv
A 13946249
C 9897869
etatAdministratifUniteLegale 1

Bref un écart au minimum de 300k, l’API SIRENE donne d’ailleurs 12 268 982 établissements actifs siège donc unités légales…

Si quelqu’un a une idée pour cet écart?

Merci par avance!