Fonctionnement API recherche-entreprises.api.gouv.fr

Hello,

J’essaie d’exploiter l’API recherche-entreprises.api.gouv.fr mais je tombe sur un os.

Je cherche une entreprise via sa dénomination (ex: promolead sur lyon):
https://recherche-entreprises.api.gouv.fr/search?q=promolead

J’obtiens bien le résultat escompté avec 2 retours dont celui que je cherche (dénomination = promolead).
Mais si je tente un reverse, en cherchant via l’adresse du siége social donné par google:
https://recherche-entreprises.api.gouv.fr/search?q=55%20crs%20GAMBETTA%2069003%20LYON
J’obtient aucun résultat
Si je tente avec l’adresse récup sur l’URL du dessus (on change 69003 par 69383):
https://recherche-entreprises.api.gouv.fr/search?q=55%20cours%20GAMBETTA%2069383%20LYON%203eme
J’obitens alors plusieurs résultats dont un des deux résultats escomptés… mais pas le deuxiéme que je cherche (dénomination=Promolead et non dénomination = promolead_academy)

C’est un bug de l’API d’après vous ?

Je vous remercie par avance

Hello Nux,

Je suis Hajar, en charge de l’API de Recherche d’Entreprises.

En ce qui concerne la recherche par dénomination promolead, les deux résultats sont cohérents et retournent bien les résultats promolead. C’est le comportement attendu.

En revanche par adresse cela se complique. Il existe plusieurs manières de construire l’adresse.

Nous utilisons le code commune (code INSEE) (69383 dans votre cas) pour construire l’adresse et non pas le code postal (69003). Raison pour laquelle l’adresse trouvée sur Google ne fonctionne pas.

Enfin, quand vous utilisez le code Insee, (55 CRS GAMBETTA 69383 LYON 3EME, soit https://recherche-entreprises.api.gouv.fr/search?q=55%20CRS%20GAMBETTA%2069383%20LYON%203EME), nous remontons toutes les unités légales qui détiennent des établissements domiciliés à cette adresse soit 18 unités légales.

L’API ne retourne pas les 18 résultats d’un coup, il y a une pagination. Votre second résultat est en page 2 : https://recherche-entreprises.api.gouv.fr/search?q=55%20CRS%20GAMBETTA%2069383%20LYON%203EME&page=2

J’espère avoir répondu à votre question. Si vous souhaitez avoir des informations complémentaires n’hésitez pas à nous écrire sur l’adresse support de l’API [email protected].

Excellente journée,

5 « J'aime »

Bonjour Hajar,

Merci beaucoup pour votre réponse, je suis plus éclairé du coup.

Il serait intéressant de spécifier que l’on doit renseigner le code insee et non le code postal dans l’adresse, car sur la doc de l’api il est seulement spécifié Termes de la recherche (dénomination et/ou adresse), sachant que l’adresse utilise le code postal et non le code insee normalement.

Bonne journée

je crois commencer à comprendre que surtout rien n’est normal avec l’adresse :rofl: (blague à part oui la précision semble nécessaire)

Indexer code INSEE ET code postal serait quand même plus simple pour les utilisateurs car il est rare qu’on utilise un code INSEE dans une « adresse ».

1 « J'aime »

Bonjour,

Nous utilisons désormais le code postal pour construire les adresses des établissements. Toutefois, il reste possible d’effectuer les recherches d’adresses avec le code commune (code INSEE) également.

@Nux Votre recherche https://recherche-entreprises.api.gouv.fr/search?q=55%20crs%20GAMBETTA%2069003%20LYON retourne donc les résultats désirés.

Excellente journée,

6 « J'aime »

Bonjour,
je me permet de relancer ce sujet car j’ai remarquer que certains résultats sont mal géoréférencés, exemple:

https://recherche-entreprises.api.gouv.fr/search?q=PIERRE%20COUDOUEL&departement=12

Nous sommes censés récupéré un point dans le département de l’aveyron (12) dans la commune de BROMMAT, hors le point est géocodé sur la commune de CUSSAC dans le 87.

Ou bien encore cette recherche:
https://recherche-entreprises.api.gouv.fr/search?q=ARMAND%20GROLIERE&departement=03
Le résultat est encore géocodé en haute vienne sur l’ancienne commune de LA BREGERE, alors qu’il devrait être géocodé sur la commune de DURDAT-LAREQUILLE dans le 03.

A quoi sont dues ces erreurs ? De mes estimations ce n’est pas un phénomène isolé, je suis tombé sur beaucoup de cas comme ceux là.
Peut-être qu’il serait pertinent de vérifié que le résultat du géocodage soit bien situé sur l’emprise du département en question.

Merci d’avance pour vos réponses

2 « J'aime »

Tout dépend de comment elles ont été géocodées, par qui, avec quelle base de référence d’adresses…

L’INSEE diffusé depuis quelques temps une version géocodée de SIRENE. J’ai pu constater des anomalies dans les résultats.

Je géocode SIRENE depuis 2017, chaque mois pour le stock, chaque jour pour les mises à jour.
J’ai récemment corrigé un bug qui pouvait provoquer ce genre d’anomalies.

Je ne sais pas ce qui est utilisé par recherche-entreprises.api.gouv.fr, la version géocodée de l’INSEE, la mienne, ou un géocodage maison.

2 « J'aime »

Bonjour @Nux,

Nous utilisons la base SIRENE géocodée par data.gouv Base Sirene des entreprises et de leurs établissements (SIREN, SIRET) - data.gouv.fr.

Il existe en effet des anomalies dans les données, chose que nous contrôlons pas de notre côté.

Est-ce que le score du géocodage, dans la réponse de l’API, serait une donnée pertinente pour vous ?

Excellente journée,

1 « J'aime »

Hello @cquest, preneur de l’anomalie que tu as identifié récemment pour qu’on puisse la corriger dans notre génération mensuelle.

1 « J'aime »

Bonjour,

Merci pour vos réponse @Hajar et @cquest
La score du géocodage peut-être intéressant en effet.
@cquest , si vous avez trouvé une anomalie dans le processus de geocodage, il serait peut être pertinent de le faire remonter à ceux qui générent la base SIRENE du coup.

Bonne journée à vous

La correction en question est ici, mais elle était liée à un problème dans les caches, un bug ancien qui avait mis des valeurs incorrectes en cache qui remontaient encore et encore…

1 « J'aime »