Nouvelle plateforme en open data : codes barres et produits

Bonjour à tous,

Je viens de lancer un comparateur de prix open source et open data, proposant de la compensation écologique : eco-achat.fr #bienCommun

Ce site est tout neuf et devrait beaucoup évoluer dans les mois à venir, en terme de fonctionnalités et de données. Je serais preneur des retours de la communauté sur les meilleures façons de mettre à disposition le jeux de données (contenant pas mal de produits identifiées par des codes barres), sur l’intérêt des données fournies et ce qui pourrait être complété, mais aussi votre ressenti sur l’utilisabilité du site, sur ce qui pourrait être amélioré.

Merci d’avance pour vos retours !

1 « J'aime »

Bonjour, belle initiative !

Pour les données proposées en opendata, il serait bon d’indiquer clairement une licence.

Vu la seule condition « indiquer la provenance de ces données », à choisir parmi (par ordre de préférence) :

  1. la Licence Ouverte: https://www.etalab.gouv.fr/wp-content/uploads/2017/04/ETALAB-Licence-Ouverte-v2.0.pdf
  2. l’ODC-BY: Open Data Commons Attribution License v1.0 | Software Package Data Exchange (SPDX)
  3. la CC-BY (pas très adaptée pour les data)

Une question quand même… Quelle est la source de ce jeu de données ? Comment a-t-il été constitué ?

1 « J'aime »

Le bouton télécharger ne semble pas fonctionner…

https://eco-achat.fr/opendata/gtin-open-data.zip = error

Si vous avez une bande passante limitée, pas de problème pour mettre un lien vers un mirroir sur opendatArchives (dès que j’aurai pu récupérer le fichier) :wink:

Super, merci pour ces retours !

  • Sur la licence, j’opte pour la licence ouverte, qui me semble moins restrictive. En espérant faire le bon choix :grinning:
  • Sur la source des données : cela vient des datasets d’affiliation, et des données web que la plateforme va crawler pour construire son catalogie de produits.
  • Sur le lien de téléchargement, bug normalement résolu

J’ai mis à jour en la page eco-achat.fr » open data avec ces remarques.

Pour un lien miroir, sûr que je serais preneur ! Les données seraient forcément moins fraîches, mais cela peut être un dump « initial » utile en cas d’atteinte de la limite de downloads… Ou de bug de téléchargement :wink:

Merci encore,

Merci pour la précision sur la licence… le crawl pose toutefois question.

Téléchargement en cours pour le remettre sur opendatArchives dès que ça sera passé (bien lent à 128Ko/s, j’ai plus l’habitude).

Pour info, les liens github n’aboutissent à rien.

Ok, je peux assez simplement restreindre les données opendata à celles provenant des catalogues d’affiliation (cela n’impactera que quelques catégories de produits)

Pour la vitesse de download, j’ai un peu de marge, et je vais reconfigurer cela à 256ko ou 512 car c’est sans doute un peu rédhibitoire… En espérant que cela n’impact pas trop le reste de la prestation.

Enfin pour les liens github, c’est normal à date, j’ai ouvert la plateforme ce week-end, et il me reste un peu de ménage dans mon code à faire pour éviter les fuites de tokens :wink: Je m’y attelle et passe le repo en public dès que ok, cela devrait être fait dans la semaine.

Merci encore pour l’intérêt !

Mirroir disponible ici: Index of /data.cquest.org/open4goods/

Pas de limitation de débit (juste celui des fibres)

Super, merci :+1: J’ai mis à jour le site avec ce jeu de donnée miroir, et j’ai passé les downloads « natifs » à 256 Kb/s

Bonjour,
Vous pouvez déverser vos données (ainsi que votre plateforme comme réutilisation de données) sur data.gouv.fr :slight_smile:

Oui, très bonne idée !

Je regarde le process et tente de le faire dans les semaines qui viennent.

Merci

1 « J'aime »

Bonjour WebEquitable ! Super site internet !
J’essaie de vous faire une requête via le formulaire de contact sur eco-achat.Fr mais celui-ci semble down, un message d’erreur s’affiche, et aucun moyen de trouver votre adresse mail.
J’ai cru comprendre que dans la data base en .CSV, toutes les valeurs ne sont pas téléchargée.
Serait-ce possible d’exporter la base de données en ajoutant l’url des images ?
Merci
Cordialement

Bonjour @Baptiste_CLEMENT

Désolé pour le retard de réponse ! Merci pour le feedback sur le formulaire de contact, c’est corrigé.

Malheureusement je ne pourrai ajouter les images. Cela représenterait des ressources machines non négligeable pour les serveurs. C’est pour l’instant incompatible avec le statut actuel du projet.

Kenavo,

Bonjour,

Un update sur ce sujet, qui a bougé et qui s’est amélioré : c’est maintenant disponible sur https://nudger.fr/opendata

Ce jeu de données semblent poser problème sur la licence…

Publié sous Licence Ouverte alors qu’il contient des données source sous licence ODbL.

Exemple:

Par ailleurs, absence de mention de l’origine et de la licence des photos (sous CC-BY-SA dans le cas présent).

Merci pour votre retour. Suite à notre échange, j’ai supprimé les données ODBl open food facts.

J’ai également précisé le sourcing des données sur le site et j’ai adopté une licence ODBL pour compatibilité future.