Benchmark des softwares/portails Open Data

L’application de portail thématique n’est pas en open source (elle le deviendra peut être) mais elle est réutilisable gratuitement et sans limites. Après, il y a à peu près le même rendu directement dans DataFair (qui est lui open source).

Nous pensons plutôt partir de la et proposer une table qui soit intégrable dans un autre portail, par exemple sur la page de description d’un jeu de données de catalogue : cela pourrait s’intégrer avec la nouvelle fonctionnalité de prévisualisation de uData par exemple.

Dans cette liste, il manque Octopub de l’Open Data Institute :

Publish data easily, quickly and correctly
Got a dataset you want to publish, but not sure how to do it? Octopub will help you do it, quickly, easily and correctly.

Using the power of GitHub, we will provide you with a platform to publish your CSV data, as well as automatically creating a webpage for you to point people to.
https://octopub.io/

2 « J'aime »

Et peut-être aussi (dans le même genre), The Datatank d’Open Knowledge Belgium (ils sont partout ces belges !) : http://thedatatank.com. La démo est par là : http://demo.thedatatank.com

2 « J'aime »

Bonjour à tous,
Merci pour ces différents éléments. C’est utile.
On peut ajouter a cette fiche ressource le travail d’Open Data France sur les portails Open Data intitulée Choisir son portail :


Il a l’intérêt de commencer à lister les fonctionnalités d’un portail avec ce fichier en lien :

2 « J'aime »

L’Open Data Institute a produit un registre des outils de publication de données ouvertes :

1 « J'aime »

Je réalise que Kaggle a quand même une interface incroyable pour partager des jeux de données, si seulement les portails open data étaient aussi bien pensés

Un exemple :

Dans chaque fichier, chaque champ est décrit et prévisualisé avec un schéma. Les données sont versionnées associées à des discussions et des notebooks les réutilisant. Je trouve ça très inspirant.

3 « J'aime »

Ce qui est dommage c’est qu’il n’est pas possible de télécharger le schéma lui-même… Ils ont préféré internaliser toute la valeur ajoutée (notamment sociale), ça correspond à une logique assez classique de plateforme mais entre en contradiction avec l’esprit open data.

1 « J'aime »

Je découvre cette intégration Drupal / CKAN réalisée pour la région Bourgogne Franche Comté : https://github.com/BPM-Conseil/databfc

Assez bluffé par l’usage de JKAN par San Diego avec notamment prévisualisation des données :



Nous venons de mettre en place les portails de données sur notre plateforme. Toute les données que nous publions en opendata sont disponibles sur notre portail, qui sert aussi de démonstrateur : https://opendata.koumoul.com/

L’idée principale pour la présentation des données est de les montrer au travers de réutilisations commentées. Ainsi une personne non experte peut découvrir les données, voir des cas d’usage, jouer avec et “sentir” un peu mieux la donnée. Nous comptons aussi à terme développer d’autre templates de portails, avec des pages et des dispositions de page différentes.

Ces portails utilisent le logiciel open source DataFair que nous maintenons également.

4 « J'aime »

Très intéressant !

Super ! Comment générez vous les réutilisations ?

Ce sont des applications pour DataFair que l’on configure en quelques clics : choix de l’application, choix de la source de données puis configuration spécifique à chaque application (par exemple quelles colonnes de la source on utilise dans l’infobulle d’une carte).

Les applications ont chacune leur cycle de vie séparé et sont des petites applications web légères en HTML / CSS / JS qui sont posées sur un serveur de fichier et réexposées par DataFair. L’application de graphiques est publiée en open source sur github.

2 « J'aime »

C’est précisément ce qui est fait par l’ONF qui combine plusieurs ressources libres et gratuites:


http://administration.carmencarto.fr/services/catalogue/105

Merci la mutualisation des ressources financières et technos!
Bruno

Je découvre via @joel que l’ONISEP utilise pour son portail open data une solution que je ne connaissais pas, développée par Business & Decision Eolas.

Le portail propose des fonctionnalités d’exploration de données tabulaires, des cartes, API sur les jeux de données, commentaires…

Le CCTP d’un marché annonce que cela s’appuie sur des composants open source (CMS.Eolas et LOD.Eolas) mais je ne sais pas où est le code source…

Le portail reposerait sur MongoDB, Symfony, ElasticSearch, RabbitMQ.

J’ai aussi vu passer l’AO, qui est clairement flêché vers le titulaire (Business & Decision, filliale d’Orange), puisqu’il s’agit tout simplement de maintenir la solution en production depuis 2015. Bref, j’ai fui en courant.

Accessoirement, je confirme, la solution est bel et bien 100 % propriétaire. Il serait possible de demander que le code soit communiqué, mais pour au final recevoir un sous-Wordpress je suis pas sûr que ça vaille la peine d’encombrer la CADA.

Je sais pas si c’est le bon endroit pour, mais j’ai lu un chapitre de livre sur les portails OpenData où il fait un comparatif. C’est plus orienté économie j’ai eu l’impression, mais bon, peut-être que ça intéressera des gens.

Référence : Notice bibliographique Datalogie : formes et imaginaires du numérique / sous la direction de Olaf Avenati [et] Pierre-Antoine Chardel | BnF Catalogue général - Bibliothèque nationale de France


Bonjour, je relance le sujet car je réalise un benchmark des plateformes de diffusion de données, plutôt dans une optique de mise à disposition de visualisations des données, si possible paramétrables par l’utilisateur.

  • Shiny (https://shiny.rstudio.com/) : bien pour un usage interne, mais d’après mes collègues datascientists, risque de ne pas tenir la charge pour un portail de données « grand public »
    Exemple : La ségrégation résidentielle en France ou encore DREES - Datavisualisation
  • Udata (https://github.com/opendatateam/udata), fork de CKAN, je le connais bien pour avoir participer à des évolutions de l’outil avec Etalab : très bien pour mettre en ligne rapidement un portail de mise à disposition de données, opensource, mais prestataire unique, visualisations très limitées (en fait, juste la pré-visualisations des tableaux de données)
  • CKAN : je connais moins bien, il semble que ce soit plus évolué que Udata, notamment parce-que la communauté est plus importante. Pas mal de plugins aussi, notamment pour les visualisations, mais, sauf si je n’ai pas trouvé le bon plugin, ne permet pas une configuration du rendu par les internautes.
    Exemple* : Hospital Admissions And Public Sector Outpatient Attendances, Annual-Data.gov.sg
  • Koumoul : Je l’ai découvert en lisant vos échanges, pas mal mais là encore, aucune configuration des visualisations n’est offertes pour l’internaute.
    Exemple : https://data.ademe.fr/
  • OpenDataSoft : portail plutôt rapide, les visualisations sont efficaces, personnalisables par l’internaute, mais à mon sens restent limitées.
    Exemple (onglet « Analyse ») : https://data.laregion.fr/explore/dataset/dreal-occitanie-parcs-eoliens-en-occitanie/
  • Socrata: assez impressionné par l’éventail des visualisations permises, l’utilisateur peut configurer complètement le type d’infographie qu’il souhaite, quelle valeur mettre en avant, etc… Je ne connais par leur tarifs, quelqu’un a une idée ?
    Exemple : https://data.texas.gov/d/jrea-zgmq/visualization

D’autres suggestions ?

Bonjour,

Connaissez-vous ce recensement : Sign in - Airtable ?

Il y a quelques erreurs à la marge mais Open Data France est à l’écoute des collectivités pour les corriger. @jmbourgogne pour info !

Julien

le document n’est pas accessible librement…