Benchmark des softwares/portails Open Data

outils
portails

(Cecile LE GUEN) #1

Est-ce qu’une étude / rapport / analyse, existerait et porterait sur la comparaison des solutions de plateforme Open Data, d’un niveau technique, de prix, de coût, de fonctionnalités, open source/propriétaire etc… Et par ailleurs, est-ce qu’il y aurait une sorte de consensus/framework/liste d’indicateurs permettant de mesurer la qualité des plateformes ?

Lors de récentes missions à l’étranger et dans des pays francophones qui débutent dans la mise en place d’initiatives open data, une question revient tout le temps " Comment choisir son portail ? Quels sont les critères à prendre en compte ? "

Cette question est d’autant plus cruciale que certaines administrations n’ont pas toutes les informations en main leur permettant de faire un choix éclairé en fonction des ressources humaines dont elles disposent, sur leurs connaissances techniques qui permettent d’assurer la maintenance et l’évolution des plateforme, le financement nécessaire, les retours d’expérience et les bonnes pratiques.

CKAN	DKAN	Udata   OpenDataSoft   Socrata	   Junar
  • Prix / Coût de la licence annuelle
  • Hébergement
  • Accompagnement
  • Ressources à déployer en interne
  • Open Source / Propriétaire
  • Langage du Backend
  • Langage du Front
  • Extensions disponibles
  • Personnalisations

Avec une petite analyse des pro/cons
Une liste de fonctionnalités recommandées pour le portail et par jeu de données
Exemple :

Fonctionnalités générales Détail
Organisation responsable Le portail doit fournir des informations sur l’autorité qui héberge le portail, le modèle de gouvernance, et le cadre institutionnel qui fournit les données
Système de gestion des données Le portail doit fournir des informations sur le système de gestion des données utilisé sur le portail
Langue Si nécessaire, l’outil doit pouvoir intégrer la gestion de plusieurs langues
Gratuité et accès aux données Le portail doit donner un libre accès aux données, gratuitement et sans inscription préalable
Nombre de jeux de données Le portail doit indiquer le nombre de jeux de données qu’il contient
Nombre de réutilisations Le portail doit pouvoir indiquer les réutilisations des données
Moteur de recherche Possibilité de chercher et filtrer par catégories les jeux de données facilement
API Le portail doit pouvoir proposer une API pour faciliter la réutilisation des données proposées
Comptes utilisateurs Le portail doit proposer de pouvoir créer facilement un compte utilisateur
Catégories et Tags Possibilité par l’administrateur de créer des tags et des catégories pour aider la recherche
Commentaires Possibilité de commenter les données par les utilisateurs enregistrés
Formulaire de demande de données Possibilité de demander un jeu de données à une autorité, une adminsitration, une organisation et de laisser cette demande ouverte à tous
Documentation Documentation technique et fonctionnelle sur comment utiliser le portail
FAQ Apporte des réponses aux questions basiques

Informations par jeu de données

  1. Titre et description
  2. Source
  3. Date de publication initiale et dernière date de mise à jour
  4. License
  5. Couverture géographique (nationale, régionale, locale)
  6. URL du jeu de données
  7. Taille du fichier de données
  8. Nombre de vues / visites
  9. Nombre de téléchargements
  10. Formats opérables par une machine
  11. Possibilités de visualisation immédiate (carte, graphiques…)

Benchmark plateforme du marché
(Samuel Goëta) #2

Hello,

il y a déjà quelques ressources sur le sujet mais à ma connaissance rien de synthétique comme tu proposes. le rapport “State-of-the-art Report and Evaluation of Existing Open Data Platforms” réalisé dans le cadre du projet européen Route2PA qui fait une étude très complète des fonctionnalités des portails. La dimension coût est manquante à ma connaissance.

Il y a une revue des solutions technologiques dans l’OpenDataToolkit de la Banque Mondiale qui présente les solutions de manière synthétique.

Enfin, dans le cadre du projet ANR Open Sensing City du laboratoire ELICO à Lyon, Françoise Paquienséguy et Valentyna Dymytrova ont réalisé une analyse de portails métropolitains de données ouvertes à l’échelle internationale qui porte sur 24 portails Open data métropolitains, 12 français et 12 étrangers.

Toutes ces études ne disent malheureusement rien du coût de ces portails. Je ne suis d’ailleurs pas sur que les fournisseurs de portail soient encore prêts à rendre public leur modèle de tarification.


(Cecile LE GUEN) #3

Merci, @samgoeta, très juste sur les coûts, cependant c’est un aspect déterminant qui oriente les choix, et par ailleurs, ces coûts sont à mettre en parallèle avec les coûts en ressource humaine interne qui permet d’administrer la plateforme, gérer les mises à jour, l’hébergement, les soumissions de jeux de données etc…


(Jean-Marc Lazard) #4

Tout à fait d’accord, une comparaison du TCO (coût complet) serait très intéressante.
Des rapports détaillés ont été produits aux US en 2016 mais ne sont pas en accès gratuit
https://www.idc.com/research/viewtoc.jsp?containerId=US41154416


(Samuel Goëta) #5

Est-ce que vous connaissez des cas d’usage de Dataverse hors du monde académique ? Est-ce que la solution pourrait être appropriée pour des administrations ?


(Samuel Goëta) #6

Tiens vous avez vu cette initiative du gouvernement UK ?


Quand je regarde le pilote à Plymoth, je ne vois pas la différence avec CKAN


(Joël Gombin) #7

À lire leur billet, c’est effectivement du CKAN, amélioré (mais difficile de savoir sur quel plan pour l’instant). La dimension “moteur de recherche” est notamment mise en avant.


(Cecile LE GUEN) #8

Oui, j’ai un peu testé leur instance déployée pour la ville de Plymouth en effet, et c’est du CKAN, pas de fonctionnalités de recherche spécifique, (pas d’auto-complete par exemple), en revanche j’ai l’impression que la valeur ajoutée, c’est de l’avoir transformé en SaaS en hébergeant la plateforme sur le cloud public du gouvernement, et du coup ça rend un portail open data basique à déployer facilement.

Ça me fait penser à ce qu’a fait OGP Toolbox avec l’outil de consultation numérique DemocracyOS, [le déploiement en un clic] :

Dans le cas de The Data Place, apparemment ils offrent des petites fonctionnalités de personnalisation de l’interface (j’imagine de style), mais ensuite, je pense que c’est autre chose de customiser complètement d’autres fonctionnalités. Enfin, à voir, j’ai demandé une démo :slight_smile:


(Jean-Marc Lazard) #9

certes pas présent en France, mais pour info, Socrata racheté par Tyler (un des leaders US des progiciels pour l’administration) https://searcherp.techtarget.com/news/252439664/Acquisition-gives-ERP-public-sector-firm-Tyler-a-data-cloud


(Thomas) #10

Il semblerait que la plateforme UData poussé par data.gouv.fr ne soit pas dans la liste des comparaisons du post
Le code est en ligne sur https://github.com/opendatateam/udata (truc marrant c’est que l’organisation s’appelle “opendata.team”, qui pourrait être confondu avec teamopendata.org)


(Christian Quest) #11

Et ne pas oublier l’option… j’ai pas de plateforme/portail, je m’appuie juste sur data.gouv.fr :wink:


(Samuel Goëta) #12

udata qui fait tourner data.gouv.fr va proposer (enfin !) la pré-visualisation des données et la dernière version propose des améliorations significatives de l’ergonomie des discussions :
https://www.data.gouv.fr/fr/posts/zoom-sur-les-nouvelles-fonctionnalites-de-data-gouv-fr/


(Charles Nepote) #13

Je ne crois pas avoir vu JKAN dans vos listes. C’est une solution ultra-légère basée sur Jekyll. Qui dit ultra-légère dit aussi peu de fonctionnalités, mais elle fait le boulot.
https://jkan.io/

Il ne serait pas idiot de creuser la piste de l’open data (presque) sans portail, c’est-à-dire les cas où les données sont éditorialisées ailleurs que sur un portail : c’est le défi 6 que nous avons suggéré ici :

Expérimenter d’autres formes d’open data : open data sans plateforme ni application, quitter les données pour l’information, etc.

La (re-)publication en contexte par des bouts de javascript en fait partie à mon sens, comme ce que propose data.gouv.fr (et probablement d’autres).


(Cecile LE GUEN) #14

Ah c’est super @CharlesNepote, merci du partage. Très utile en tout cas, je vais me pencher sur la question, mais ça me semble une bonne alternative, et en tout cas comme tu le dis c’est une bonne réflexion à mener sur la nécessité ou non de mettre en place des portails, et si oui, pourquoi.

Cela fait écho à une discussion qu’on a eu récemment avec @johan, à propos d’utilisation d’outils ou de structure super légères pour déposer uniquement des jeux de données et peuvent en tout cas servir dans des contextes où la mise en place de plateformes comme CKAN ou Udata sont trop lourdes à maintenir pour les organisations qui le souhaitent.

C’est souvent le cas de petites assoces ou ONG.


(Samuel Goëta) #15

Je suis très motivé pour tester de bricoler un portail open data avec Airtable


(Samuel Goëta) #16

@joel vient de me faire découvrir DataFair pour APIfier un jeu de données, je ne crois pas que ça permette de sortir un portail mais ça parait bien intéressant :


(Nicolas Bonnel) #17

Effectivement, DataFair est plutôt axé sur la diffusion de données que le catalogage. On peut faire un petit portail thématique avec, mais c’est juste pour de la présentation des données. J’en avais configuré un vite fait pour répondre à un appel d’offre : https://koumoul.com/s/data-fair/app/portail-thematique

Je rejoins complètement ce qui a été dit plus haut sur la nécessité d’avoir un portail ou non. Quand on a commencé le projet, on imaginait que ceux qui voulaient un portail publieraient directement sur data.gouv.fr en fournissant des outils d’export vers d’autres catalogues.

Pour faire un portail complet, on est en train de valider en interne l’intégration entre DataFair et uData. Nous avons aussi échangé avec quelques collectivité lors du congrès de l’Adullact et certains sont très réceptifs à l’idée d’avoir un portail réalisé avec plusieurs briques fonctionnelles et l’idée de pouvoir changer juste une partie sans tout remettre en cause : par exemple passer d’un catalogue CKAN à uData ou inversement, sans changer la brique “analytics” qui pourrait être Matomo.


(Moguen Fabien) #18

Et n’oublions pas l’inévitable MétaClic pour compléter tout ça : cf. Open data de la région Rhône-Alpes


(antoine) #19

La plateforme du CD93 http://data.seine-saint-denis.fr précise dans ses mentions légales, un combo : SPIP avec Jquery et Bootstrap.
Je ne connais pas d’autres plateformes sur ce modèle-ci.


(Samuel Goëta) #20

J’aime beaucoup le rendu que ça donne en prévisualisation des jeux de données :
https://koumoul.com/s/data-fair/app/portail-thematique/datasets/orleans_metropole_equipements_culture/data
Est-ce que c’est disponible en open source ?
Tiens nous au courant de la suite, c’est très intéressant