Est-ce qu’une étude / rapport / analyse, existerait et porterait sur la comparaison des solutions de plateforme Open Data, d’un niveau technique, de prix, de coût, de fonctionnalités, open source/propriétaire etc… Et par ailleurs, est-ce qu’il y aurait une sorte de consensus/framework/liste d’indicateurs permettant de mesurer la qualité des plateformes ?
Lors de récentes missions à l’étranger et dans des pays francophones qui débutent dans la mise en place d’initiatives open data, une question revient tout le temps " Comment choisir son portail ? Quels sont les critères à prendre en compte ? "
Cette question est d’autant plus cruciale que certaines administrations n’ont pas toutes les informations en main leur permettant de faire un choix éclairé en fonction des ressources humaines dont elles disposent, sur leurs connaissances techniques qui permettent d’assurer la maintenance et l’évolution des plateforme, le financement nécessaire, les retours d’expérience et les bonnes pratiques.
CKAN DKAN Udata OpenDataSoft Socrata Junar
Prix / Coût de la licence annuelle
Hébergement
Accompagnement
Ressources à déployer en interne
Open Source / Propriétaire
Langage du Backend
Langage du Front
Extensions disponibles
Personnalisations
Avec une petite analyse des pro/cons
Une liste de fonctionnalités recommandées pour le portail et par jeu de données
Exemple :
Fonctionnalités générales
Détail
Organisation responsable
Le portail doit fournir des informations sur l’autorité qui héberge le portail, le modèle de gouvernance, et le cadre institutionnel qui fournit les données
Système de gestion des données
Le portail doit fournir des informations sur le système de gestion des données utilisé sur le portail
Langue
Si nécessaire, l’outil doit pouvoir intégrer la gestion de plusieurs langues
Gratuité et accès aux données
Le portail doit donner un libre accès aux données, gratuitement et sans inscription préalable
Nombre de jeux de données
Le portail doit indiquer le nombre de jeux de données qu’il contient
Nombre de réutilisations
Le portail doit pouvoir indiquer les réutilisations des données
Moteur de recherche
Possibilité de chercher et filtrer par catégories les jeux de données facilement
API
Le portail doit pouvoir proposer une API pour faciliter la réutilisation des données proposées
Comptes utilisateurs
Le portail doit proposer de pouvoir créer facilement un compte utilisateur
Catégories et Tags
Possibilité par l’administrateur de créer des tags et des catégories pour aider la recherche
Commentaires
Possibilité de commenter les données par les utilisateurs enregistrés
Formulaire de demande de données
Possibilité de demander un jeu de données à une autorité, une adminsitration, une organisation et de laisser cette demande ouverte à tous
Documentation
Documentation technique et fonctionnelle sur comment utiliser le portail
FAQ
Apporte des réponses aux questions basiques
Informations par jeu de données
Titre et description
Source
Date de publication initiale et dernière date de mise à jour
il y a déjà quelques ressources sur le sujet mais à ma connaissance rien de synthétique comme tu proposes. le rapport « State-of-the-art Report and Evaluation of Existing Open Data Platforms » réalisé dans le cadre du projet européen Route2PA qui fait une étude très complète des fonctionnalités des portails. La dimension coût est manquante à ma connaissance.
Toutes ces études ne disent malheureusement rien du coût de ces portails. Je ne suis d’ailleurs pas sur que les fournisseurs de portail soient encore prêts à rendre public leur modèle de tarification.
Merci, @samgoeta, très juste sur les coûts, cependant c’est un aspect déterminant qui oriente les choix, et par ailleurs, ces coûts sont à mettre en parallèle avec les coûts en ressource humaine interne qui permet d’administrer la plateforme, gérer les mises à jour, l’hébergement, les soumissions de jeux de données etc…
Est-ce que vous connaissez des cas d’usage de Dataverse hors du monde académique ? Est-ce que la solution pourrait être appropriée pour des administrations ?
À lire leur billet, c’est effectivement du CKAN, amélioré (mais difficile de savoir sur quel plan pour l’instant). La dimension “moteur de recherche” est notamment mise en avant.
Oui, j’ai un peu testé leur instance déployée pour la ville de Plymouth en effet, et c’est du CKAN, pas de fonctionnalités de recherche spécifique, (pas d’auto-complete par exemple), en revanche j’ai l’impression que la valeur ajoutée, c’est de l’avoir transformé en SaaS en hébergeant la plateforme sur le cloud public du gouvernement, et du coup ça rend un portail open data basique à déployer facilement.
Ça me fait penser à ce qu’a fait OGP Toolbox avec l’outil de consultation numérique DemocracyOS, [le déploiement en un clic] :
Dans le cas de The Data Place, apparemment ils offrent des petites fonctionnalités de personnalisation de l’interface (j’imagine de style), mais ensuite, je pense que c’est autre chose de customiser complètement d’autres fonctionnalités. Enfin, à voir, j’ai demandé une démo
Je ne crois pas avoir vu JKAN dans vos listes. C’est une solution ultra-légère basée sur Jekyll. Qui dit ultra-légère dit aussi peu de fonctionnalités, mais elle fait le boulot. https://jkan.io/
Il ne serait pas idiot de creuser la piste de l’open data (presque) sans portail, c’est-à-dire les cas où les données sont éditorialisées ailleurs que sur un portail : c’est le défi 6 que nous avons suggéré ici :
Expérimenter d’autres formes d’open data : open data sans plateforme ni application, quitter les données pour l’information, etc.
La (re-)publication en contexte par des bouts de javascript en fait partie à mon sens, comme ce que propose data.gouv.fr (et probablement d’autres).
Ah c’est super @CharlesNepote, merci du partage. Très utile en tout cas, je vais me pencher sur la question, mais ça me semble une bonne alternative, et en tout cas comme tu le dis c’est une bonne réflexion à mener sur la nécessité ou non de mettre en place des portails, et si oui, pourquoi.
Cela fait écho à une discussion qu’on a eu récemment avec @johan, à propos d’utilisation d’outils ou de structure super légères pour déposer uniquement des jeux de données et peuvent en tout cas servir dans des contextes où la mise en place de plateformes comme CKAN ou Udata sont trop lourdes à maintenir pour les organisations qui le souhaitent.
@joel vient de me faire découvrir DataFair pour APIfier un jeu de données, je ne crois pas que ça permette de sortir un portail mais ça parait bien intéressant : https://koumoul-dev.github.io/data-fair/
Effectivement, DataFair est plutôt axé sur la diffusion de données que le catalogage. On peut faire un petit portail thématique avec, mais c’est juste pour de la présentation des données. J’en avais configuré un vite fait pour répondre à un appel d’offre : https://koumoul.com/s/data-fair/app/portail-thematique
Je rejoins complètement ce qui a été dit plus haut sur la nécessité d’avoir un portail ou non. Quand on a commencé le projet, on imaginait que ceux qui voulaient un portail publieraient directement sur data.gouv.fr en fournissant des outils d’export vers d’autres catalogues.
Pour faire un portail complet, on est en train de valider en interne l’intégration entre DataFair et uData. Nous avons aussi échangé avec quelques collectivité lors du congrès de l’Adullact et certains sont très réceptifs à l’idée d’avoir un portail réalisé avec plusieurs briques fonctionnelles et l’idée de pouvoir changer juste une partie sans tout remettre en cause : par exemple passer d’un catalogue CKAN à uData ou inversement, sans changer la brique “analytics” qui pourrait être Matomo.
La plateforme du CD93 http://data.seine-saint-denis.fr précise dans ses mentions légales, un combo : SPIP avec Jquery et Bootstrap.
Je ne connais pas d’autres plateformes sur ce modèle-ci.