Benchmark des softwares/portails Open Data

portails
outils

(Cecile LE GUEN) #1

Est-ce qu’une étude / rapport / analyse, existerait et porterait sur la comparaison des solutions de plateforme Open Data, d’un niveau technique, de prix, de coût, de fonctionnalités, open source/propriétaire etc… Et par ailleurs, est-ce qu’il y aurait une sorte de consensus/framework/liste d’indicateurs permettant de mesurer la qualité des plateformes ?

Lors de récentes missions à l’étranger et dans des pays francophones qui débutent dans la mise en place d’initiatives open data, une question revient tout le temps " Comment choisir son portail ? Quels sont les critères à prendre en compte ? "

Cette question est d’autant plus cruciale que certaines administrations n’ont pas toutes les informations en main leur permettant de faire un choix éclairé en fonction des ressources humaines dont elles disposent, sur leurs connaissances techniques qui permettent d’assurer la maintenance et l’évolution des plateforme, le financement nécessaire, les retours d’expérience et les bonnes pratiques.

CKAN	DKAN	Udata   OpenDataSoft   Socrata	   Junar
  • Prix / Coût de la licence annuelle
  • Hébergement
  • Accompagnement
  • Ressources à déployer en interne
  • Open Source / Propriétaire
  • Langage du Backend
  • Langage du Front
  • Extensions disponibles
  • Personnalisations

Avec une petite analyse des pro/cons
Une liste de fonctionnalités recommandées pour le portail et par jeu de données
Exemple :

Fonctionnalités générales Détail
Organisation responsable Le portail doit fournir des informations sur l’autorité qui héberge le portail, le modèle de gouvernance, et le cadre institutionnel qui fournit les données
Système de gestion des données Le portail doit fournir des informations sur le système de gestion des données utilisé sur le portail
Langue Si nécessaire, l’outil doit pouvoir intégrer la gestion de plusieurs langues
Gratuité et accès aux données Le portail doit donner un libre accès aux données, gratuitement et sans inscription préalable
Nombre de jeux de données Le portail doit indiquer le nombre de jeux de données qu’il contient
Nombre de réutilisations Le portail doit pouvoir indiquer les réutilisations des données
Moteur de recherche Possibilité de chercher et filtrer par catégories les jeux de données facilement
API Le portail doit pouvoir proposer une API pour faciliter la réutilisation des données proposées
Comptes utilisateurs Le portail doit proposer de pouvoir créer facilement un compte utilisateur
Catégories et Tags Possibilité par l’administrateur de créer des tags et des catégories pour aider la recherche
Commentaires Possibilité de commenter les données par les utilisateurs enregistrés
Formulaire de demande de données Possibilité de demander un jeu de données à une autorité, une adminsitration, une organisation et de laisser cette demande ouverte à tous
Documentation Documentation technique et fonctionnelle sur comment utiliser le portail
FAQ Apporte des réponses aux questions basiques

Informations par jeu de données

  1. Titre et description
  2. Source
  3. Date de publication initiale et dernière date de mise à jour
  4. License
  5. Couverture géographique (nationale, régionale, locale)
  6. URL du jeu de données
  7. Taille du fichier de données
  8. Nombre de vues / visites
  9. Nombre de téléchargements
  10. Formats opérables par une machine
  11. Possibilités de visualisation immédiate (carte, graphiques…)

Benchmark plateforme du marché
(Samuel Goëta) #2

Hello,

il y a déjà quelques ressources sur le sujet mais à ma connaissance rien de synthétique comme tu proposes. le rapport “State-of-the-art Report and Evaluation of Existing Open Data Platforms” réalisé dans le cadre du projet européen Route2PA qui fait une étude très complète des fonctionnalités des portails. La dimension coût est manquante à ma connaissance.

Il y a une revue des solutions technologiques dans l’OpenDataToolkit de la Banque Mondiale qui présente les solutions de manière synthétique.

Enfin, dans le cadre du projet ANR Open Sensing City du laboratoire ELICO à Lyon, Françoise Paquienséguy et Valentyna Dymytrova ont réalisé une analyse de portails métropolitains de données ouvertes à l’échelle internationale qui porte sur 24 portails Open data métropolitains, 12 français et 12 étrangers.

Toutes ces études ne disent malheureusement rien du coût de ces portails. Je ne suis d’ailleurs pas sur que les fournisseurs de portail soient encore prêts à rendre public leur modèle de tarification.


(Cecile LE GUEN) #3

Merci, @samgoeta, très juste sur les coûts, cependant c’est un aspect déterminant qui oriente les choix, et par ailleurs, ces coûts sont à mettre en parallèle avec les coûts en ressource humaine interne qui permet d’administrer la plateforme, gérer les mises à jour, l’hébergement, les soumissions de jeux de données etc…


(Jean-Marc Lazard) #4

Tout à fait d’accord, une comparaison du TCO (coût complet) serait très intéressante.
Des rapports détaillés ont été produits aux US en 2016 mais ne sont pas en accès gratuit
https://www.idc.com/research/viewtoc.jsp?containerId=US41154416


(Samuel Goëta) #5

Est-ce que vous connaissez des cas d’usage de Dataverse hors du monde académique ? Est-ce que la solution pourrait être appropriée pour des administrations ?


(Samuel Goëta) #6

Tiens vous avez vu cette initiative du gouvernement UK ?


Quand je regarde le pilote à Plymoth, je ne vois pas la différence avec CKAN


(Joël Gombin) #7

À lire leur billet, c’est effectivement du CKAN, amélioré (mais difficile de savoir sur quel plan pour l’instant). La dimension “moteur de recherche” est notamment mise en avant.


(Cecile LE GUEN) #8

Oui, j’ai un peu testé leur instance déployée pour la ville de Plymouth en effet, et c’est du CKAN, pas de fonctionnalités de recherche spécifique, (pas d’auto-complete par exemple), en revanche j’ai l’impression que la valeur ajoutée, c’est de l’avoir transformé en SaaS en hébergeant la plateforme sur le cloud public du gouvernement, et du coup ça rend un portail open data basique à déployer facilement.

Ça me fait penser à ce qu’a fait OGP Toolbox avec l’outil de consultation numérique DemocracyOS, [le déploiement en un clic] :

Dans le cas de The Data Place, apparemment ils offrent des petites fonctionnalités de personnalisation de l’interface (j’imagine de style), mais ensuite, je pense que c’est autre chose de customiser complètement d’autres fonctionnalités. Enfin, à voir, j’ai demandé une démo :slight_smile:


(Jean-Marc Lazard) #9

certes pas présent en France, mais pour info, Socrata racheté par Tyler (un des leaders US des progiciels pour l’administration) https://searcherp.techtarget.com/news/252439664/Acquisition-gives-ERP-public-sector-firm-Tyler-a-data-cloud


(Thomas) #10

Il semblerait que la plateforme UData poussé par data.gouv.fr ne soit pas dans la liste des comparaisons du post
Le code est en ligne sur https://github.com/opendatateam/udata (truc marrant c’est que l’organisation s’appelle “opendata.team”, qui pourrait être confondu avec teamopendata.org)


(Christian Quest) #11

Et ne pas oublier l’option… j’ai pas de plateforme/portail, je m’appuie juste sur data.gouv.fr :wink: