Les gens de Datahub (en fait Datopian, la société de Rufus Pollock) ont créé un concierge de données qui aide les gens à trouver des données. C’est drôle parce qu’on pensait à lancer exactement la même fonctionnalité pour Dododata. Du coup on est curieux : que pensez-vous de ce type de fonctionnalité ? ça vous paraît utile ? Comment pourrait-on l’améliorer ? Merci de vos retours !
Si je comprends bien c’est pour ramener quelques revenus à Datopian en monétisant un projet financé par OKI…
Je trouve le modèle de Datahub sous sa nouvelle forme assez intéressant à étudier (j’en ai fait un petit résumé ici).
Datahub a une version publique où tout le monde peut “pusher” ses données et une version “Core” pour une sélection plus limitée de jeux de données. C’est ce Core Data qui est le plus innovant puisqu’il est prévu de reposer sur une communauté de “curators”, des volontaires qui packageront les jeux de données.
Les gens peuvent aussi inscrire les datasets qu’ils veulent voir sur Datahub.
Oui je trouve l’idée de curation intéressante. L’idée de simplification de la publication de jeux de données en CSV est aussi intéressante, même si elle est moins neuve.
L’idée du concierge de données est assez distincte néanmoins de celle du Datahub, je ne comprends pas complètement comme ça s’articule.
Merci pour le résumé, c’est super. Je trouve que la première exploration des données est intéressante mais que, comme les données sont packagées et spécificiées, on pourrait aller plus loin. Par exemple, j’aime beaucoup l’approche de WTFcsv comme dans cet exemple sur les passagers du Titanic :
Dans ma bibliothèque j’ai un vieux bouquin qui date d’une quinzaine d’années “comment gagner sa vie en devenant courtier en données”, qui explique ce métier de “chercheur de données” en freelance. A l’époque il sagissait surtout de savoir naviguer dans des bases de données professionnelles pour repérer la bonne information… Un peu comme le service SVP d’ailleurs.
et alors, y a des gens qui ont fait fortune comme ça ?
Avec le bouquin en question je sais pas
Mais le métier lui-même, qui était plutôt exercé en freelance, n’a pas survécu à la généralisation des sources ouvertes en ligne et de Google et alii. C’est marrant de le voir revenir sous une autre forme. Signe aussi que le paradigme actuel des moteurs de recherche est bien adapté pour les documents mais pas pour les données…
Pour moi, la conciergerie de données intervient à deux niveaux dans ces dispositifs à la fois séparément parce qu’elle est destinée à des personnes qui ne souhaitent pas nécessairement participer ou rentrer dans tout ce procédé collaboratif et technique, et qui ne sont intéressées que par les données (brutes?), avec une idée quand même assez précise de ce qu’elles cherchent. Et d’un autre côté, la conciergerie permet également au groupe d’identifier des typologies de données demandées, à faire ensuite, ou pas, remonter dans un système de curation ou de “Core” data si apparaissent essentielles. En fait l’un se nourrit de l’autre finalement…
J’aime beaucoup l’approche de WTFcsv, que ce soit dans un objectif pédagogique évident, mais aussi pour améliorer des données produites, on voit très rapidement les données collectées qui ont du sens ou qui peuvent en donner et comment améliorer leur description ou organisation.
C’est un bel explorateur qui permet de mettre en lumière ce que l’oeil humain a parfois un peu de mal à distinguer et traiter de façon globale dans des colonnes de chiffres.
Certains services d’infomédiation s’appuyant sur un réseau d’expertises perdurent depuis de nombreuses années avec un modèle d’abonnement auquel notamment les collectivités recourent très souvent … C’est le cas de SVP par exemple : http://www.svp.com/acteur_public.php … La datamédiation opérée via une plateforme de conciergerie de données pour répondre à des questions ou problématiques liées à des politiques publiques reste sans doute à inventer. N’est-ce pas d’ailleurs le positionnement de Data Rendez-Vous ? https://www.datarendezvous.com
@loichay datarendezvous, c’est plutôt une solution de portail de traitement et de partage de données. Il peut y avoir des échanges entre producteurs et réutilisateurs sur la plateforme.
Dans le genre conciergerie de données, j’ai découvert grâce aux étudiants de la licence Médiations de l’Information Numérique et des Données de l’IUT Bordeaux que l’ENSSIB offre un service de questions-réponses qui a été très efficace pour guider vers certaines ressources dont des bases de données. Ca me fait penser qu’il faudrait se rapprocher des services d’information à la demande des bibliothèques pour voir un modèle proche de l’idée de conciergerie de données.
@samgoeta il y a effectivement sur Datarendezvous une offre de conciergerie de données :
Ah bien vu !
Du coup on parle d’introduire une interface humaine à la transmission de données. L’idée me plait, c’est sans doute quelque chose qui manquait et désincarnait l’initiative, qui toute louable qui soit, rendait le truc un peu éloigné et technique…
Tiens tiens je vois aussi que le Canada Open Data Exchange (ODEX) a aussi un service de concierge de données https://codx.ca/
Je cherchais la conciergerie de données de Datahub mais elle a disparu.
Heureusement, Archive.org est là !
Gros doute, mais je fais souvent office de concierge de données bénévolement !
Ce qui est nécessaire c’est d’avoir une vue d’ensemble de ce qui existe et aussi souvent de là où on pourrait trouver ces données si elles ne sont pas publiques et ouvertes.
J’ai souvent été « mentor » dans les hackathons et fait ce rôle de concierge pour des projets qui avaient besoin de tel ou tel type de données, ne savaient pas où les trouver, voire proposer des données dispo mais auxquelles ils n’avaient pas pensé et utiles au projet.
C’était aussi une tâche que j’assurais sur [email protected] et maintenant c’est souvent en DM twitter
Avec opendatArchives, ça s’est étendu à « je cherche des vieilles données / je ne retrouve plus des données qui ont été dispo mais qui ne le sont plus » !