Concierge de données

dataondemand

(Joël Gombin) #1

Les gens de Datahub (en fait Datopian, la société de Rufus Pollock) ont créé un concierge de données qui aide les gens à trouver des données. C’est drôle parce qu’on pensait à lancer exactement la même fonctionnalité pour Dododata. Du coup on est curieux : que pensez-vous de ce type de fonctionnalité ? ça vous paraît utile ? Comment pourrait-on l’améliorer ? Merci de vos retours !


Une solution d'enrichissement et de publication de données : DataFair
(Johan Richer) #2

Si je comprends bien c’est pour ramener quelques revenus à Datopian en monétisant un projet financé par OKI… :wink: :smile:

Je trouve le modèle de Datahub sous sa nouvelle forme assez intéressant à étudier (j’en ai fait un petit résumé ici).
Datahub a une version publique où tout le monde peut “pusher” ses données et une version “Core” pour une sélection plus limitée de jeux de données. C’est ce Core Data qui est le plus innovant puisqu’il est prévu de reposer sur une communauté de “curators”, des volontaires qui packageront les jeux de données.
Les gens peuvent aussi inscrire les datasets qu’ils veulent voir sur Datahub.


(Joël Gombin) #3

Oui je trouve l’idée de curation intéressante. L’idée de simplification de la publication de jeux de données en CSV est aussi intéressante, même si elle est moins neuve.
L’idée du concierge de données est assez distincte néanmoins de celle du Datahub, je ne comprends pas complètement comme ça s’articule.


(Samuel Goëta) #4

Merci pour le résumé, c’est super. Je trouve que la première exploration des données est intéressante mais que, comme les données sont packagées et spécificiées, on pourrait aller plus loin. Par exemple, j’aime beaucoup l’approche de WTFcsv comme dans cet exemple sur les passagers du Titanic :


(Simon) #5

Dans ma bibliothèque j’ai un vieux bouquin qui date d’une quinzaine d’années “comment gagner sa vie en devenant courtier en données”, qui explique ce métier de “chercheur de données” en freelance. A l’époque il sagissait surtout de savoir naviguer dans des bases de données professionnelles pour repérer la bonne information… Un peu comme le service SVP d’ailleurs.


(Joël Gombin) #6

et alors, y a des gens qui ont fait fortune comme ça ?


(Simon) #7

Avec le bouquin en question je sais pas :wink:
Mais le métier lui-même, qui était plutôt exercé en freelance, n’a pas survécu à la généralisation des sources ouvertes en ligne et de Google et alii. C’est marrant de le voir revenir sous une autre forme. Signe aussi que le paradigme actuel des moteurs de recherche est bien adapté pour les documents mais pas pour les données…


(Cecile LE GUEN) #8

Pour moi, la conciergerie de données intervient à deux niveaux dans ces dispositifs à la fois séparément parce qu’elle est destinée à des personnes qui ne souhaitent pas nécessairement participer ou rentrer dans tout ce procédé collaboratif et technique, et qui ne sont intéressées que par les données (brutes?), avec une idée quand même assez précise de ce qu’elles cherchent. Et d’un autre côté, la conciergerie permet également au groupe d’identifier des typologies de données demandées, à faire ensuite, ou pas, remonter dans un système de curation ou de “Core” data si apparaissent essentielles. En fait l’un se nourrit de l’autre finalement…


(Cecile LE GUEN) #9

J’aime beaucoup l’approche de WTFcsv, que ce soit dans un objectif pédagogique évident, mais aussi pour améliorer des données produites, on voit très rapidement les données collectées qui ont du sens ou qui peuvent en donner et comment améliorer leur description ou organisation.
C’est un bel explorateur qui permet de mettre en lumière ce que l’oeil humain a parfois un peu de mal à distinguer et traiter de façon globale dans des colonnes de chiffres.


(Loïc Haÿ) #10

Certains services d’infomédiation s’appuyant sur un réseau d’expertises perdurent depuis de nombreuses années avec un modèle d’abonnement auquel notamment les collectivités recourent très souvent … C’est le cas de SVP par exemple : http://www.svp.com/acteur_public.php … La datamédiation opérée via une plateforme de conciergerie de données pour répondre à des questions ou problématiques liées à des politiques publiques reste sans doute à inventer. N’est-ce pas d’ailleurs le positionnement de Data Rendez-Vous ? https://www.datarendezvous.com


(Samuel Goëta) #11

@loichay datarendezvous, c’est plutôt une solution de portail de traitement et de partage de données. Il peut y avoir des échanges entre producteurs et réutilisateurs sur la plateforme.

Dans le genre conciergerie de données, j’ai découvert grâce aux étudiants de la licence Médiations de l’Information Numérique et des Données de l’IUT Bordeaux que l’ENSSIB offre un service de questions-réponses qui a été très efficace pour guider vers certaines ressources dont des bases de données. Ca me fait penser qu’il faudrait se rapprocher des services d’information à la demande des bibliothèques pour voir un modèle proche de l’idée de conciergerie de données.


(Joël Gombin) #12

@samgoeta il y a effectivement sur Datarendezvous une offre de conciergerie de données : Capture du 2017-12-21 14-56-30


(Samuel Goëta) #13

Ah bien vu !


(Cecile LE GUEN) #14

Du coup on parle d’introduire une interface humaine à la transmission de données. L’idée me plait, c’est sans doute quelque chose qui manquait et désincarnait l’initiative, qui toute louable qui soit, rendait le truc un peu éloigné et technique…


(Samuel Goëta) #15

Tiens tiens je vois aussi que le Canada Open Data Exchange (ODEX) a aussi un service de concierge de données https://codx.ca/