Nouveau portail open data de Lyon - version beta

ArthurSz · Juin 26, 2019, 9:42

Bonjour,

Merci pour cette nouvelle version de la plateforme. La possibilité de contacter le producteur de la donnée est particulièrement intéressante pour les chercheurs qui souhaitent comprendre plus en détail les modes de production de la donnée.

A propos des possibles évolutions pour rendre plus pertinente la mise à disposition des données, je suggère de mettre en avant les réutilisations directement sur chaque page du jeu de données. Ca permettrait de donner un premier ordre d’idée du potentiel de réutilisation et ça pourrait accroitre la confiance envers leur fiabilité. (Accessoirement, ça faciliterait les travaux de recherche qui essaye de retracer le cycle de la donnée dans l’écosystème open data lyonnais )

samgoeta · Juillet 30, 2019, 9:56

Bonjour,

félicitations encore pour le portail très réussi qui renouvelle le paysage.

Je me demandais : est-ce qu’il est possible de prévisualiser un tableau de données pour des données non-géographiques (facette type > non géo) ? J’ai cherché mais je n’ai pas trouvé. Est-ce une limitation du portail ?

Concernant les fonctionnalités, est-ce que vous envisagez la production de graphiques simples directement à partir du portail ?

flaust · Août 13, 2019, 2:27

Bonjour, et merci pour ces encouragements.

On peut trouver dans les facettes le filtre « Type » : géographique ou non géographique.
Nous travaillons actuellement à pouvoir filtrer parmi les datasets géographiques les objets ponctuels, linéaires et surfaciques.

Nous avons effectivement envisagé la production de graphiques, mais ils ne sont pas la fonction première du portail, et c’est donc une fonctionnalité qui peut arriver bien tardivement.

joel · Août 23, 2019, 6:55

Je pense que la (première) question de @samgoeta portait sur la possibilité de voir les (premiers) enregistrements d’un jeu de données non-géographiques sans avoir à télécharger le fichier. Par exemple sur ce fichier : https://data.beta.grandlyon.com/fr/datasets/abreviation-types-voies-metropole-lyon/info.

acerioni · Septembre 2, 2019, 4:10

@samgoeta, voici les réponses à tes questions :

Actuellement la visualisation tabulaire des données est limitée aux jeux de données géographiques. Donc oui, c’est une limitation du portail. En effet, pour l’instant toutes les données sont indexées dans Elasticsearch à partir d’une base PostGIS. Il faut qu’on implémente les connecteurs vers d’autres types de sources, notamment les fichiers CSV.
Oui, on aurait envie de permettre aux utilisateurs de produire des graphiques, mais ce n’est pas pour tout de suite. À court terme on publiera une évolution permettant d’afficher le tableau et la carte en même temps.

cquest · Septembre 2, 2019, 5:06

Une base postgis est avant tout une base postgresql… et postgresql sait utiliser les csv directement sans même les importer avec son foreign data wrapper fdw_csv

acerioni · Septembre 3, 2019, 7:23

@cquest, quelle serait la valeur ajoutée de PostgreSQL dans la tâche d’indexation dans Elasticsearch de fichiers CSV ?

N.B. : L’indexation des métadonnées - venant de GeoNetwork - et des données - venant de PostGIS - est faite, aujourd’hui, avec des scripts Python « reliés » par RabbitMQ.

cquest · Septembre 3, 2019, 2:09

Comme vous indiquez que ES indexe les données à partir d’une base postgis, j’en déduis qu’ES se connecte à postgres, et pourrait donc accéder aussi aux données CSV via postgres et un foreign data wrapper sans même importer les données dans PG.

Ce qui manquera pour des CSV, ce sont les metadonnées, mais si les dataset sont déjà présents dans la recherche c’est que des métadonnées ont été indexées pour eux mais pas leur contenu.

cquest · Septembre 3, 2019, 2:13

Une question concernant l’API rest/json afin de coder un archiveur dédié pour opendatarchives…

Je ne vois aucune métadonnée disponible via cette API, en particulier les dates de publication, de mise à jour des métadonnées et/ou du contenu du jeu de données, la licence du jeu de données, etc.

Pas trouvé non plus de moyen de récupérer via l’API la liste des pièces jointes associées à un jeu de données (si il y en a).

acerioni · Septembre 3, 2019, 2:23

Dans notre workflow d’indexation, Elasticsearch ne se connecte pas directement à PostgreSQL. Comme je le disais dans mon précédent message, l’indexation est réalisée par une collection de scripts spécifiques développés en langage Python, utilisant RabbitMQ pour communiquer entre eux.

Les métadonnées sont portées par l’application GeoNetwork. Vous pouvez y accéder en utilisant ses API. Voici un exemple de requête : https://download.data.grandlyon.com/catalogue/srv/fre/q?_content_type=json&resultType=details&fast=index&buildSummary=false. Si vous souhaitez cibler un jeu de données en particulier, vous pouvez ajouter le paramètre uuid, ex. : https://download.data.grandlyon.com/catalogue/srv/fre/q?_content_type=json&resultType=details&fast=index&buildSummary=false&uuid=d58bc748-2adc-47e1-adc3-426887f2a2dc.

cquest · Septembre 4, 2019, 9:59

Côté CKAN ça avance, exemple avec :

C’est quand même pas le plus simple à archiver !

acerioni · Novembre 27, 2019, 1:08

La fonctionnalité permettant de présenter les données sous forme à la fois tabulaire et cartographique est désormais en ligne, ex. : https://data.beta.grandlyon.com/fr/jeux-de-donnees/stations-velo-v-metropole-lyon-disponibilite-temps-reel/donnees.

Je vous remercie d’avance pour vos retours !

samgoeta · Novembre 27, 2019, 3:41

Bravo @acerioni, le rendu est vraiment top !
Est-ce qu’il est possible de pré-visualiser un csv dont les enregistrements ne comportent pas de propriétés géographiques (sans carte) ?

acerioni · Novembre 27, 2019, 3:55

Bravo à toute l’équipe, heureusement que je ne suis pas tout seul sur ce projet !

Concernant les fichiers CSV : non, il n’est pas possible de les pré-visualiser. @samgoeta, quel fichier souhaiterais-tu pré-visualiser, en particulier ?

samgoeta · Novembre 29, 2019, 11:17

Aucun en particulier pour le moment, c’est plus pour comprendre les fonctionnalités du portail

joel · Avril 13, 2021, 6:31

Bonjour,

deux ans après ce post initial, je viens aux nouvelles concernant la publication du code. Je n’ai pas réussi à le trouver sur le compte github du Grand Lyon, mais c’est peut-être ailleurs. @gsueur @n_vernus_prost vous sauriez me renseigner ?

cquest · Avril 13, 2021, 6:53

Comme quoi… 2 ans après

johan · Avril 13, 2021, 9:13

J’avais cherché récemment et à ma connaissance tout est là :

Si le premier point est strictement respecté (licence AGPLv3 sur tous les dépôts), le deuxième l’est beaucoup moins ! En effet, bon courage à celui qui voudra s’y retrouver dans l’architecture du projet et encore davantage pour espérer faire fonctionner à partir de ce code un portail qui n’est pas en tout point identique à data.grandlyon.com.

Par ailleurs, impossible de créer un compte utilisateur sur forge.grandlyon.com donc je ne peux pas signaler un problème ni faire une proposition de modification (merge request).

joel · Avril 14, 2021, 8:08

ah merci !

atherias · Mars 7, 2022, 9:19

Bonjour,
Dans le context d’un cours de Masters à propos de la gouvernance des données géospatiales, un collègue et moi avons choisi la métropole de Lyon comme étude de cas. Notre but est de mieux comprendre le processus de transition vers une infrastructure de données ouvertes. Jusqu’à present, nous avons exploré le portail Data Grand Lyon, étudié les rapports produits pendant les premiers “experiments” ainsi que la litérature académique à propos des infrastructures de données géospatiales et données ouvertes. Nous aimerions aussi inclure des réflexions à ce sujet de la part de personne(s) qui ont participé à son développement. Veuillez m’envoyer un message avant le vendredi 11 mars si vous seriez ouvert(e)s à répondre à nos questions.

Merci d’avance!
Adele (étudiante MSc Geomatics, Technische Universiteit Delft)