Lancement de la plateforme DATAtourisme

C’est la prochaine étape que j’envisage… pousser ces événements vers OpenEventDataBase… il faut juste faire le tri car il y a un peu de tout.
Ce sera aussi utile pour savoir comment utiliser ce flux pour osmose.

Bonjour à tous,

une remarque sur le positionnement de DataTourisme : l’objectif n’est pas de créer une base de données globale, avec toutes les données utiles à la valorisation des destinations. Il s’agit de mutualiser uniquement les données produites par les CDT. Mais dans quelle mesure les CDT sont-ils des producteurs de données légitimes ? (oui, je suis volontiers poil à gratter là).

Historiquement, les CDT et CRT ont déployé d’énormes efforts pour recenser les données utiles à la valorisation des destinations. Bravo à eux, vraiment.
Le contexte était alors la rétention d’information à tous les étages : chacun avait pour habitude de travailler de son côté, sans objectif de mutualisation ni de standardisation. Un exemple : le Ministère de la Culture recensait tous les événements des Journées du Patrimoine, pour ses propres supports uniquement. Les collectivités, CDT/CRT, PQR n’avaient alors pas le choix : pour disposer de la programmation, il fallait refaire le travail en doublon. Le moindre château était contacté par de multiples acteurs lui réclamant sa programmation.

Aujourd’hui, de nombreux acteurs produisent des bases ouvertes, notamment le Ministère de la Culture et des collectivités. Près de 150 acteurs ont réutilisé la programmation des dernières Journées du Patrimoine, mais pas les CDT/CRT. Ils refusent encore de réutiliser ces bases de données qui mangent leur travail historique et poursuivent le recensement en doublon de leur côté. Ils se considèrent comme LA source légitime de l’information et rejettent d’un revers de main le travail fait par le château, la DRAC et le Ministère de la Culture, pourtant organisateur légitime des JEP.

Un tournant n’a pas été pris par DataTourisme : reconnaître que les CDT ne sont pas les seuls producteurs/recenseurs de données dans le paysage du tourisme. Et que certaines données qu’ils s’obstinent à produire sont déjà ouvertes par les organisateurs initiaux et légitimes. Le métier de DataTourisme devrait être aussi de fédérer la multiplicité des initiatives.

Voilà, c’étaient mes deux sesterces.

2 « J'aime »

Tiens Bercy veut réfléchir au modèle économique de la plateforme

Et hop… pas d’idée alors je vais en acheter pour 70000 roros… plus le coût de traitement du marché.

Bonjour à tous, j’aimerais récupérer quelques données de cette base de données en CSV mais je n’arrive pas à faire fonctionner le script python j’ai toujours des messages d’erreurs… pour le fichier CSV il sort au format classique (:wink: ou toujours avec des urls ? J’avais pris le flux CSV mais ça ne répond pas à mes attentes :confused: Pour le script python j’ai tenté avec un .json et messages d’erreurs…

Vous serez heureux d’apprendre que s’il faut toujours créer un compte, j’ai eu accès à toutes les fonctionnalités dès l’acceptation des CGU.

J’ai programmé un dump total au format RDF. Comme ça manquait de requêtes SPARQL par ici :

construct {
?s ?p ?o
}

where {
?s ?p ?o
}
1 « J'aime »

Bon, ma génération de flux a “échoué”. C’était à prévoir… Mais j’aurai aimé un peu plus d’informations.

Bonjour à tous,

Quelques éléments d’actualité concernant le projet DataTourisme qui répondent aux remarques mentionnées précédemment:

Concernant le caractère open data des données:

  • Un dump est téléchargeable sur data.gouv.fr à l’adresse suivante: https://www.data.gouv.fr/fr/datasets/datatourisme-2/ mis à jour de manière quotidienne et le tout sous licence ouverte bien évidemment !

  • la création d’un compte est toujours nécessaire pour accéder à la plateforme datatourisme afin de proposer des services additionnels tels que des flux sur mesure par exemple.

Concernant la complexité du format proposé

  • le choix de se tourner vers le web sémantique est assumé afin de permettre une interopérabilité optimale des données et valoriser l’ontologie des données tourisme

  • Il est sérieusement envisagé du publier une version simplifiée des principaux critères de description des POI au format CSV

Etalab va être amené à se rapprocher de la DGE et de tourisme & territoires pour pérenniser le projet DataTourisme d’un point de vue technique tout en laissant la DGE et Tourisme & Territoires continuer d’animer le réseau de producteurs de données au niveau local.

3 « J'aime »

merci pour les infos @RomainTales !

1 « J'aime »

Bonjour à tous,

Nous avons pris connaissance avec attention de vos différents posts publiés sur ce fil de discussion, concernant le dispositif DATAtourisme.

Nous aurions souhaité y répondre plus tôt, malheureusement ces messages ne nous ont pas été adressés directement et nous les avons découverts tardivement.

Mais comme il n’est jamais trop tard pour bien faire, nous tenons à vous tenir informés des évolutions que nous avons mises en place sur la plateforme DATAtourisme depuis sa sortie il y a bientôt un an.

Concernant la création de compte obligatoire :

Pourquoi ce choix : effectivement, la particularité de la plateforme DATAtourisme est qu’elle propose à ses utilisateurs un service de création de flux personnalisés (nombreux filtres et formats disponibles). Ce choix d’accéder aux données uniquement via des flux sur-mesure implique la création d’espaces privés pour les utilisateurs et donc la création de comptes. Notre objectif était (et reste) de faire en sorte que les utilisateurs ne soient pas contraints de télécharger l’intégralité des données disponibles alors que, peut-être, seul un territoire ou une catégorie de données les intéresse. Dans le même temps, il nous semblait utile de savoir qui se connectait à la plateforme afin de pouvoir les contacter, échanger avec eux et mettre en avant les services créés à partir des données. Ces informations sur « qui télécharge les données » ont en outre un caractère vertueux pour le projet DATAtourisme car elles permettent d’inciter les producteurs de données à accélérer l’ouverture de leurs bases de données locales : plus il y a d’usages constatés, plus les territoires ont envie de publier rapidement leurs données !

Mais force est de constater que ce choix, même s’il se basait sur des arguments motivés, a été critiqué par les communautés de l’open data, considérant que l’un des principes de base de l’open data n’était pas respecté. Nous avons donc pris en compte ces remarques et fait évoluer le projet.

Quelles réponses apportons nous aujourd’hui :

  • l’intégralité du dataset DATAtourisme est disponible depuis cet été sans enregistrement, sous Licence Ouverte, depuis le portail Data Gouv. Il permet ainsi aux utilisateurs ne souhaitant pas utiliser les services de flux personnalisés proposés par la plateforme DATAtourisme, d’accéder aux données de manière anonyme et sans avoir à s’enregistrer (https://www.data.gouv.fr/fr/datasets/datatourisme-2/ )

  • l’accès à la plateforme et aux services personnalisés reste soumis à la création d’un compte pour les raisons évoquées plus haut, mais les modalités ont été allégées au maximum : la création du compte est immédiate depuis avril 2018 (il n’y a plus d’étape de validation ou d’accès en mode démo), et les informations de profil requises sont réduites au minimum.

Concernant le choix du format de restitution (triplets RDF) :

Pourquoi ce choix : l’objectif du dispositif, au-delà de la répondre au besoin de transparence et d’ouverture des données, est de faciliter la création de services numériques innovants. Au vu de la richesse des bases de données touristiques, il nous a semblé pertinent de partir sur les formats du web sémantique afin de permettre une interopérabilité maximale des données. Pari réussi semble-t-il, puisque de nombreux utilisateurs exploitent aujourd’hui les données disponibles et peuvent les croiser avec d’autres données sectorielles sans aucune difficulté technique.

Cependant, le fait est que le format choisi, s’il est très riche, n’en demeure pas moins complexe. Ce choix restreint l’accès aux données à une catégorie experte d’utilisateurs, et nous avons très vite constaté des difficultés à comprendre le format et à exploiter les données, pour de nombreux utilisateurs de la plateforme. L’adoption du dispositif reste donc aujourd’hui encore assez limitée (environ 10% des personnes ayant créé un compte téléchargent effectivement les données).

Quelles réponses apportons nous aujourd’hui :

  • En complément de la documentation technique mise à disposition, nous nous apprêtons à mettre en place un forum collaboratif d’entraide, qui permettra aux utilisateurs d’être guidés dans leur démarche,
  • Une FAQ détaillée sera publiée avant la fin de l’année,
  • Nouveau : un export des données au format CSV « aplati » vient d’être mis en place : http://www.datatourisme.fr/2018/11/19/publication-de-jeux-de-donnees-simplifies-format-csv/ . Il permet désormais à tout utilisateur d’accéder à la liste des POI dans un format basique, avec une sélection des principaux critères de description. Ces fichiers sont disponibles librement et sous Licence Ouverte, sur Data Gouv.

Enfin, concernant le fait qu’il existe d’autres producteurs de données que les CRT/CDT/OT :

En effet, nous le savons et notre objectif est d’ouvrir la plateforme à d’autres catégories de producteurs de données, notamment aux collectivités mais pourquoi pas aussi à terme à certains privés.
Mais sur ce point – et nous avons déjà eu l’occasion d’en discuter de nombreuses fois avec vous M. Lange – nous demandons un peu de patience et de temps. La mise en œuvre de ce dispositif DATAtourisme à partir des seules données des OT/CDT/CRT est un vaste chantier, et nous n’avons pas encore rassemblé l’intégralité des données disponibles dans ces structures (pour rappel, 45 bases de données locales sont à agréger). Il nous semble essentiel d’avancer pas à pas, même s’il peut paraitre frustrant parfois que cela prenne du temps. Nous gardons bien en tête le besoin d’agréger d’autres sources de données, à commencer par celles des collectivités, et nous ne manquerons pas de vous tenir informés de l’avancement des réflexions sur ce point et du rétroplanning envisagé.

Pour conclure, sachez que DATAtourisme est et restera un projet collectif, qui se construit au quotidien avec l’implication de l’ensemble de l’écosystème de la data touristique, des contributeurs / producteurs aux réutilisateurs.

Ce choix d’approche bottom-up nécessite de prendre du temps pour mettre en œuvre chaque objectif, mais il porte ses fruits : déjà 245.000 points d’intérêt agrégés et plusieurs centaines de réutilisateurs actifs.

Au-delà de l’accès technique aux données, les producteurs s’organisent afin de travailler ensemble sur la qualité de la donnée fournie en faisant évoluer non seulement leurs process internes, mais aussi l’ontologie DATAtourisme, dont la nouvelle version attendue d’ici quelques jours présentera de nouvelles catégories de données et un vocabulaire encore plus précis.

En 2019, le portage du dispositif sera transféré vers Etalab, ce qui laisse présager un bel avenir pour la plateforme.

Enfin, au-delà des constats (parfois sévères :slight_smile: ) que vous avez pu échanger entre experts, notamment au moment de la sortie de la plateforme, sachez que nous avons besoin de votre communauté pour nous aider à améliorer le dispositif.

Aussi n’hésitez pas à prendre contact avec nous, l’adresse contact(at)datatourisme(point)fr vous permettra de joindre l’ensemble de l’équipe projet.

Au plaisir d’échanger avec vous prochainement !
L’équipe projet DATAtourisme

4 « J'aime »

Bonjour à tous,

Quelques points d’actualité sur le dispositif DATAtourisme en ce début d’année 2019.
La plateforme compte actuellement près de 210.000 événements et points d’intérêt touristique en provenance de 12 régions / 84 départements. Les données sont accessibles sur la plateforme DATAtourisme, et en parallèle sur le portail Data.gouv.fr.

Parmi les évolutions de ces dernières semaines :

  • la mise en place d’un support utilisateur à l’adresse https://support.datatourisme.gouv.fr/

  • la publication d’une Foire aux questions

  • l’enrichissement de l’ontologie DATAtourisme avec l’arrivée d’une v2 contenant plus de 80 nouveaux types de données (catégories de POI)

  • la poursuite du travail de terrain sur la fiabilisation / qualification des données (échanges avec les utilisateurs, détection et correction des erreurs, réflexions collectives pour optimiser la qualité des données).

Du côté des réutilisateurs, les données commencent à être diffusées sur de nombreux sites et applications. Nous communiquerons prochainement sur une mise en avant de certaines réutilisations.

En attendant, nous restons à l’écoute de toute suggestion ou remarque, et notamment des vôtres !

Bonne journée,
L’équipe projet DATAtourisme

3 « J'aime »