Assistant conversationnel pour portails open data

Bonjour à la communauté TeamOpenData,

Je me permets de vous signaler le premier déploiement de notre assistant conversationnel pour portails open data, qui est en ligne sur datasud.fr dans le cadre d’une expérimentation soutenue par la Région Sud.
Cet assistant conversationnel vise à aider l’usager à formuler sa recherche et lui proposer des résultats plus pertinents.

C’est la première (grosse) réalisation logicielle de la cellule R&D de Datactivist afin de dialoguer avec les utilisateurs de portails open data, améliorer la connaissance des données disponibles et l’expérience de la recherche de données.
Techniquement, l’assistant conversationnel est développé avec la technologie open source Rasa et Rasa-X et s’appuie sur des ressources linguistiques ouvertes. Il deviendra plus « intelligent » au fur et à mesure des interactions avec les utilisateurs.

Avec @joel et @samgoeta , nous sommes partis du constat que la découvrabilité des données est « une condition préalable pour que les données ouvertes atteignent leur potentiel et la plupart des données sont actuellement difficiles à trouver » comme l’avait identifié l’Open Knowledge Foundation. Trouver les données dépend de la capacité des usagers à formuler des requêtes dans les mêmes termes que les producteurs de données. Pour surmonter cet obstacle, notre projet accompagne l’usager dans la formulation de son besoin et en augmentant (semi-)automatiquement les requêtes.

Pour l’utiliser, repérez le bouton :speech_balloon: en bas de chaque page sur datasud.fr. Cliquez dessus, il proposera de vous aider dans vos recherches de données. Il vous proposera ensuite d’enrichir votre requête avec des mots clés pertinents auxquels vous n’auriez peut-être pas pensé. Le bot vous propose ensuite des jeux de données pertinents dans le catalogue de datasud.fr et vous affiche directement les métadonnées des données que vous souhaitez.

Vous pouvez enfin contribuer à améliorer le robot en sélectionnant les résultats qui vous ont été utiles et en précisant en une phrase votre besoin. Toutes ces données nous aideront à améliorer la pertinence des résultats et à mieux connaître les besoins des usagers. Testez-le et faites nous part de vos retours !

Un très grand merci à notre collègue Anthony qui est la cheville ouvrière du développement et du déploiement :slight_smile:

5 Likes

Juste un détail, dans les jeux de données proposés, c’est le producteur « physique » qui est indiqué. Il serait plus pertinent d’indiquer l’Organisation.

Dans l’exemple ci-dessous, j’aurais préféré savoir qu’il s’agit du budget 2019 du « Département du Vaucluse » (et pas qu’il a été ajouté par Thierry Gales).
D’autant que comme les 2 premiers jeux comportent dans leur nom « Département des Alpes de Haute-Provence », cela peut porter à confusion.

Sinon, cela semble bien fonctionner :slight_smile:

Merci pour ce retour et ce signalement !

Sur certains jeux de données, le propriétaire renvoie à une entité administrative qui est suffisamment précise (ex: « CCAS de Digne-les-Bains » qui est plus précis que l’organisation « Ville de Digne-les-Bains »), sur d’autres c’est moins transparent sans contexte supplémentaire (ex: « Direction des finances et des affaires juridiques ») mais au moins ça ne renvoie pas à une personne comme dans votre exemple.

Il semble préférable comme vous le proposez d’afficher l’organisation, ou éventuellement l’organisation et le propriétaire, nous allons corriger cela rapidement ! Merci !