Clausier data et IA

Bonjour,
La Région Occitanie a créé un groupe de travail, réunissant les directions de l’information et du numérique, des affaires juridiques ainsi que le DPO, pour élaborer un clausier data et IA à inclure dans nos règlements de consultation et avenants. Nous sommes à l’étape de l’exploration des ressources existant sur le sujet et nous serions très intéressés de recueillir les retours d’expérience d’autres collectivités pour enrichir notre réflexion (ressources, méthodologie, travaux en cours…).

3 « J'aime »

Bonjour Hélène,
Pas grand chose à voir avec l’IA, mais la dernière fois que j’ai entendu parler d’un clausier, c’était avec DataGrandEst:

Et en particulier:
https://www.datagrandest.fr/portail/fr/ressources/ressources-juridiques
Ces travaux sont conduits avec Schéhérazade ABBOUB, que certains acteurs d’Occitanie doivent connaitre.
Bonne journée,
Bruno

bonjour. Du côté de La Rochelle nous travaillons sur une auditabilité des données d’apprentissage à fournir lors de la phase de consultation.
Nous en sommes encore à la phase de réflexion mais ça donnerait quelque chose du genre : fournissez un échantillon des données utilisées pour la phase d’apprentissage et/ou fournissez un audit, justifiez du respect de la propriété intellectuelle desdites données lors de cette phase. Objectif : comme il y aura toujours des biais, il s’agit de les identifier en amont, en informer les utilisateurs et les homologuer si besoin.
Nous sommes intéressés par les résultats de vos travaux pour nos propres marchés.
Merci

J’ajouterai « représentatif »…

Les données d’entrainement sont en effet un sujet crucial qui englobe le problème des biais, les problèmes juridiques sur les droits qui peuvent dériver de ces données, et sur la reproductibilité.

Si l’on ne veut pas retomber à terme avec l’IA dans les travers des logiciels propriétaires, il faut être strict sur l’aspect ouvert de toute la chaine, que ce soit les algo et API, modèles entrainés mais aussi les données ayant servit à les entrainer.

La définition « IA open source » de l’OSI ne va malheureusement pas jusqu’au bout.

On sait que dans le far-west actuel, de nombreux modèles ont été entrainés sur des données non ouvertes ou sans autorisation et l’avenir nous dira (après quelques procès) quelles conséquences cela aura pour ce qui sort de ces modèles.