Bonjour à tous et à toutes,
En complément de la note concernant la méthodologie de prise en compte des relations entre champs dans les représentation tabulaires (cf post 3876 du 15/11/2022), vous trouverez ci-dessous une note plus générale concernant la structure des données tabulaires.
Vos remarques et commentaires sont les bienvenus !
Bonne journée
Gestion des données tabulaires
Les données tabulaires (ensemble de données regroupées par colonnes et par lignes) sont universelles et omniprésentes. On les retrouve aussi bien dans nos listes de courses, nos listes de taches, la gestion comptable et le suivi des processus, les formats d’échange.
Des outils dédiés leurs sont consacrés (les tableurs) et elles sont à la base également de solutions élaborées comme par exemple pour le stockage (les ‹ tables › des bases de données relationnelles) et pour le traitement (les ‹ DataFrame › Pandas) de gros volumes de données.
Pourtant, malgré cette importante popularité, il n’existe que très peu d’outils permettant de comprendre, d’analyser et d’exploiter la structuration de ce type de données.
L’objet de cet article est donc de présenter les améliorations importantes qu’apporte une meilleure gestion de nos données tabulaires.
L’article est découpé en deux parties:
- une première partie explicative accompagnée d’un exemple,
- une deuxième partie justificative et de démonstration s’appuyant sur un outil dédié
Pour plus de précisions, consulter le projet Environmental Sensing.