#TeamOpenData

Ouvrir une catégorie datageek

Parfois j’ai des questions ultra-techniques qui peuvent intéresser tout le monde.

Exemple en ce moment : comment concaténer deux colonnes CSV en ligne de commande ? Je n’y arrive pas avec le (fameux) csvkit : https://github.com/wireservice/csvkit/issues/930
Je suis obligé de passer par du perl mais je ne trouve pas ça hyper propre, je crains les effets de bord :
perl -n -a -F, -e 'print "$F[0]$F[1],$F[2],$F[3]"' c3.csv > c4.csv

En revanche je suis pas sûr que ces messages devraient remonter dans la synthèse quotidienne.

1 Like

je vais regarder si c’est possible d’exclure une catégorie de la synthèse quotidienne. Ça peut aussi être un groupe, je vais regarder.

On peut faire ce genre de choses avec la version desktop de Talend (rubrique data preparation), il faut se familiariser avec l’outil mais il est plutôt complet…

Merci du tuyau @Fabien mais je cherche vraiment à leur faire en ligne de commande.

Si je comprends bien ici vous concaténez 4 colonnes non pas 2? Sinon je tenterai la commande -lne ou -lpe cad perl -a -F, -lne etc… bon c’est un peu loin le Perl pour moi…

Personnellement, j’utiliserais “paste” en mettant le délimiteur à ‘’ en splittant le CSV par colonne avec CSVKit avant. Voir http://www.theunixschool.com/2012/07/10-examples-of-paste-command-usage-in.html ou https://www.geeksforgeeks.org/paste-command-linux-examples/ pour prendre des idées.

Sinon, sans répondre à cette question en particulier mais sur la partie traitement de données en ligne de commande, il y a aussi l’utilitaire “join” qui peut aussi rendre service quand on travaille avec des fichiers à plat (https://www.computerhope.com/unix/ujoin.htm)

J’ai créé un groupe “Data geeks” que n’importe qui peut rejoindre. Seuls les membres de ce groupe ont accès à la catégorie “Data geeks”, et donc seuls eux recevront dans le récap mail des infos sur les sujets créés dans cette catégorie.

@CharlesNepote n’hésite pas y créer le premier sujet :slight_smile:

1 Like

Merci Joël ! Rendez-vous là-bas !

Si je comprends, il faut publier dans le groupe ET mettre la catégorie “Data geeks” ? Ou il suffit de publier n’importe où avec la catégorie “Data Geek” ?

Il suffit de publier n’importe où dans/avec la catégorie DataGeek.

Pas forcément obligé de faire un groupe privé, on peut juste poster dans la catégorie data geeks et faire en sorte que ce ne soit pas en home

Oui mais je crois que dans ce cas ça figure quand même dans les recaps mails.