#TeamOpenData

Quel est le diplôme de Data Scientist en ligne le plus reconnu?

Salut,

Je suis un ex-informaticien sur PHP/MySQL ( Larges BDD et applis sur Internet tournant sur larges BDD, etc…), et j’ai ma propre agence immo.

J’ai une forte appétance pour la data malgré mon ignorance technique dans ce domaine, et je programme mes propres applications (estimations automatiques, recherche de biens etc…) grâce à l’Open Data et à certaines super réponses ici :slight_smile:

J’aimerais parfaire mes connaissances malgré mon grand âge ( 55 ans), et donc faire une formation de data scientist, absolument à distance, mon métier d’agent immo ne me permettant pas d’aller en cours, étant trop souvent au téléphone.

Comme il y a du bon et du moins bon dans le domaine de la formation, quelle est selon vous la formation de Data Scientist par Internet la plus qualitative, et la plus crédible/reconnue auprès des grands acteurs, français mais aussi Européens / Ricains ?

Faut-il passer par la case Data Analyst avant de démarrer une formation en Data Scientist ?

J’ai vu que le MIT en fait une, Harvard aussi, mais il y a aussi quelques sites spécialisés. Les prix sont plutôt variables… L’anglais n’est pas un problème.

Question subsidiaire : plutôt Python ou plutôt R ?

Merci :slight_smile:

En ce qui concerne la reconnaissance des diplômes, je ne saurais répondre.

En ce qui concerne la qualité, il y a les MOOC de FUN MOOC qui sont excellents. Ils sont également gratuits. J’en ai suivi un sur le Deep Learning. Il y en a un en ce moment sur scikit learn qui est très bien aussi.

Je n’ai pas de grande expérience dans le machine learning, mais savoir manipuler, explorer, transformer des données (data engineering) et les voir (data viz) sont des plus pour faire du Machine Learning.

En effet, concernant le data engineering, le machine learning requiert de pouvoir transformer, croiser certaines données, avant d’en retirer la substantifique moelle. Aussi, il requiert de contrôler la qualité des données en amont.

Concernant la data viz (et la data analytics), elle est sans doute moins nécessaire que le data et le feature engineering dans le ML, mais des graphiques serviront à étudier les données d’entrée, la performance de modèles, et choisir les bons hyperparamètres, ainsi qu’à vérifier visuellement la qualité des prédictions.

S’agissant des MOOC de FUN, notamment celui sur scikit learn, vous pouvez vous y lancer sans maîtrise de data analytics, viz. Les connaissances en python seront malgré tout nécessaires, ainsi qu’un minimum en pandas pour le data engineering.

Je suis plutôt utilisateur de R, mais j’ai la sensation que python est un langage plus utilisé dans le domaine de la data science, certaines librairies célèbres comme scikit-learn ou keras ayant été développées sous ce langage.

Cependant, R dispose également de keras, et l’on peut utiliser certaines librairies R grâce à reticulate. Mais si vous ne connaissez aucun de ces deux langages, je vous conseillerais python.

1 Like

Salut,

J’ai fait le Data Science Starter Program de l’X Executive Education l’an dernier et ne peut que recommander cette formation, qui fait le tour de toutes les techniques d’IA, sur différents sujets (données tabulaires, images, texte, graphes…), 10% de R (en début de formation pour la dataviz) / 90% de Python (notamment pour scikit-learn qui est la librairie de ML sur laquelle est basée la formation). Il faut en revanche pouvoir accorder 20 jours sur site (à l’X), 10x (vendredi + samedi) sur un trimestre, puis encore une dizaine de jours chez soi pour faire le projet final.

A part ce programme, j’avais vu le parcours data science proposé par CentraleSupelec sur OpenClassRooms, qui m’avait bien tenté, complètement en distanciel, super complet, et probablement assez long aussi dans le temps.

A titre de révision de maths avant le DSSP de l’EXED (et afin d’avoir des bases en Python car je fais partie de ceux qui ont appris le C en école il y a 20 ans), j’avais au préalable fait le MOOC « Fondamentaux pour le Big data » proposé par l’IMT sur Fun MOOC, bien utile mais attention niveau maths c’est costaud !

Bon courage !
Matt

Merci Matt !