Data Science, Statistiques & Apprentissage
⚠️ Attention : cette formation ne semble actuellement plus dispensée ⚠️
La voie Data science, statistique & apprentissage comporte une dominante d’enseignements avancés en mathématiques appliquées (probabilité, statistique), en informatique, ainsi qu’une ouverture à différents domaines d’application (finance, assurance, sciences sociales, et éventuellement compétences basiques en biologie). Le Data Scientist ainsi formé possède une expertise scientifique de très haut niveau qui lui permet d’aider à la prise de décision dans de nombreux domaines (décision économique, finance, biostatistique, imagerie, statistique publique) ou d’effectuer de la recherche fondamentale. Ce profil polyvalent peut mener aussi bien à des carrières d’expert qu’à des postes décisionnels ou d’encadrement en entreprise. Les voies de data science de l’ENSAE permettent d’acquérir un profil hautement qualifié en statistique et en économétrie appliquées pour lequel les débouchés sur le marché du travail sont extrêmement variés, du data scientist à l’enseignant-chercheur, en passant par le conseil, l’expertise statistique publique ou industrielle.
La troisième année de l’ENSAE comporte six voies de spécialisation. Chacune a été conçue pour proposer une séquence de cours de spécialisation cohérente, dans une perspective “métiers” et non “discipline”. Chacun des métiers exercés par des ENSAE fera appel à des degrés divers à l’analyse économique et aux méthodes statistiques. Ces disciplines sont donc présentes au sein de chaque voie.
La voie Data science, statistique et apprentissage vise à délivrer des compétences à la fois larges et approfondies en vue de concevoir des modèles statistiques, de construire des bases de données (plans d’expérience, pré-traitements, etc.) et d’organiser les tests ou l’apprentissage statistique pour soutenir la prise de décision en rationalité limitée. Il offre des cours dans différents domaines : les enseignements liés aux enquêtes statistiques conduisent aux métiers de méthodologue au sein des instituts de sondage, dans les services statistiques et d’études des grandes entreprises et des administrations, et au sein des sociétés de conseil ; les enseignements orientés vers l’apprentissage et les statistiques en grande dimension conduisent aux métiers d’experts statistiques dans l’industrie ou les grandes entreprises utilisant de grandes bases de données telles que Google ou Amazon, mais aussi dans les start-up technologiques. Ces enseignements sont soutenus par des cours théoriques fondamentaux et mènent aussi à la recherche en statistique.
Le caractère transversal des méthodes quantitatives présentées dans cette voie permet aux étudiant·es d’accéder à une large palette de métiers, aussi bien dans le public que dans le privé. Cette voie développe, entre autres, les compétences attendues pour les postes de Data Scientist, de Data Engineer mais aussi de Chief Data Officer qui émergent dans le contexte lié au Big Data, .
Premier semestre
Cours obligatoires
Apprentissage Statistique avancé
Cours optionnels
Vous avez le choix parmi 4 à 7 options* sur l’ensemble du catalogue de cours de 3A, semestre 1 (sous réserve de compatibilité avec votre emploi du temps,). Nous vous recommandons les cours suivants :
*dont langue vivante
Langue vivante (1 langue max, anglais obligatoire si niveau inférieur à B2)
Éléments logiciels pour le traitement des données massives
Enchères et Matching : apprentissage et approximations
Gestion des risques de l’énergie
Microeconometric Evaluation of Public Policies
Modèles à chaîne de Markov cachée et méthodes de Monte Carlo séquentielles
Randomized Methods and Policy Evaluation
Semi and Non Parametric Econometrics
Statistical Methods of Econometrics
Statistique en grande dimension
Stage d'application (2A) ou cursus intégré
Si vous étiez en deuxième année à l’ENSAE
Stage d’application de 2A
Si vous arrivez directement en troisième année (cursus intégré), vous devez suivre le bloc d’harmonisation de 5 semaines, quelle que soit la voie de spécialisation choisie pour la suite.
Introduction aux langages R et Python (CI)
Option des élèves de la voie « économie »
Introduction à l’apprentissage statistique
Option des élèves de la voie « mathématiques appliquées »
Option pour poursuivre dans la voie actuariat
Deuxième semestre
Cours obligatoires
Apprentissage en ligne et agrégation
Et un cours semi-obligatoire au choix parmi :
Machine Learning for Natural Language Processing
Cours optionnels
Vous avez le choix parmi 2 à 4 options* sur l’ensemble du catalogue de cours de 3A, semestre 1 (sous réserve de compatibilité avec votre emploi du temps,). Nous vous recommandons les cours suivants :
*dont langue vivante
Applications du bootstrap et autres techniques de ré-échantillonage
Blockchain Technologies and Tokenomics
Deep Learning: Models and Optimization
Econometrics 3 (Panel data and duration models)
Histoire et épistémologie de la statistique
Langue vivante (1 langue max, anglais obligatoire si niveau inférieur à B2)
Machine learning for Econometrics
Optimal Transport : theory, computations, statistics and ML applications
Techniques avancées d’apprentissage
Traitement des données distribuées
Stage de fin d'études