Calcul Intensif et Données Massives

⚠️ Attention : cette formation ne semble actuellement plus dispensée ⚠️

Dernière mise à jour : 
19/12/2019
Diplôme Grande École
Scolarité : 
606
 € par an
Le parcours de calcul intensif et données massives forme des ingénieurs aux techniques de programmation haute performance, à l'exploration et à la visualisation de données massives.

Ce parcours est mis en place lors de la deuxième année de formation à l’ENSIIE. Le semestre 3 fournit les compétences nécessaires pour entrer dans le monde des données, de la science des données lié à celui du calcul haute performance (HPC) et au développement de méthodes et techniques de programmation massivement parallèle (processeur multi-cœur, processeur graphique, supercalculateur, Cloud Computing). L’objectif du semestre 4 est d’exposer les étudiants aux techniques de programmation haute performance et de parallélisation massive en utilisant une gamme de bibliothèques de programmation multi-core, multi-thread ou GPU. Le semestre 5 s’articule autour de sujets avancés spécialisés dans la gestion des données massives en particulier l’intelligence informatique pour l’analyse, l’exploration et la visualisation de données, le développement de systèmes de nuages, les méthodes d’apprentissage.

Ce parcours offre la possibilité par la suite d'occuper l'un des postes suivants : Data Scientist, Administrateur Système HPC, Business Intelligence Manager, Chief Data Officer, Data Analyst, Ingénieur Développement, Logiciel Scientifique, Master Data Manager, Recherche et R&D, Lead Data Miner, Ingénieur Système HPC ou Ingénieur support applicatif HPC.

S3

Initiation à la Programmation scientifique

Architecture d’un système d’exploitation

Programmation parallèle

Projet informatique et méthodes Agiles

Système d’exploitation

Analyse des données (optionnel)

S4

Systèmes de Fichiers Parallèles

Parallélisme à base de thread

Réseaux pour Datacenter/HPC

Logiciel cluster

Programmation scientifique avancée

Réseaux IP et administration (optionnel)

S5

Simulation - Application au calcul des incertitudes

Compilation avancée

Virtualisation et Cloud

Machine Learning

Python for Data Science ou Modèle de régression régularisée

Lieux d'enseignement