Contenu pédagogique
Les cours sont dispensés en français et parfois en anglais. Les supports et contenus de formation sont majoritairement en anglais.
Module 1 – Setup – 8h
Objectif : Acquérir les bases nécessaires à la programmation en Python : scripts simples, structures de contrôle, types de données fondamentaux, concepts clés pour préparer l’analyse de données.
Module 2 – Python – 8h
Objectif : Renforcer la capacité à écrire des scripts Python simples en utilisant les éléments essentiels du langage, afin de consolider les fondations pour les futures analyses de données.
Module 3 – Data Toolkit – 40h
Objectif : Collecter, manipuler, explorer et analyser des données issues de sources variées grâce à Jupyter Notebook, Python, SQL et des APIs. Développer un raisonnement analytique structuré en s’appuyant sur les notions initiales de statistiques et de probabilités.
Module 4 – Decision Science – 32h
Objectif : Analyser un problème business réel, émettre des hypothèses, appliquer des méthodes statistiques (inférence, régression linéaire et logistique) et construire un dashboard pour présenter des recommandations claires. Adopter une posture de consultant Data.
Module 5 – Math – 8h
Objectif : Mobiliser les bases d’algèbre linéaire et de calcul différentiel (fonctions, équations, vecteurs, matrices, dérivées, intégrales) nécessaires à la compréhension et à l’implémentation des algorithmes en data science.
Module 6 – Machine Learning – 80h
Objectif : Réaliser un projet complet de machine learning supervisé et non supervisé avec Scikit-Learn. Maîtriser toutes les étapes clés : préparation des données, modélisation, évaluation, optimisation et industrialisation. Comprendre les fondements mathématiques et les applications sur données tabulaires, textuelles ou temporelles.
Module 7 – Deep Learning – 64h
Objectif : Concevoir, entraîner et évaluer des réseaux neuronaux variés (denses, CNN, RNN, transformers) pour traiter images, texte et séquences. Comprendre les principes de l’apprentissage profond, l’optimisation, le NLP, les modèles génératifs (GAN, RAG) et le renforcement.
Module 8 – ML Ops – 40h
Objectif : Mettre en production un modèle de machine learning à grande échelle : automatisation, déploiement dans le cloud via API, création d’une interface web utilisable en conditions réelles.
Module 9 – Projet – 80h
Objectif : Concevoir, développer, déployer et présenter en équipe un projet data/IA original et opérationnel. Appliquer les bonnes pratiques de CI/CD, utiliser des outils d’IA générative pour optimiser le travail, et intégrer les enjeux d’éthique et d’explicabilité.