Composante
Formation continue Panthéon-Sorbonne
Langue(s) d'enseignement
Français
Présentation
Cette formation qualifiante a pour vocation de permettre l’acquisition de connaissances et de compétences spécifiques liées à la programmation et à l’analyse de données sous Python.
Objectifs
Faire des analyses avancées en science de données. La formation est ainsi organisée essentiellement autour de la maîtrise avancée de Python.
Savoir faire et compétences
Maîtrise des fonctions de base de Python pour travailler sur des données.
Maitrise des principales librairies Python de science de données.
Organisation
Membres de l’équipe pédagogique
Marc-Arthur Diaye, professeur des universités à l’université Paris 1 Panthéon - Sorbonne, directeur de la mention Econométrie-statistiques.
Chercheurs, experts et praticiens formeront le panel des intervenants.
Pour plus de renseignements (inscription, formation en intra-entreprise...) :
Tél : 01 53 55 27 69
formations-courtes-fcps @ univ-paris1.fr
Programme
3 jours
JOUR 1
Rappel 1 (3h)
• Introduction au langage python
• Le langage (la syntaxe, les structures), les opérateurs et les fonctions
• Présentation des données structurées et non structurées
• L’importation des données
Rappel 2 (4h)
• La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
• Présentation des librairies matplotlib et bokeh : Data visualisation
JOUR 2
Review jour 1 (1h)
Apprentissage statistique 1 (2h)
• Présentation des librairies scikit-learn et xgboost pour l’apprentissage statistique
Apprentissage statistique 2 (4h)
• Application des modèles de Machine Learning sur des jeux de données : choix des modèles (apprentissage supervisé vs non supervisé), optimisation des modèles, choix des meilleurs modèles, View sur Ensemble model: bagging, boosting et stacking, averaging, majority vote...
JOUR 3
Apprentissage statistique 3 : View Deep Learning (3h)
• Présentation de la librairie keras pour le Deep Learning
• View sur l’algorithme de classification d’images pour le Deep Learning
Exercice pratique supervisé (3h)
• Text Mining (NLP : Natural Language Process)
Présentation du projet d’évaluation (1h)