Niveau d'étude
BAC +4
ECTS
3 crédits
Composante
Sciences économiques, gestion, mathématiques et informatique
Volume horaire
24h
Période de l'année
Enseignement septième semestre
Description
L'analyse des données est un ensemble de méthodes permettant l'étude de grandes quantités d'informations traitées dans leur ensemble. Elle permet de réaliser des synthèses en extrayant les tendances remarquables, en les hiérarchisant afin d'acquérir une perception globale des faits. Elle est devenue un outil essentiel en économie, marketing, banque, assurance qui accumulent d'importants fichiers d'informations. Les méthodes s'adaptent à différents types de données et sont fondées sur des bases algébriques rigoureuses, permettent de fouiller des nuages de points et l'outil informatique permet de rendre ce travail très facilement accessible et de fournir aussi bien des résultats numériques que des graphiques.
Objectifs
L'objectif de ce cours est d'acquérir les fondements de la manipulation de données et de comprendre comment ils permettent de mettre en œuvre les techniques d'analyse et de synthèse des informations. Après des rappels d'algèbre linéaire, il sera présenté l'analyse en composantes principales et l'analyse factorielle multiple. Une introduction aux algorithmes de classification sera aussi proposée aux étudiant.e.s.
Évaluation
Evaluation écrite (partiel traditionnel).
Heures d'enseignement
- CMCM24h
Pré-requis obligatoires
Tableaux statistiques, vecteurs, matrices
Compétences visées
Analyse et synthèse de données multiples, production de rapports, interprétation des tendances.
Bibliographie
- An Introduction to Statistical Learning: with Applications in R, Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani
- The Elements Of Statistical Learning: Data Mining, Inference, And Prediction, Second Edition (springer Series In Statistics) de Trevor Hastie, Robert Tibshirani, Jerome Friedman
Ressources pédagogiques
Classe interactive