• Niveau d'étude

    BAC +4

  • ECTS

    3 crédits

  • Composante

    Sciences économiques, gestion, mathématiques et informatique

  • Volume horaire

    30h

  • Période de l'année

    Enseignement septième semestre

Description

Ce cours présente les principales méthodes statistiques d’analyse de données, parfois en grande dimension :
• Rappels de statistique descriptive univariée et bivariée
• Analyse en composantes principales
• Analyse factorielle des correspondances
• Méthodes de classification non supervisée

Les méthodes sont mises en oeuvre sur R. Les étudiants sont encouragés à présenter les exercices sous forme d'exposé oral.

Lire plus

Objectifs

  • Maitriser les bases théoriques de l’analyse des données.
  • Maitriser leur mise en œuvre informatique.
  • Interpréter les résultats à l’issue d’une étude statistique.
  • Identifier des groupes d'observations ou de variables.
  • Réduire la dimension des observations ou des variable.
Lire plus

Évaluation

Modalités : CC
SESSION 1 :
Contrôle Continu
• Type : Écrit, Oral
• Durée : TP notés
• Précisions : Le CC peut comporter une épreuve écrite; les travaux réalisés en TP sont évalués ainsi que les éventuelles présentations orales des étudiants de leurs travaux. L'ensemble constitue 50% de la note finale.

Partiel
• Type : Écrit
• Durée : 3h00
• Précisions : Le partiel effectué en fin de cours consiste en une épreuve sur ordinateur (logiciel R) avec pour objectif de répondre à des questions portant sur un jeu de données. Le rendu est un fichier qui doit détailler les résultats obtenus avec leur interprétation.

Régime Dérogatoire
• Type : Écrit
• Durée : 3h00
• Précisions : L'épreuve est réalisée sur ordinateur avec le logiciel R; elle a pour objectif de répondre à des questions portant sur un jeu de données. Le rendu est un fichier qui doit détailler les résultats obtenus avec leur interprétation.

SESSION 2 :
• Type : Écrit
• Durée : 3h00
• Précisions : L'épreuve est réalisée sur ordinateur avec le logiciel R; elle a pour objectif de répondre à des questions portant sur un jeu de données. Le rendu est un fichier qui doit détailler les résultats obtenus avec leur interprétation.

Utilisation de l'intelligence artificielle : 
Dans le cadre de cet EC, l’usage de l’IA pour aider à la réalisation des travaux de contrôle continu de type devoir sur table est interdit.

Lire plus

Heures d'enseignement

  • CMCM12h
  • TDTD18h

Pré-requis obligatoires

Statistique descriptive et inférentielle, bases d'algèbre linéaire.

Lire plus

Compétences visées

A l'issue du cours, les étudiants sont capables de visualiser les données, et mettre en œuvre des méthodes pour les manipuler afin de mieux les comprendre, identifier des groupes d'observations ou de variables.

Lire plus

Bibliographie

  • Analyse de données avec R (2e édition)
    Auteurs : François Husson, Sébastien Lê, Jérôme Pagès
  • Statistique exploratoire multidimensionnelle
    Auteurs : Ludovic Lebart, Alain Morineau, Marie Piron
  • An Introduction to Statistical Learning (with Applications in R)
    Auteurs : Gareth James, Daniela Witten, Trevor Hastie et Robert Tibshirani.
Lire plus

Ressources pédagogiques

Diapos de cours ; modèles de codes R

Lire plus