Exploitation des données massives en finance

  • Niveau d'étude

    BAC +5

  • ECTS

    1,5 crédits

  • Composante

    Sciences économiques, gestion, mathématiques et informatique

  • Volume horaire

    16h

  • Période de l'année

    Enseignement dixième semestre

Description

- Définition du concept de données massives. Concept des 3Vs.
- Présentation de sources de données boursières et financières gratuites ou commerciales
- Récupération de données disséminées sur le WEB à l’aide d’outils de Scraping
- De la donnée brute à la donnée exploitable : préparation des données comme input de modèles
- Introduction concept d’apprentissage statistique, classification, régression, panoplie de modèles existants
- Régularisation des données : overfitting, underfitting, hyperparametre et gestion de la variance
- Arbres de décisions, forets aléatoires
- Introduction aux Réseaux de Neurones Artificiels (ANN) et leurs dérivés (RNN, …)

Lire plus

Objectifs

L’objectif du présent cours-TD est double. A l’aide de Python, nous explorerons d’abord les problématiques liées à la gestion de données massives (Big Data). Une fois ces données retraitées convenablement, nous présenterons quelques méthodes de Machine-Learning utiles pour la régression et classification.
Le cours prendra la forme d’une conférence interactive (comme une PyConf).

Lire plus

Évaluation

Session 1 : évaluation écrite (partiel traditionnel)

Session 2 : écrit, oral ou dossier

Lire plus

Heures d'enseignement

  • TDTD16h

Pré-requis obligatoires

Compétence intermédiaire ou avancée en programmation Python et R

Lire plus

Compétences visées

Python : utilisation avancée des packages Pandas & Scikit Learn
Finance : connaissance de l'éventail des bases de données disponibles
Scraping : Extraction de données disséminées sur le WEB
BIG data : De la donnée brutes à la donnée exploitable
ML : Arbre de décision, Forêt Aléatoire, ANN, RNN

Lire plus

Bibliographie

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The elements of statistical learning: data mining, inference, and prediction. Springer Science & Business Media
Bishop, C. M. (2006). Pattern recognition and machine learning. springer.
Richert, W. (2013). Building machine learning systems with Python. Packt Publishing Ltd
Harrington, P. (2012). Machine learning in action. Manning Publications Co..

Lire plus

Ressources pédagogiques

Classe interactive

Lire plus