ECTS
4,5 crédits
Composante
Philo, Info-Comm, Langages, Littératures & Arts du spectacle
Volume horaire
36h
Période de l'année
Enseignement neuvième semestre
Description
Ce cours vise à approfondir les compétences des étudiant·es en matière de traitement des données par le code. Il s’appuiera pour cela sur l’usage avancé d’un environnement de programmation dédié (R ou Python). Les étudiant·es s’approprieront notamment les fonctionnalités d’acquisition de données (scraping, APIs, conversions) et de calcul statistique afin de produire des indicateurs pertinents pour une large variété de situations. Ils/elles travailleront également à l’harmonisation et la combinaison de jeux de données hétérogènes.
Objectifs
- utiliser de manière efficace un environnement de programmation dédié au traitement de données
- collecter et importer des données depuis une grande variété de sources
- conduire des analyses statiques et produire des indicateurs pertinents
- nettoyer et harmoniser des jeux de données hétérogènes
Évaluation
M3C en session unique
- Régime standard intégral – avec évaluation continue :
- Travaux pratiques évalués, 2 x 2h, 2 x 33 %
- Présentations et dossiers, 33 %
Pré-requis obligatoires
- usage avancé d’un logiciel de tableur / grapheur
- première expérience d’un langage de programmation
Compétences visées
- Choisir et appliquer une combinaison d’outils, de méthodes et de techniques adaptés (analyses sémiotiques, méthodes qualitatives et quantitatives en sciences humaines et sociales, techniques médiatiques, exploitation des ressources et architectures numériques, ingénierie documentaire), pour concevoir et réaliser des dispositifs d’information et de communication et en analyser la réception et les usages.
- Disposer d’une expérience personnelle d’analyse et/ou de production de dispositifs, objets et systèmes informationnels et communicationnels
- Analyser et synthétiser des données en vue de leur exploitation.
- Utiliser les outils numériques de référence et les règles de sécurité informatique pour acquérir, traiter, produire et diffuser de l’information ainsi que pour collaborer en interne et en externe.
Bibliographie
Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. O'Reilly Media, Inc..
VanderPlas, J. (2016). Python data science handbook: Essential tools for working with data. O'Reilly Media, Inc..
Ressources pédagogiques
Une liste de ressources sera donnée pendant le cours sur la base des échanges avec l’étudiant.