ECTS
3 crédits
Composante
Langues et cultures étrangères
Volume horaire
18h
Période de l'année
Enseignement septième semestre
Description
Atelier suspendu en 2025-2026.
This practical workshop course aims to equip students with the necessary knowledge, tools and methodology to carry out linguistic research building and using a large written corpus, i.e. an electronic collection of texts designed to be representative of language structure and use. After a quick theoretical introduction to key concepts in corpus linguistics, students will develop skills in three areas:
- Corpus construction: they will learn how to select and format relevant texts to be included in an English-language corpus. They will discover how to enhance the corpus through partially automated and manual annotation (i.e. systematic identification of grammatical, semantic, pragmatic, etc. features in corpus texts)
- Corpus use: in order to investigate a specific question pertaining to English syntax, semantics and/or pragmatics, they will learn how to use the functionalities of a software tool to retrieve relevant corpus data and obtain useful statistical measures (e.g. statistical significance, word and pattern association measures, keywordness measures).
- Interpretation of corpus data: they will learn how to interpret the data by combining large-scale quantitative results with small-scale qualitative analysis in order to answer their research question.
Objectifs
- Acquérir les concepts-clés de la linguistique de corpus
- Développer les savoirs-faire méthodologiques nécessaires à la construction et l’exploitation d’un grand corpus écrit
- Apprendre à mener à bien une recherche linguistique sur corpus écrit
Évaluation
Formule standard session 1 - Contrôle continu :
Travail collaboratif d’enrichissement/annotation de corpus et compte-rendu oral (30%)
Travail préparatoire écrit conduisant à la rédaction de l’étude (30%)
Etude de corpus écrite portant sur un sujet de recherche choisi par l’étudiant.e (40%)
Formule dérogatoire session 1 :
Épreuve orale (proposition d’une problématique de recherche et d’une méthodologie adaptée à partir d’un extrait de corpus) d’une durée de 30 min (20 min de préparation + 10 min de passage)
Session 2:
Epreuve orale sans temps de préparation
Pré-requis obligatoires
Maîtrise des concepts et de la terminologie essentiels en grammaire anglaise, en sémantique et en pragmatique. Compétence basique en informatique. Note : Aucune compétence en programmation informatique requise.
Bibliographie
Lindquist, H. & Levin, M. (2018). Corpus Linguistics and the Description of English (2nd edition). Edinburgh: Edinburgh University Press.
McEnery, T., Xiao, R. & Tono, Y. (2006) Corpus-Based Language Studies. London/New York: Routledge.
Wynne, M. (ed). Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbow Books. Available online at: http://ahds.ac.uk/linguistic-corpora/
