ECTS
120 crédits
Durée
2 ans
Composante
Philo, Info-Comm, Langages, Littératures & Arts du spectacle
Langue(s) d'enseignement
Français, Anglais
Présentation
Le master Traitement Automatique des Langues (TAL) concerne la recherche et le développement dans le domaine du TAL et des industries de la langue
Il est proposé en co-habilitation avec l'université Paris 3 Sorbonne Nouvelle et l'Inalco.
URL du master : http://pluriTAL.org
Brochure en ligne sur le site pluriTAL.org : Brochure 2019-2023
Objectifs
L'objectif de la formation est de donner à des étudiants issus de cursus en sciences humaines et sociales (sciences du langage, lettres, langues …) ou de cursus en sciences (informatique, mathématiques, sciences de l'ingénieur …) des bases solides qui leur permettent de s'orienter vers les métiers de l'ingénierie linguistique, et de leur donner les possibilités de choisir entre diverses perspectives. Il s'agit aussi de permettre à certains d'entre eux d'opter pour la recherche et le développement en ce domaine.
Savoir-faire et compétences
Les compétences acquises sont à la fois linguistiques, statistiques et informatiques. Les métiers et la recherche dans le domaine du TAL et des industries de la langue font appel à des méthodes et des savoirs multiples. Il s’agit de :
-
Disposer des méthodes d’analyse linguistique : maîtriser les manipulations débouchant sur des descriptions détaillées de faits de langue, connaître les fondements des différents domaines des sciences du langage (phonétique et phonologie, morphologie, syntaxe et sémantique) ;
-
Connaître les bases de la recherche et de l’extraction d’information, de la constitution et de la gestion de corpus (écrits ou oraux) et de ressources, y compris multilingues : les corpus sont des mines d’information pour une description réaliste d’emplois d’une langue, les techniques de la recherche et de l’extraction d’information permettent de rapatrier les documents ou les parties de documents jugés pertinents pour un besoin de recherche particulier ;
-
Exprimer les règles et les régularités à l’œuvre dans les corpus, par le biais des grammaires formelles et des traitements quantitatifs pour savoir passer d’une description linguistique d’un texte à une représentation plus formelle permettant sa prise en charge par des logiciels.
Les + de la formation
Le domaine du TAL est en pleine explosion et nécessite un renouvellement incessant de ses méthodes. Le master TAL s'inscrit pleinement dans cette évolution et dispense des savoirs multiples en linguistique, statistique, informatique et intelligence artificielle.En outre, il s'appuie sur un réseau important de partenaires industriels. Un emploi du temps adapté aux étudiants salariés (possibilité d’une formation en alternance).
Organisation
La première année du master (M1) est commune aux trois établissements (Paris Nanterre, Paris 3, Inalco) avec des journées d'enseignement dispensées dans les trois établissements.
La deuxième année (M2) s'organise selon quatre modalités, adossées chacune à un ou plusieurs établissements :
- un itinéraire Ingénierie linguistique, basé à Paris Nanterre, compatible avec un contrat en alternance en M2,
- un itinéraire Recherche et Développement, basé à Paris Nanterre et commun avec Paris 3 Sorbonne Nouvelle et Inalco,
- un parcours Ingénierie multilingue, basé à l’Inalco,
- un parcours Traductique, également basé à l’Inalco.
Contrôle des connaissances
Contrôle continu : examens sur table, devoirs à la maison, projets en groupe.
Ouvert en alternance
Type de contrat | Contrat de professionnalisation, Contrat d'apprentissage |
---|
En M2, de septembre à février : 3 jours par semaine à l'université, 2 jours en entreprise.
A partir de la mi-février : temps complet en entreprise.
Stages
Stage | Obligatoire |
---|---|
Durée du stage | 3 à 6 mois |
Stage à l'étranger | Facultatif |
Durée du stage à l'étranger | 3 à 6 mois |
Le stage obligatoire a lieu au cours du second semestre de M2 (janvier-septembre) dans un des domaines du TAL (en entreprise ou en laboratoire de recherche).
Programme
Sélectionnez un programme
Traitement automatique des langues (TAL)
UE Maîtriser un domaine et ses méthodes
21 créditsUE TAL et ingénierie linguistique 1
15 créditsLangages réguliers
3 crédits26hModélisation linguistique pour l'analyse automatique des textes
3 crédits24hPhonétique et synthèse de la parole
3 crédits24hGestion informatique du multilinguisme
3 crédits19,5hProgrammation et projet encadré 1
3 crédits36h
UE Document numérique et informatique 1
6 créditsBases de données pour linguistes
3 crédits24hProgrammation et algorithmique 1
3 crédits24h
UE Elargir ses connaissances/personnaliser son parcours
9 créditsUE Linguistique 1
9 créditsMachine creativity and text generation
3 crédits24hCorpus arborés et parsing
3 crédits24hLinguistique
3 crédits
UE Maîtriser un domaine et ses méthodes
21 créditsUE TAL et ingénierie linguistique 2
12 créditsStatistiques textuelles
3 crédits24hCorpus parallèles et comparables
3 crédits19,5hProgrammation et projet encadré 2
3 crédits36hOutils de traitement de corpus
3 crédits19,5h
UE Document numérique et informatique 2
9 créditsDocument structuré
3 crédits24hProgrammation et algorithmique 2
3 crédits24hEnrichissement de corpus
3 crédits24h
UE Elargir ses connaissances/personnaliser son parcours
6 créditsUE Linguistique 2
6 créditsGrammaires formelles
3 crédits24hIntroduction à la fouille de textes
3 crédits24h
UE Développer ses compétences linguistiques
3 créditsUE Langue
3 créditsLangue vivante
3 crédits24h
UE Maîtriser un domaine et ses méthodes
27 créditsUE Linguistique et informatique
27 créditsAu choix : 9 parmi 23
Modélisation des langues
3 crédits24hAnnotations sémantiques et applications en recherche d'information
3 crédits24hDe la modélisation au traitement automatique des données linguistiques
3 crédits24hIngénierie des connaissances
3 crédits24hLinguistique outillée et traitements statistiques avec R
3 crédits24hLangages du web sémantique
3 crédits24hApprentissage automatique
3 crédits24hBase de données et Web
3 crédits24hDocument structuré et écriture numérique
3 crédits24hSémantique computationnelle
3 crédits24hExpérimentation et modalisation dans les humanités numériques
3 crédits24hSyntaxe neuronale
3 crédits24hSémantique des textes multilingues
3 crédits24hGenres, textes et usages
3 crédits24hLexicologie, terminologie, dictionnairique
3 crédits24hFouille de textes 2
3 crédits24hRéseau de neurones pour la reconnaissance de l’oral et applications linguistiques
3 crédits24hTraitements statistique de corpus
3 crédits24hVeille scientifique et stratégique
3 crédits24hGouvernance de l'information, qualité, archivage
3 crédits24hAnalyse de données et datavisulalisation
3 crédits24h
UE Elargir ses connaissances/personnaliser son parcours
4,5 créditsUE Elargir ses connaissances/personnaliser son parcours
4,5 créditsAu choix : 1 parmi 3
Séminaire : TAL et linguistique de corpus
4,5 crédits24h
UE Développer ses compétences linguistiques
3 créditsUE Développer ses compétences linguistiques
3 créditsAu choix : 1 parmi 2
Anglais
3 crédits24hAutre langue
3 crédits24h
UE S'investir pour son université et dans son projet professionnel
1,5 créditsUE La recherche à l'université
1,5 créditsActivité en lien avec le laboratoire /l’ED
1,5 crédits24h
UE Conduire un travail personnel mobilisant la recherche/l'expertise
21 créditsUE Projet
9 créditsAu choix : 1 parmi 2
Stage insertion
9 créditsProjet tuteuré
9 crédits
UE Stage-Mémoire
15 créditsAu choix : 1 parmi 2
Stage en entreprise (3 à 6 mois)
15 crédits24hMémoire
15 crédits
UE S'investir pour son université et dans son projet personnel
3 créditsUE Préparation à l'insertion professionnelle
3 créditsAu choix : 2 parmi 3
Méthodologie de la recherche
1,5 crédits24hGestion de projets
1,5 crédits24hConférences professionnelles
1,5 crédits24h
Admission
Conditions d'admission
Mentions de Licences conseillées :
Sciences du langage.
Information-communication.
Humanités.
Langues étrangères appliquées.
Lettres, langues.
Informatique.
Mathématiques et informatique appliquées aux sciences humaines et sociales
Sciences de l'ingénieur
Les candidats titulaires d’autres diplômes pourront également candidater (procédure de validation des acquis académiques ou des études antérieures, notamment).
Pré-requis et critères de recrutement
En matière d’expériences professionnelles, le recrutement se fondera sur la prise en compte des éléments suivants :
- une formation initiale en sciences humaines, langues ou lettres montrant un intérêt pour l’informatique, les mathématiques ou le TAL
ou
- une formation initiale en informatique ou mathématique montrant un intérêt pour les sciences humaines, la linguistique, les langues ou le TAL.
Et après
Poursuite d'études
Possibilité de faire une thèse de doctorat en TAL.
Passerelles et réorientation
Possibilité de réorientation dans un master de Sciences du langage (notamment le master FLDL - Fonctionnements linguistiques et dysfonctionnements langagiers - de Paris Nanterre) ou dans un master d'Information et Communication (notamment le master DEFI - Documents électroniques et flux d'information - de Paris Nanterre).
Insertion professionnelle
Pour l’itinéraire LGC : le secteur du TAL comprend aussi bien les grands acteurs du web et du logiciel, qu’un grand nombre de PME qui développent des outils personnalisés pour les entreprises et les particuliers.
Métiers :
ingénieur linguiste (établissement privé ou public ou projets internationaux) // chercheur (établissement public ou secteur R&D) // enseignant-chercheur (après une thèse) // informaticien spécialisé dans le traitement des langues // gestionnaire de ressources textuelles (bases de données) // veilleur (scientifique, économique, stratégique, technologique) par analyse de documents textuels // développeur de ressources linguistiques (ontologies, mémoires de traduction, dictionnaires, treebanks) // développeur d’outils d’aide aux handicapés