ECTS
3 crédits
Composante
Philo, Info-Comm, Langages, Littératures & Arts du spectacle
Volume horaire
24h
Période de l'année
Enseignement quatrième semestre
Description
Ce cours aborde les points suivants :
- corpus : définition et problèmes de sa constitution
- formats de documents électroniques
- problème d’encodage de caractères
- normalisation de documents : pourquoi et comment
- langage de balisages
- HTML
- XML (document bien-formé, document valide, etc.)
- feuilles de style CSS, XSLT
- Text Encoding Initiative (TEI)
Objectifs
Cet enseignement a pour but de présenter le processus de la création d’un document numérique, ainsi que l'importance et les méthodes de sa normalisation pour les applications scientifiques et industrielles. Il se propose d’introduire les étudiants à la technique de l’annotation structurelle et sémantique d’un document numérique
Évaluation
M3C en deux sessions
REGIME STANDARD Session 1: CC 100%
Contrôle Continu : 2 notes au moins dont une évaluation en temps limité (50%)
REGIME DEROGATOIRE : CT 100%
1 note, évaluation écrite en temps limité - 2H
SESSION 2 (dite de 2nd chance) : CT 100%
1 note, évaluation écrite en temps limité - 2H
Heures d'enseignement
- TDTD24h
Pré-requis obligatoires
aucun
Compétences visées
- savoir créer, normaliser, homogénéiser, structurer et manipuler un document numérique
Bibliographie
Salvador X.L. « XML pour les linguistes », L’Harmattan, 2016
Calederan C. et Laurent P. Le document électronique à l'heure du Web, INRIA 2012
Michard A. XML : Langage et applications. Eyrolles, 2002
Ressources pédagogiques
TEI : https://tei-c.org/guidelines/