ECTS
3 crédits
Composante
Philo, Info-Comm, Langages, Littératures & Arts du spectacle
Volume horaire
24h
Période de l'année
Enseignement quatrième semestre
Description
Ce cours aborde les points suivants :
- corpus : définition et problèmes de sa constitution
- formats de documents électroniques
- problème d’encodage de caractères
- normalisation de documents : pourquoi et comment
- langage de balisages
- HTML
- XML (document bien-formé, document valide, etc.)
- feuilles de style CSS, XSLT
- Text Encoding Initiative (TEI)
Objectifs
Cet enseignement a pour but de présenter le processus de la création d’un document numérique, ainsi que l'importance et les méthodes de sa normalisation pour les applications scientifiques et industrielles. Il se propose d’introduire les étudiants à la technique de l’annotation structurelle et sémantique d’un document numérique
Évaluation
M3C en 2 sessions
- Régime standard session 1
TD : La note est constituée d'au moins deux épreuves, dont une en temps limité.
- Régime dérogatoire session 1
Une épreuve en temps limité donnant lieu à une seule note
- Session 2 dite de rattrapage
Une épreuve en temps limité.
Heures d'enseignement
- Décrire et manipuler un document numérique TD24h
Pré-requis obligatoires
aucun
Compétences visées
- savoir créer, normaliser, homogénéiser, structurer et manipuler un document numérique
Bibliographie
Salvador X.L. « XML pour les linguistes », L’Harmattan, 2016
Calederan C. et Laurent P. Le document électronique à l'heure du Web, INRIA 2012
Michard A. XML : Langage et applications. Eyrolles, 2002
Ressources pédagogiques
TEI : https://tei-c.org/guidelines/