Laboratoire Numérique Pour l’Étude De Paratextes: l'Exemple de Tacitus On Line

paper, specified "short paper"
Authorship
  1. 1. Anne Garcia-Fernandez

    Université Grenoble Alpes

  2. 2. Isabelle Cogitore

    CNRS (Centre national de la recherche scientifique), Université Grenoble Alpes, University of Savoie

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.


Introduction
Nous proposons d'exposer une modélisation et des outils de visualisation pour l’étude de paratextes. À partir du corpus des commentaires de Juste Lipse aux
Annales de Tacite, nous défendons l’intérêt de solutions propres aux objectifs scientifiques du projet tout en respectant des standards et en permettant la documentation et la réutilisation des outils : nous parlons de laboratoire numérique. Notre démarche est fondée sur les principes suivants : le questionnement préalable de la nature de l'objet d'étude et sa définition ; la volonté de servir avant tout les objectifs scientifiques du projet ; et la mise en place de solutions permettant la réutilisation tant des données que des outils et méthodes.

Le projet et son corpus
Tacitus On Line a pour but d’interroger le rapport entre le texte de Tacite et les savoirs qui se sont développés à partir des commentaires à ses œuvres, afin de produire une synthèse sur le développement de la pensée des humanistes dans ce qu’elle doit à l’antiquité romaine, en particulier chez Juste Lipse (1547-1606) à qui on doit la véritable découverte de Tacite.
De manière volontairement paradoxale, on cherche à comprendre non pas ce que le commentaire apporte au texte antique mais comment le texte antique a pu donner naissance aux commentaires humanistes et ouvrir ainsi à de nouveaux modes de pensée : les commentaires ne sont pas des « parasites » du texte antique mais occupent une place centrale.
La démarche consiste à partir d’une édition de 1608 qui présente les commentaires de Juste Lipse aux
Annales de Tacite et des commentaires d’érudits antérieurs, de la numériser pour faciliter des études ciblées (sur les citations, l’établissement du texte, le vocabulaire politique, etc) et arriver à une étude synthétique sur Lipse et Tacite.

Le corpus d’étude est composé du Livre I des
Annales de Tacite (80 paragraphes, soit 326 sous-paragraphes) et des 273 commentaires de Lipse à ces sous-paragraphes.

Modélisation et enrichissements
Le corpus a été transcrit et encodé en XML-TEI (schéma TEI All). Plusieurs arguments soutiennent ce choix parmi lesquels sa qualité pour représenter les manuscrits, la pérennité du format (qui existe et évolue depuis plus de 30 ans) et sa large utilisation dans la communauté (Burnard, 2013). Il existe de nombreux articles et ouvrages qui décrivent ce format (Burghart, 2010 ; TEI Website). Pour nous, un avantage majeur du format est qu’il ne présage pas des utilisations du corpus et incite à encoder la source le plus objectivement possible tout en laissant la place aux enrichissements et annotations scientifiques.
Les commentaires étant notre objet central d’étude, nous avons fait le choix de les encoder dans la balise <text>. Ils sont organisés dans des <div> indiquant grâce aux attributs @resp et @xml:id l’auteur et l’identifiant du commentaire. Le repérage du sous-paragraphe des
Annales auquel un commentaire se rapporte est encodé avec la balise <ref>. Les
Annales sont quant à elles au sein du <front>, dans des <div> de type “paragraphe” ou “sous-paragraphe” ayant pour @xml:id les identifiants des
Belles Lettres. Cette structure front/text reflète de fait notre point de vue sur les données.

Catégorisation des commentaires
Les commentaires peuvent concerner différents aspects du texte. Afin d'étudier la façon dont Lipse travaille et commente Tacite, une catégorisation des commentaires a été effectuée. La proposition est de travailler à partir d'un ensemble d'étiquettes de base, de les confronter aux données et de faire émerger une typologie en même temps que l'étude des commentaires se fait.
Pour chaque commentaire, une ou plusieurs catégories est attribuée dans l’attribut @ana. Une catégorie de travail a été ajoutée et apparaît sous l'étiquette « À corriger » permettant de repérer les commentaires pour lesquels les catégories n'ont pas encore été définies.

Des outils pour exploiter les données en cours de construction
Nous avons fait le choix d’une interface web répondant à des critères propres au projet : voir les commentaires et texte de Tacite en vis-à-vis, pouvoir faire des recherches plein texte ; observer les catégories des commentaires et rendre compte de la présence de citations.

Figure 1: Interface de Tacitus Online présentant les commentaires et leur(s) catégorie(s), le texte des Annales et les filtres de visualisation (colonne de gauche)

L'interface proposée est le résultat d'un développement utilisant des technologies web et XML classiques (HTML/CSS/JavaScript/Bootstrap pour le web ; XML/XSLT pour les données). Les sources sont accessibles surhttps://gitlab.com/litt-arts-num/tacitus-on-line et sous licence CC-BY-4.0 ce qui permet leur réutilisation et modification.
Dans la figure 1, on observe un ensemble de filtres permettant d’afficher les commentaires soit par exclusion (option “ou”), soit par inclusion (option “et”) selon différents critères : catégories du commentaire, des citations, auteur… D'autres filtres sont en cours de développement en particulier le filtrage par paragraphe.
La vue obtenue peut être partagée par un lien contenant l'ensemble des filtres actifs facilitant le travail collaboratif et la citation des sources.

La frise des commentaires
L'importance accordée à la catégorisation des commentaires fait qu'il est intéressant d'avoir une vue dédiée à ces catégories. Nous avons ainsi créé une frise (fig. 2) permettant de voir les commentaires comme des événements qui occurrent au fil du texte de Tacite. Elle est cliquable et permet d'aller au contenu correspondant.

Figure 2: Frise synoptique des commentaires

Cette vue synoptique permet de refléter l'abondance ou la rareté (§1.3.1 vs. §1.1.3) de commentaires pour certains paragraphes ou encore la variété ou la spécificité (§1.5.2 vs. §1.2.1) pour d’autres. Elle permet aussi de rendre compte de zones de texte plus ou moins commentées.

Conclusion
Le laboratoire numérique proposé permet de se libérer de la contrainte de publication des données : celles-ci sont accessibles en ligne, mais servent avant tout les objectifs propres au projet. La réutilisation des données est permise par plusieurs biais : l'accessibilité du site, le partage des filtres de recherche et l’utilisation du standard XML-TEI. Les développements sont accessibles, réutilisables et, à condition de respecter nos choix d'encodage TEI, l’outil peut héberger des données autres. De nombreuses évolutions sont envisagées comme des vues statistiques ou l’intégration d'outils issus de la linguistique de corpus (concordanciers, etc.).

Remerciements
Les autrices souhaitent remercier la MSH-Alpes,les Éditions des Belles Lettres, la Bibliothèque Municipale de Lyon, le réseau national des MSH ainsi que l’UMR Litt&Arts et ELAN, et les étudiants ayant participé au projet : accès aux sources, encodage, développement de l’outil, conceptualisation et modélisation du corpus, déplacement à Utrecht n’auraient pu se faire sans leur soutien financier, administratif ou encore humain.

Bibliography

Burghart, Marjorie (2010).
Éditer des sources historiques en ligne grâce à XML – Un guide pratique. Lyon : Online.
http://mutec.huma-num.fr/sites/www.mutec-shs.fr/files/Guide%20Editer%20des%20sources%20historiques%20%20gr%C3%A2ce%20a%20XML.pdf (accès au 26 novembre 2018).

Burnard, Lou (2013). The Evolution of the Text Encoding Initiative: From Research Project to Research Infrastructure.
Journal of the Text Encoding Initiative [Online], Issue 5 | June 2013,
(accès au 26 novembre 2018).

TEI Website.
TEI: Teach Yourself TEI, Online,
(accès au 26 novembre 2018).

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.