Formats et modèles
Marcello Vitali Rosati,
« Formats et modèles »,
C’est la matière qui
pense (édition augmentée), Presses universitaires de Rouen et du
Havre, Mont-Saint-Aignan, 2025, ISBN : 979-10-240-1912-3, https://ceen.univ-rouen.fr/matiere-marcello/chapitre4.html.
version 1, 18/06/2025
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA
4.0)
Concentrons-nous maintenant sur les textes. La question à laquelle il semble nécessaire de trouver une réponse est la question ontologique : qu’est-ce qu’un texte ? Je vais essayer de montrer que cette question est mal posée, ou plutôt qu’il serait inapproprié d’en attendre une réponse – une seule. Il faudrait plutôt se demander : de quelle manière décidons-nous d’interpréter ce texte particulier ? La question ontologique prétend être une réponse unique et qui relève d’une essence universelle. L’essence serait quelque chose d’immédiat et donc d’unique. Mais on peut au contraire imaginer une essence médiate, qui émerge justement d’une série d’inter-actions – ou d’intra-actions, pour utiliser le langage de BaradBarad souligne le fait que le mot « interaction » présuppose la préexistence de deux pôles entre lesquels, ensuite, se crée une relation. Elle propose donc le mot intra-action pour signifier une relation qui serait antérieure aux pôles qu’elle relie, pôles qui seraient le résultat et non le présupposé de la relation.↩︎. Pensez au cigare de Stern : le phénomène du spin qui en émerge n’est pas l’essence immédiate de l’électron, mais le résultat d’une interaction de forces en jeu, forces formées par le dispositif d’observation ainsi que par ses caractéristiques matérielles et discursives : le cigare, le salaire de Stern, le sulfure d’argent… Tout cela fait partie du phénomène. Un électron serait une autre chose dans un contexte d’observation différent.
Et ainsi pour le texte : le texte est le résultat d’une série d’intra-actions. Une série de dynamiques qui deviennent les observables. La manière de choisir ces dynamiques – de délimiter l’observation et de la cadrer – relève d’un choix et a toujours quelque chose d’arbitraire. Ou mieux, ce choix est l’adoption d’un paradigme épistémologique particulier : légitimeIl est fondamental de ne pas confondre la multiplicité des paradigmes épistémologiques possibles avec le constructivisme. Les paradigmes épistémologiques possibles sont limités et dépendent des configurations matérielles en jeu. On peut choisir ce que l’on prend en compte, mais on ne peut pas inventer des interpétations. Mon approche est fortement réaliste, même si elle accepte une multiplicité d’épistémologies – ainsi que d’ontologies – différentes. C’est ce que j’ai appelé ailleurs une métaontologie (Vitali-Rosati 2021).↩︎, mais situé.
Je vais essayer d’expliquer cette formulation qui peut sembler obscure avec des exemples. Posons-nous la question « qu’est-ce qu’un texte ? » à partir de cet objet :
οὐ τὸ ζῆν χαρίεσσαν ἔχει φύσιν, ἀλλὰ τὸ ῥῖψαι
φροντίδας ἐκ στέρνων τὰς πολιοκροτάφους« Ce n’est pas le fait de vivre qui a une nature agréable, mais le fait d’éloigner du cœur les préoccupations qui font vieillir » (ma traduction).↩︎.
Nous pourrions dire que c’est un distique élégiaque, deux vers, un hexamètre et un pentamètre, en grec. Nous avons donc une définition, une théorie qui nous permet d’interpréter le texte et en même temps de le modéliser.
On pourrait penser que cette théorie précède toute manifestation matérielle du texte. Dans ce sens, on pourrait imaginer qu’il y a d’abord une théorie du texte et ensuite une implémentation de cette théorie dans une manifestation matérielle. Selon cette idée, la partie théorique serait indépendante de la partie matérielle. Indépendante et, bien évidemment, plus importante.
On peut schématiser ce point de vue comme suit : il y a d’abord une théorie du texte, une interprétation discursive qui relève du sens, et qui émerge des capacités herméneutiques d’un lecteur – dans ce cas plutôt d’un expert, d’un helléniste, d’un philologue. Ce philologue serait l’esprit qui pense et qui produit le sens. Ce sens est ce que l’on pourrait appeler le « modèle théorique ». Ici, le modèle théorique est : « un distique élégiaque composé par deux vers, un hexamètre et un pentamètre ». Ce modèle théorique serait ensuite incarné dans un modèle matériel : le texte dans la mise en forme que vous voyez ici.
Mais, si on y prête un peu plus attention, on se rend compte que la mise en forme particulière que je propose ici, comme première approche à ce texte, joue un rôle fondamental pour pouvoir donner la réponse. La mise en forme donne la possibilité d’identifier les vers, ou mieux, les vers sont la mise en forme qui permet ensuite une lecture et une scansion métrique.
Regardons une autre manifestation de ce texte :
AP 10.76, Paul le Silentiaire
οὐ τὸ ζῆν χαρίεσσαν ἔχει φύσιν, ἀλλὰ τὸ ῥῖψαι
φροντίδας ἐκ στέρνων τὰς πολιοκροτάφους. […]
Ici le texte serait sans doute défini d’une autre manière ; par exemple : « il s’agit des deux premiers vers d’une épigramme attribuée à Paul le Silentiaire et faisant partie du dixième livre de l’Anthologie palatine ».
Les crochets avec les trois petits points expriment l’extraction du texte d’un contexte plus large. Ce concept d’extraction n’était pas présent dans la première version. La première ligne exprime l’appartenance de ce qui suit à une œuvre et en explicite l’auteur. Le concept d’œuvre et d’auteur viennent d’apparaître, alors qu’ils n’existaient pas dans la première manifestation.
Allons maintenant dans des manifestations matérielles plus
complexes. Je vais analyser le processus d’encodage avec ekdosis
de ces deux mêmes vers. Voici le travail préliminaire réalisé par
Mathilde Verstraete sur la base d’une édition de Lucia FloridiÉvidemment, j’ai omis le préambule LaTeX, contenant
les informations de mise en forme et l’encodage des données, ainsi que
le conspectus siglorum, tous deux indispensables pour que les
annotations sémantiques aient un sens.↩︎ :
\begin{edition}
\ekddiv{
type=epigram,
head=\getsiglum{S}55 (f. 180\textsuperscript{v}) = %
\getsiglum{B}9 (f. 135\textsuperscript{r}),
n=6
}
\note[type=testium,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{\getsiglum{P} 10.76 (p. 501)}
\note[type=testium,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{\getsiglum{Pl} 1a.74.4 (f. 18\textsuperscript{v}) %
[\getsiglum{Q}, f. 18\textsuperscript{v}]}
\note[type=testium,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{\getsiglum{L}98 (f. 6\textsuperscript{r}),
qui duo epigr. distinxit, 1-2 et 3-8}
\note[type=lemmata,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{εἰς τὸ αὐτό \getsiglum{B}}
\note[type=tituli,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{Tit. Παύλου Σιλεντιαρίου \getsiglum{P}, \getsiglum{Pl}}
\note[type=tituli,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{s.a.n. \getsiglum{Ss}, \getsiglum{B}, \getsiglum{L}}
\begin{ekdverse}[type=hexdact]
\indentpattern{01}
\begin{patverse}
Οὐ τὸ ζῆν χαρίεσσαν ἔχει φύσιν, ἀλλὰ τὸ \app{
\lem[sep={~: }, source=edd]{ῥῖψαι}
%alt = edd. : plutôt à remplacer par un Shorthand, à encoder dans le préambule ?
\rdg[wit={P, Pl, Ss, B}]{ῥίψαι}
}
\\
φροντίδας ἐκ στέρνων \app{
\lem[sep={~}, nodelim]{τὰς}
\rdg[wit={Ss, B}, alt=om.]{}
}
πολιοκροτάφους. \linelabel{S55_2e} \\
\end{patverse}
\end{ekdverse}
\end{edition}Cet encodage produit ensuite, une fois qu’il est compilé avec LuaLaTeX, deux sorties, une en PDF qui donne le résultat visible ci-dessous :
Et une en TEI, qui donne le résultat suivant :
<div xml:id="div-edition_6" xml:lang="gr">
<div type="epigram" n="6">
<head>
<ref target="Ss1 #s2 #s3 #s4 #B #B1">S</ref>
55 (f. 180<hi rend="sup">v</hi>) = <ref target="#B">B</ref>
9 (f. 135<hi rend="sup">r</hi>)
</head>
<p>
<note type="testium" target="#range(right(S55_1a),left(S55_2e))">
<ref target="#P">P</ref> 10.76 (p. 501)</note>
<note type="testium" target="#range(right(S55_1a),left(S55_2e))">
<ref target="#Pl">Pl</ref> 1a.74.4 (f. 18<hi rend="sup">v</hi>)
[<ref target="#Q">Q</ref>, f. 18<hi rend="sup">v</hi>]</note>
<note type="testium" target="#range(right(S55_1a),left(S55_2e))">
<ref target="#l">L</ref>98 (f. 6<hi rend="sup">r</hi>),
qui duo epigr. distinxit, 1-2 et 3-8</note>
<note type="lemmata" target="#range(right(S55_1a),left(S55_2e))">εἰς τὸ αὐτό
<ref target="#B">B</ref></note>
<note type="tituli" target="#range(right(S55_1a),left(S55_2e))">
Tit. Παύλου Σιλεντιαρίου <ref target="#P">P</ref>,
<ref target="#Pl">Pl</ref></note>
<note type="tituli" target="#range(right(S55_1a),left(S55_2e))">
s.a.n. <ref target="Ss1 #s2 #s3 #s4 #B,B1s1 #s2 #s3 #s4">S
<hi rend="sup">S</hi></ref>,
<ref target="#B">B</ref>, <ref target="#l">L</ref></note>
<anchor xml:id="S55_1a"/>
</p>
<lg type="hexdact">
<l>Οὐ τὸ ζῆν χαρίεσσαν ἔχει φύσιν, ἀλλὰ τὸ
<app><lem source="#cramer_anecdota_1841,piccolos1 #s2 #s3,s4_s1 #s2 #s3,
s4upplement_1853-1 #page_further_1981-2">ῥῖψαι</lem>
<rdg wit="#P #Pl, Ss1 #s2 #s3 #s4 #B,B1s1 #s2 #s3 #s4 #B">ῥίψαι</rdg></app> </l>
<l>φροντίδας ἐκ στέρνων
<app><lem>τὰς</lem><rdg wit="Ss1 #s2 #s3 #s4 #B,B1s1 #s2 #s3 #s4 #B"/></app>
πολιοκροτάφους. <anchor xml:id="S55_2e"/> </l>
</lg>
</div>
</div>Cherchons à identifier les éléments principaux qui sont exprimés dans ces manifestations matérielles des deux vers. Tout d’abord, ils sont encodés comme épigramme de la Sylloge Parisina, soit le même poème, qui nous est transmis par une autre tradition manuscrite. Il s’agit donc de l’épigramme S55 et non de l’épigramme AP 10.76. On remarque d’ailleurs que les deux vers composent l’épigramme entière dans la Sylloge alors que ce n’était que le début d’une épigramme plus longue dans l’Anthologie palatine : les deux mêmes vers se retrouvent dans deux poèmes distincts. Mais au-delà de cette différence importante, le modèle textuel est bien plus complexe. Cela ne signifie pas que les précédents étaient moins légitimes, seulement qu’ils se concentraient sur un nombre plus limité d’aspects. La délimitation du contexte était différente.
De ces aspects additionnels qui sont exprimés dans les représentations que l’on vient de voir, il est nécessaire de préciser qu’ils ne sont pas des notions abstraites présentes dans l’esprit du philologue qui ensuite trouve une manière pour les incarner dans une représentation matérielle. C’est plutôt le contraire : ces aspects ne peuvent exister que parce qu’il y en a une manifestation matérielle.
C’est l’existence de certaines syntaxes particulières, l’habitude
des philologues de les pratiquer – de manipuler des éditions
critiques, de les produire – qui fait en sorte qu’elles peuvent
exister. C’est parce que le format d’ekdosis
me demande de renseigner une variante et offre une incarnation
syntaxique spécifique de la variante que l’idée même de variante peut
exister – dans le sens spécifique qu’elle acquiert ici, du moins – et
que je suis obligé de me poser la question des différentes versions du
texte dans des témoins différentsVoir les analyses de Robert Alessi (2020) et d’Estelle
Debouy (2021).↩︎. La syntaxe pose des
questions, soulève des problèmes, oblige à donner des renseignements,
met devant des nécessités, des possibilités et des impossibilités. Une
annotation de Mathilde Verstraete en témoigne. En explicitant les
questionnements qui surgissent du travail d’encodage, elle écrit :
« %alt = edd.~: plutôt à remplacer par un Shorthand, à encoder dans le
préambule ? ». En effet, la syntaxe ekdosis
permet de produire des informations sémantiques à propos des témoins
qui sont déclarés dans le préambule et ensuite appelés dans l’appareil
critique. Cela n’est évidemment pas possible en utilisant un logiciel
comme Microsoft Word et Mathilde Verstraete est en train de transcrire
depuis une édition faite par Lucia Floridi avec ce logiciel. Or une
annotation comme edd. signifie que la variante est
attestée dans les textes des éditeurs, mais cela ne spécifie pas
lesquels. Lucia Floridi entend donc, avec cette annotation, se référer
au fait que tous les éditeurs intègrent une correction évidente.
Mais qu’est-ce que cela signifie d’un point de vue sémantique ?
Doit-on comprendre que la correction est présente dans toutes les
éditions ? Si c’est ainsi, pour traduire cette information en balisage
sémantique il est nécessaire de prendre une décision aux implications
théoriques fortes : par exemple, créer un groupe de témoins déclarés
comme ensemble dans le préambule, un Shorthand. La syntaxe ekdosis
pose donc une question épistémologique qui n’existe pas dans le format
docx
et qui doit être traitée philologiquement.
Comme Robert Alessi le précise dans la documentation du paquet :
Terminology Strictly speaking, the term “witness” should apply to any manuscript evidence dating back to the Middle Ages used by the editor to establish the edition text. That said, editors often consult many other types of documents, such as modern editions, articles, notes, correspondence and the like, all of which fall into the category of “sources”. Furthermore, unpublished conjectures are also taken into account, not to mention the corrections and emendations that are proposed in many places by the editor of the text. As it is necessary to refer to scholars as individuals, “scholars” naturally emerges as a third category. Any reference that is to be used in the apparatus criticus must be “declared” in the preamble beforehand, namely: manuscript sigla (either for single manuscripts or manuscript families, primary or later hands, &c.), abbreviated last names of sources and scholars« Terminologie À proprement parler, le terme “témoin” devrait s’appliquer à toute preuve manuscrite datant du Moyen Âge et utilisée par l’éditeur pour établir le texte de son édition. Cela dit, les éditeurs consultent souvent de nombreux autres types de documents, comme des éditions modernes, des articles, des notes, de la correspondance et autres ; ceux-ci entrent tous dans la catégorie des “sources”. En outre, des conjectures inédites sont également prises en compte, sans parler des corrections et émendations qui sont proposées en de nombreux endroits du texte par l’éditeur. Comme il est nécessaire de se référer à des chercheurs en tant qu’individus, le terme “chercheurs” apparaît naturellement comme une troisième catégorie. Toute référence qui sera utilisée dans l’apparat critique doit être “déclarée” au préalable dans le préambule, à savoir : les sigles des manuscrits (soit pour des manuscrits isolés, soit pour des familles de manuscrits, soit pour des mains primaires ou postérieures, etc.), les noms de famille abrégés des sources et des chercheurs » (ma traduction).↩︎ (2021, p. 8 de la documentation).
ekdosis
propose donc une vision du texte ancrée sur ses différentes
manifestations matérielles : un texte est reconstruit en se basant sur
une série de documents particuliers et ces documents peuvent être des
manuscrits, des éditions, des articles, etc.
Dans la syntaxe d’ekdosis,
il y a donc une différence fondamentale entre dire : « cette
correction est évidente et donc on présuppose que toutes les
éditions l’intègrent », ou dire « cette variante est celle qui est
présente dans toutes les éditions suivantes ». Dans le premier cas,
l’annotation est une note qui exprime une conviction du ou de la
philologue. Dans le second, l’annotation consiste à identifier un
groupe de documents, les mettre ensemble dans un groupe de sources qui
aura un identifiant (le groupe d’édition X) et ensuite vérifier pour
chacun de ces documents que la variante choisie est bien la même.
ekdosis
produit donc une question théorique et donne une liste de réponses
possibles – liste limitée et balisée par sa propre syntaxe.
Ekdosis – Documentation du projet
Crédits : Robert Alessi
Pour revenir au sens global du texte dans ces trois manifestations, il faut, par ailleurs, souligner un changement important : il ne s’agit plus de l’épigramme 76 du livre 10 de l’Anthologie palatine, mais de l’épigramme 55 de la Sylloge Parisina qui, comme nous l’indique l’appareil critique, correspond aux deux premiers vers de AP 10.76. Le texte est dès lors pensé comme une tradition qui se transmet par des canaux particuliers – des manuscrits. Ce texte a donc des variantes. Cet encodage montre qu’il n’y a pas une intention d’établir laquelle de ces variantes est la « bonne », mais plutôt de rendre compte d’une tradition multiple et hétérogène.
Anthologie Palatine – Site du projet
Crédits : Chaire de recherche du Canada sur les écritures numériques
Il est important de souligner que le modèle originaire est celui de l’encodage LaTeX et que les deux autres (XML et PDF) en sont dérivés. Et pourtant, si on se concentre sur chacun des trois de façon séparée, nous pouvons remarquer que la notion de texte qu’ils proposent est complètement différente.
Pour résumer, l’encodage
LaTeX
nous présente le texte comme une série d’actions qui doivent se
déclencher au moment de la lecture. Le texte est donc une suite
linéaire de symboles qui déclenchent des actions de production de
sens. L’ouverture du paragraphe, par exemple, avec la commande
\ekdiv demande de faire des opérations de mise en forme
en ce qui concerne le format PDF
– et donc la sortie mise en pages –, demande aussi d’aller
« chercher » dans le conspectus siglorum la référence aux
lettres qui constituent l’argument, demande également de produire le
XML
qui transforme ces informations en une série de données exprimées dans
un arbre XML.
L’idée de texte qui ressort du balisage XML est, au contraire, une idée de données structurées dans une hiérarchie arborescente. Or ces deux notions (le texte comme suite linéaire de symboles qui déclenchent une action ou le texte comme ensemble de données structurées dans un arbre) ne sont pas réductibles l’une à l’autre.
La première est assez proche d’une modélisation possible de la lecture d’un document : le lecteur avance et, au fur et à mesure qu’il trouve des symboles qui sont signifiants pour lui, il les met en relation et produit un sens et une interprétation. Quand le lecteur voit « L98 », ces symboles déclenchent une action qui est celle de relier le texte qui suit au manuscrit qui a été précédemment identifié avec la lettre L. La lecture continue, de manière linéaire, et les yeux passent d’un symbole à l’autre, se déplaçant dans la page, de l’appareil critique au texte et vice versa. Ces mouvements correspondent à une série d’actions qui produisent des relations herméneutiques et font émerger le sens.
Le modèle de texte qui ressort du balisage XML est complètement autre. Le texte n’est pas une suite linéaire de caractères, mais une structure hiérarchique d’éléments imbriqués dans un arbre. Il n’y a aucune linéarité et l’ensemble des balises qui concernent un élément – par exemple les variantes – constitue une totalité de données non ordonnées de manière temporelle. Ce modèle essaie de saisir le texte en tant que données, informations objectives et qui expriment un sens qui leur est homothétique. Le sens ne dérive pas du balisage, le sens est le balisage. Dans le modèle du XML-TEI, une série de caractères « est une variante » – le XML produit une vision du texte qui consiste en des attributs ontologiques –, alors que dans le modèle précédent, une série de caractères demande des actions : faire le lien avec un autre manuscrit qui porte un texte différent. On a d’une part, pour le XML-TEI, un texte indexé et, de l’autre, pour le LaTeX, un texte lu.
Ces exemples démontrent deux principes qui sont au cœur de la théorie de l’édition que je propose ici. Le premier est que la matérialité du texte est son sens et qu’il n’est pas possible d’imaginer une théorie du texte qui fasse abstraction de cette matérialitéJ’insiste sur la valeur ontologique de cette équivalence. La thèse que je défends ici n’est pas que la matière « influence » ou « conditionne » le sens, mais que la matière est le sens.↩︎. Le second est qu’il n’est pas possible de trouver une modélisation du texte qui soit universelle, car chaque configuration matérielle particulière donnera lieu à un contexte d’observation déterminant non seulement un paradigme épistémologique, mais aussi une essence du texte. Il y aura donc plusieurs essences du texte, non pas une ontologie, mais une multiplicité d’ontologies.
Comment pensent docx, TEI et ekdosis ? Habiter l’espace numérique
Article publié dans Les Temps qui restent le 16 décembre 2024. Pour comprendre davantage sur l’essence du texte selon Microsoft Word, XML-TEI et Ekdosis.
Je vais essayer d’expliciter ces deux principes.