Par Corinne Welger-Barboza
Avant toute chose, je tiens à marquer que j’ai été stimulée dans l’exploration des arcanes d’Arcane dont Egodoc montre l’application, grâce à Laureline Meizel et Jean-François Huguenot [1]qui ont étudié ce site avec talent et rigueur, alors que rien ne les avait préparés à ce genre d’exercice. La publication impose des formats brefs et surtout l’évolution de ce projet m’a contrainte à faire plus que réduire ou remanier leur travail. Mais ils y restent associés.
Egodoc [2] est un site dédié à l’étude des ego-documents [3], plus précisément les correspondances, journaux intimes, relations de voyage, livres de raison, mémoires, d’une époque s’étendant du XVIIème au XIXème siècle. Avant d’en commencer la présentation, il faut préciser qu’un nouveau site, également prototype, rend davantage compte de l’état d’avancement de l’équipe qui y est attachée. Toutefois, le premier site mis en ligne sur lequel je m’appuie me parait d’une approche plus aisée pour les non-initiés à l’édition électronique sophistiquée [4]. Il faut ajouter à ce propos que la nouvelle version en ligne est dynamique, elle permet aux lecteurs de composer des requêtes personnelles et d’enrichir les données selon des modalités spéciales. Nous espérons que la présente analyse rendra nos lecteurs curieux d’entrer en contact avec cette nouvelle version.
L’édition critique des ego-documents présentée ici s’inscrit dans une problématique de recherche sur les réseaux et les stratégies personnelles. Dans ce cas de figure, les exemples appartiennent à l’époque moderne. Selon les chercheurs réunis autour de ce projet, ceux qui l’ont conçu et ceux qui l’ont adopté, cette instrumentation favorise de nouvelles approches des espaces et des réseaux relationnels, ici appliqués à des corpus d’ego-documents. Un objet de recherche dont se sont saisis aussi bien les historiens que les sociologues ou les anthropologues, dans un contexte où la « micro-histoire » a posé l’intérêt scientifique de la restitution de l’épaisseur des trajectoires personnelles (environnement familial, social, culturel, religieux), voies empruntées pour accéder à l’époque étudiée. Cette production scientifique est le fruit d’une collaboration entre chercheurs de différentes équipes de recherche coordonnées par le SHADYC [5]. Plus précisément, ce site propose les résultats, sur un corpus limité, d’un puissant outil d’édition et de lecture interactive, le logiciel d’édition scientifique Arcane.
Dès la page d’accueil, on distingue aisément deux énoncés qui indiquent les recueils qui composent le corpus étudié : Le Journal de Corberon et Les Souvenirs d’un maçon de la Creuse. Mais un accès analogue, dans le même cadre, est proposé vers deux autres types d’énoncés : Les Ego-documents à l’heure de l’électronique. Nouvelles approches des espaces et réseaux relationnels, d’une part ; les Journées Arcane, d’autre part. La fréquentation de l’Internet scientifique nous a familiarisé(e)s avec cette singularité éditoriale : tout site produit par une communauté de recherche nous offre la présentation de plusieurs sortes d’informations et de documents. Un corpus de documents ainsi que les outils d’exploitation de ce corpus, la présentation des équipes mais encore la démarche spécialisée qui supporte la forme choisie de numérisation du corpus en question et enfin la façon dont la mise en ligne s’inscrit dans la pratique de recherche des équipes en question. On retrouve tous ces éléments dans le cas d’Egodoc ; reste à en préciser l’originalité.
En premier lieu, c’est Arcane, cet « outillage » particulier qui combine l’édition électronique de bases de données, les propriétés de l’hypertextualité et de la modélisation dynamique qu’il convient de présenter.
Egodoc, une déjà longue histoire
De nombreux documents consultables sur le site lui-même [6]nous donnent à connaître l’historique du projet, le long travail de conception et de réalisation de l’outil d’édition électronique Arcane. Le travail commence en 1992, date à laquelle Eric-Olivier Lochard, informaticien à l’université Paul Valéry - Montpellier III, jette les premières bases d’Arcane ; il se poursuit dans le cadre de l’équipe « Modèles informatiques pour l’édition et l’étude des textes » du Centre d’étude du XVIIIe siècle [7], en relation étroite avec historiens et littéraires. Une première version d’Arcane voit le jour en 1995, avec l’édition des Lettres de France de Denis Fonvizine (CNRS Editions). Un projet parallèle, en collaboration avec Hans Bots de l’université de Nimègue et Antony McKenna de l’université de Saint-Etienne [8], met en œuvre, en 1997, la création d’un atlas européen des correspondances aux XVIIe et XVIIIe siècles. En 1999, Dominique Taurisson [9] et Pierre-Yves Beaurepaire [10]lancent l’édition de la base de données que l’on retrouve sous la forme publiée d’Egodoc. [11]
Arcane propose un processus d’édition électronique qui repose sur la constitution d’une base de données sous XML pour l’édition électronique, sous TeX pour l’édition imprimée. De même, le système est destiné aussi bien au travail collectif et collaboratif. Pour poursuivre synthétiquement mais rigoureusement la description du principe technique d’Arcane, il est préférable de laisser la parole aux concepteurs :
(Il s’agit de) « proposer un modèle algorithmique fondé et « naturel » des activités d’écriture et de lecture électroniques, trait d’union entre rédacteur et lecteur, utilisé par l’un et l’autre pour écrire lisiblement et lire de façon intentionnelle et qui puisse résoudre le problème posé par la perte de la linéarité de l’information publiée : rappelons que la non-linéarité est due à la nature multimédia de l’information, à sa structure hypergraphique et à la nécessité d’un calculateur électronique pour la mettre en œuvre. »
L’architecture d’Arcane va permettre de mobiliser les documents constitutifs d’un « monde », au sens d’un monde de connaissance. « Le monde se compose essentiellement de sujets, de documents, de relations, d’enrichissements et d’un métalangage pour le décrire. Les sujets constituent les centres d’intérêt du projet éditorial, personnes, lieux, ouvrages, événements, thèmes d’étude, notions ou autres, selon les choix de l’éditeur, le principe étant que le monde édité ne parle de rien d’autre que de ses sujets ou à propos de ses sujets : ils déterminent la sémantique effective et objective du monde édité. » Quant aux documents de la base, ils sont de natures diverses et sont classés de façon à susciter des mises en relations multiples par le lecteur : « Les documents se répartissent en trois classes : les documents autonomes, les codocuments de document, sujet ou relation et les documents dynamiques. Les codocuments sont une généralisation des « notes de bas de page » : ils enrichissent d’une ou plusieurs informations documentaires multimédias les documents (codocuments de document), mais également les sujets (codocuments de sujet) et les relations (codocuments de relation) ; ils se lisent naturellement « depuis » leur source. Ils ont été pensés pour faciliter la rédaction et la lecture du monde, en introduisant explicitement de l’ordre dans les documents : toute information documentaire dont l’existence dans le monde dépend de celle d’un sujet (biographie d’une personne, exercice d’application d’un sujet-notion) « doit » être un codocument de ce sujet et se lire depuis le sujet ; toute note ou commentaire d’un document est un codocument et se lit depuis ce document. Les documents dynamiques sont définis par un script à appliquer sur des éléments du monde ; ils sont effectivement calculés et produits par le module de lecture en réponse à une instruction du lecteur, par exemple le document textuel composé de toutes les ancres d’une indexation par un sujet donné ou un « diaporama » Quicktime obtenu en juxtaposant des documents images enrichis de codocuments sonores. » propos extraits de l’article « Le monde selon Arcane » : un paradigme instrumental pour l’édition électronique » Eric-Olivier Lochard et Dominique Taurisson, Cahiers GUTenberg, n° 39-40 - Mai 2001. Ce sont les sujets définis par le prescripteur de l’édition, au regard de son projet scientifique qui vont permettre l’indexation des éléments et la navigation dans le « livre électronique » selon Arcane.
Un parcours dans le Journal de Corberon
Le Journal de Marie Daniel Bourrée de Corberon ( Paris- Saint Petersbourg - Paris 1775-1781) peut être pris en exemple pour faire l’expérience de l’approche des réseaux de sociabilité selon Arcane. L’essentiel du corpus rassemblé est composé des feuillets manuscrits du journal, numérisés sur le mode image, pour toute l’année 1775 ; le projet mentionne l’addition progressive des années supplémentaires jusqu’à 1781. Elles ne l’ont pas été, sur cette version en ligne, ce qui confirme son statut expérimental mais nous verrons plus loin la façon dont le programme se développe en cette année 2006. Hormis l’image des documents originaux [12], on trouve la transcription de chaque écrit. Le va-et-vient entre ces deux types de documents numériques est assuré par des balises actives. D’une façon générale, les textes - segments fournissant des occurrences ou transcriptions complètes des notes d’un jour - sont ponctués de ce que les auteurs nomment des icones de lecture : ces signes actifs dont la légende précise est proposée sur la page d’accueil assurent l’activation de documents, de sujets ou de relations constitutifs de l’approche du « monde » de Corberon.
Il faut ajouter que l’exploitation du multi-fenêtrage participe dans une grande mesure au système de lecture ; et ceci d’une double façon. D’une part, l’ouverture de fenêtres à chaque fois que l’on progresse dans un terme particulier, le nom d’une personne ou d’un lieu par exemple ou encore si l’on veut afficher l’image du manuscrit et sa transcription, permet le maintien « en surface » d’une pluralité de fragments du corpus. D’autre part, la page-écran est découpée en trois cadres qui assurent à la fois l’énoncé des entrées dans le corpus, le dépliage de certaines arborescences et la vision simultanée de différents types de textes ou de données tels que des signalements d’occurrences ou des graphes. La fenêtre la plus large sert bien sûr à l’affichage central des documents. Les deux cadres de gauche proposent les énoncés dynamiques qui ouvrent sur tous les modes de consultation proposés et d’entrées dans le corpus. Certaines de ces « rubriques » peuvent être divisées en sous-chapitres, lesquels sont alors listés dans le cadre du dessous. Se combinent ainsi des approches linéaires et transversales des textes. La conception qui préside à la proposition de ce découpage en trois cadres interdépendants de ce « livre électronique » est formulée ainsi par E.-O. Lochard : (Un cadre) « pour choisir le point de vue de représentation, le cadre de la représentation proprement dite, et un cadre pour les compléments (co-documents, appareils critiques, glossaire...) ». Ce sont ces points de vue proposés aux lecteurs qui définissent le paradigme Arcane. C’est à dire qu’Arcane, grâce aux annexes et surtout à leurs mises en correspondance, permet le parcours à différents degrés d’un même document suivant une grille de lecture à plusieurs facettes.
A propos de multi-fenêtrage, je me permets une incursion secondaire (mais de première urgence) dans mon propre texte pour recommander au lecteur de tenir l’ego-document ouvert pendant la lecture de cet article Ce genre de recommandation aurait davantage sa place dans une note de bas de page mais on y perdrait en simultanéité.
L’originalité du fonctionnement d’Arcane se manifeste davantage encore dès lors que l’on exploite l’ensemble des entrées et des opérations proposées. Lorsque l’on entre dans l’index relationnel, composé de termes allant de « aide/recommandation », « Amour : pratiques et description », jusqu’à « rencontre », « voyage », en passant par « mesure de connaissance » ou mesure de la santé », l’on active des occurrences dans le journal ; chacune de ces occurrences est développée dans une nouvelle fenêtre insérée sous le cadre principal, à la façon d’une notice qui détaille par champ tous les caractères ou les protagonistes de la relation convoquée. Cet appareil est généré automatiquement, comme l’affichage des occurrences. Un autre index des sujets, rassemblé sous une entrée alphabétique, indique toutes sortes d’autres entrées dans le corpus en mobilisant des occurrences ; il est aussi bien composé de thèmes, de lieux, d’ouvrages, d’œuvres littéraires, etc. Enfin, si l’on emprunte l’entrée des parcours, un certain nombre de « notions-concepts récurrentes et génériques » (selon la présentation qui introduit cette partie du livre électronique) qui donnent lieu à un traitement graphique interactif. Par exemple, l’item « Discussions Russie » est représenté par un graphe sphérique, une roue dont les rayons se terminent par des points terminaux actifs et débouchent sur une notice ; les points qui doivent l’être sont reliés entre eux. Cette formalisation est construite, à partir de l’item relationnel « Parler de... », dans la recherche sur le journal de Janvier 1775. Dans cette même partie, les lieux fréquentés font l’objet d’un plan « pastillé » de rouge. On notera enfin que le système se prête parfaitement à l’insertion de la littérature critique accumulée par une communauté de chercheurs ; ici, l’on trouve en exemple un article de Pierre-Yves Beaurepaire.
Les souvenirs d’un maçon de la Creuse ne fait l’objet que d’une application partielle du système Arcane [13]. Mais, phénomène plus étonnant, les Journées d’étude d’octobre 2002, intitulées Les Ego-documents à l’heure de l’électronique - Nouvelles approches des espaces et des réseaux relationnels, organisées par l’équipe scientifique d’Arcane, sont également traitées par le logiciel ; toutefois, seules les entrées « sujet » sont valides et non pas les entrées « relations ».
Les perspectives ouvertes par Arcane
Un certain nombre de difficultés semble avoir marqué les développements d’Egodoc ultérieurs à l’année 2000. En effet, dans son article déjà cité, Eric-Olivier Lochard note (en bas de page) lorsqu’il évoque la collaboration au sein du laboratoire « Modèles informatiques pour l’analyse et l’édition de textes » : « Il est intéressant de noter que les difficultés rencontrées pour évaluer ce genre de recherche appliquée et comprendre l’interdisciplinarité au sein d’un laboratoire des Sciences de l’homme et de la société (par exemple une équipe dirigée par un informaticien dans un centre d’étude de la littérature) ont provoqué la dissolution de l’équipe en septembre 2000. » En rapportant ces propos, il n’est nullement question ici de prendre part à une querelle institutionnelle dont nous ne connaissons directement ni les faits ni les circonstances. Le motif qui peut participer à notre réflexion, un motif général, est bien celui de la difficulté structurelle qui fait obstacle à la coopération entre les ingénieurs et les chercheurs dans des projets qui pourtant en dépendent intrinsèquement. Problème que l’on peut expérimenter, notamment à l’université, même lorsqu’il s’agit de projets moins ambitieux. Par ailleurs, des freins d’un autre ordre peuvent être relevés dans les interventions des participants aux Journées d’étude de novembre 2005 qui se sont tenues à Marseille [14].Le manque de moyens financiers alloués aux protagonistes français des divers projets utilisant Arcane ralentit considérablement le progrès des mise en œuvre. Là encore, cette situation peut être considérée comme le lot de nombre d’équipes. Cependant, il semble qu’en ce cas précis, les concepteurs d’Arcane n’aient pas trouvé les soutiens institutionnels nécessaires. Preuve en est qu’ils ont créé une association Loi 1901 qui assure la diffusion de l’outil, ainsi qu’un accompagnement méthodologique, auprès des équipes de recherche qui souhaitent l’intégrer dans leur approche.
Nous livrons la liste des développements en cours car ils témoignent, d’une part, du fait que la pertinence de l’outil est avérée ; d’autre part, de ce que les perspectives d’emploi d’Arcane peuvent intéresser des domaines divers.
> Consulter la liste des projets Arcanes (PDF)
En premier lieu, l’édition de la collection Egodoc que nous connaissons se poursuit ; le corpus est augmenté avec la collaboration des lecteurs. Cette réalisation progresse sous la même direction scientifique. Le site dynamique rend compte de cette progression. L’étude de l’année 1776 du Journal de Corberon est en cours d’intégration dans la base ; on remarque à ce propos que des étudiants de Licence et de Maîtrise participent à son enrichissement, à l’université de Nice. La valeur pédagogique de cette proposition ne fait aucun doute ; elle témoigne aussi, vraisemblablement, des moyens dont dispose l’équipe pour mener à bien le processus engagé.
Nous mentionnerons encore les multiples projets en cours :
Correspondance complète de Pierre Bayle ;- Œuvres complètes d’Etienne Bonnot de Condillac ; - Correspondance de Antonio Vallisneri ; - Répertoire scientifique des anciennes abbayes cisterciennes fondées en Europe des origines à la fin de l’Ancien Régime ; - Edition, Pouvoirs et Opinion publique à l’époque moderne ; Inventaire critique de la Correspondance du théologien genevois Jean-Alphonse Turrettini (1671-1737) ; - Inventaire de la correspondance de Jean Henri Samuel Formey, secrétaire de l’Académie royale des sciences et belles-lettres de Berlin (1711-1797) ; - Cartographie des Espaces Relationnels et de circulation du Littéraire au Québec au XIXe siècle ; - Réseaux de sociabilité et correspondances : le rôle des femmes dans la diffusion du savoir et de la culture entre la France et la Nouvelle-France (XVIIe et XVIIIe siècles) ; - Histoire littéraire des femmes : stratégies de légitimation et principes de filiation (1837-1882) ; - Correspondance de la Mission catholique d’Ecosse 1730-1829 ; - Correspondance de Nicolas Prunier de Saint-André, ambassadeur à Venise (1668-1672) ; - Edition bilingue de la Correspondance de Georg Christian Crollius ; - Les francs-maçons des Lumières ; - Le monde de Fabri de Peiresc (1580-1637) ; - Thèses aidées et réalisées avec l’instrumentation Arcane.
Nous renvoyons le lecteur à la consultation du document joint (Pdf) pour prendre connaissance des objectifs respectifs de chacun des travaux cités ainsi que de leur direction scientifique, des moyens de prendre contact ou de consulter les publications liées. On y voit en tous cas, outre le caractère international de l’intérêt suscité par Arcane, la confirmation de la diversité multimédia prise par ces différents travaux. Ce qui souligne, de notre point de vue, que ce type d’outil peut être exploité y compris dans nos disciplines.
Nul prosélytisme dans cette assertion. Mais le souhait d’élargir le cercle des débats trop peu audibles sur ou entre les différentes orientations prises par l’édition électronique, encore trop souvent perçue comme la numérisation, au mieux sur le mode texte, de corpus dans lesquels l’on peut se livrer à des fouilles lexicographiques automatisées.
D’ailleurs, certaines interrogations fondamentales affleurent face à ce type de proposition d’instrumentation. N’est-il pas légitime, par exemple, de s’interroger sur l’impact de la modélisation graphique des relations selon Arcane ? N’y a-t-il pas un risque de réduction schématique qui fige la représentation d’un domaine aussi fluide et complexe que les relations sociales ? Les protagonistes d’Egodoc défendent qu’au contraire la représentation formelle possède une valeur heuristique. Plus intéressant sans doute pour comprendre ce qui sous-tend cette « heuristique », c’est la réflexivité que ces démarches instrumentées peuvent générer. Ainsi, dans l’un des articles consacrés au Journal de Corberon, J.Y. Beaurepaire et D. Taurisson posent l’interrogation suivante : « Ce qui fonde l’existence d’un réseau ? Les protagonistes en ont-ils conscience ? Comment l’éprouver ? Le chercheur ne crée-t-il pas en fait le réseau, sa cohérence et sa logique, en interprétant les informations au prisme de sa propre grille de lecture ? Peut-on en définitive proposer une définition pertinente du réseau ? » Des questions qui confèrent dès lors une propriété de révélateur au dispositif technique : il n’est pas seulement révélateur du réseau relationnel étudié mais peut produire, si l’on veut bien garder cette distance, « un effet loupe » sur la construction opérée par le chercheur.
Il ne nous reste plus qu’à remercier Dominique Taurisson qui nous a cordialement fourni les informations sur les perspectives d’Arcane.
>Réagir à cet article....
---------
[1] deux étudiants de mon Cours de Licence sur les enjeux de la numérisation pour le musée et l’histoire de l’art (2005-2006)
[2] Au moment où cet article a été écrit, ce site n’était pas encore doté de l’interface actuelle ; si la description qui suit, prenant appui sur une première formule, n’y correspond pas totalement, elle permettra néanmoins de pratiquer le site actuel et surtout d’en comprendre les atouts et la finalité
[3] Néologisme proposé par le chercheur hollandais, Jacob Presser, au milieu des années 1960
[4] Il faut souligner qu’il s’agit d’un « web passif » au sens où le livre est uniquement composé de fichiers .html et .gif sans procédure java notoire)
[5] Sociologie, Histoire et Anthropologie des Dynamiques Culturelles, unité mixte du CNRS et de l’EHESS
[6] Cf. Les introductions aux deux recueils d’ego-documents ainsi que les actes du colloque de 2002 déjà évoqué
[7] UMR 5050-CNRS
[8] UMR 5037 CNRS
[9] Ingénieure d’étude au SHADYC
[10] Professeur à l’Université de Nice et chercheur au SHADYC
[11] Cette première version du site a été mise en ligne avec l’URL de revues.org tandis que l’hébergement était assuré par le serveur de l’université Montpellier III.
[12] Fonds conservés à la Bibliothèque d’Avignon comme de nombreux autres documents qui permettent l’étude de Corberon
[13] Ce corpus est traité dans le second prototype plus actuel, sous l’intitulé Le Solitaire
[14] on en trouve les actes presque complets sur le site lui-même

