Actualité - 2 juillet 2021
#FocusProjet : le DIScours encyClOpédique
Partager cet article
#FocusProjet : le DIScours encyClOpédique
L’ouvrage auquel nous nous sommes intéressés dans le cadre du projet soutenu par CollEx-Persée est La Grande Encyclopédie. Inventaire raisonné des sciences, des lettres et des arts par une société de savants et de gens de lettres (désormais LGE) parue entre 1885-1922 en trente-et-un volumes d’environ mille deux-cents pages chacun.
Dans sa préface, l’œuvre est qualifiée « de haute vulgarisation : un grand ouvrage encyclopédique, populaire et cependant au courant des plus récents progrès de la science moderne ». S’inspirant de la classification historique des sciences par A. Comte telle qu’exposée dans son Cours de Philosophie Positive, LGE constitue un maillon essentiel dans la chaîne qui conduit de l’Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers, par une société de gens de Lettres de Diderot et d’Alembert (1751-1772) à nos encyclopédies contemporaines.
Voilà pourquoi notre équipe de linguistes, d’informaticiens, d’historiens et de géographes travaillant sur les changements intervenus dans les discours encyclopédiques entre le XVIIIe s. et nos jours a souhaité, grâce à CollEx-Persée, intégrer cette œuvre dans son corpus d’étude.
Nos principaux objectifs étaient les suivants :
– Rendre disponible au public et à la communauté scientifique une version numérisée, structurée et annotée de l’intégralité de La Grande Encyclopédie. C’est aujourd’hui chose faite puisqu’on trouvera les deux premières versions disponibles sur le serveur NAKALA (https://nakala.fr/10.34847/nkl.74eb1xfd)
– Proposer une chaîne de traitement expérimentale à même de permettre d’encoder en XML-TEI de façon la plus automatisée possible les textes océrisés issus de la BNF. On trouvera là aussi en téléchargement sur l’onglet « Production et résultats » deux outils dont les codes sources sont sous licence libre (BSD-3) pour un traitement séquentiel des textes avant annotation linguistique :
Une interface de visualisation et de correction du contenu des fichiers ALTO issus de la BNF : CHAOUI
Un logiciel permettant de filtrer les scories repérées dans CHAOUI, de corriger l’ordre des blocs de texte, de découper la séquence des pages en articles et d’encoder ces derniers en XML-TEI : SOPRANO
Afin de parvenir à ces résultats, nous avons travaillé en réseau avec les laboratoires et institutions suivantes : la BNF, l’INRIA (équipe ALMAnaCH) et les laboratoires PRAXILING (Montpellier), LITT&ARTS (Grenoble) et LATTICE (Paris)
L’information scientifique et technique (IST) et les préconisations relatives à la science ouverte ont été deux dimensions situées au cœur de notre projet :
- en termes d’accès aux documents scientifiques puisque nous donnons un accès ouvert à diverses versions structurées et annotées de l’ensemble des volumes de LGE ;
- en termes de publications et de productions logicielles liées au projet enfin, puisqu’elles sont toutes visibles et téléchargeables sur le site de notre projet.
Toutes nos publications et communications liées au projet y sont aussi disponibles.
Partager l'événement