Actualité - 5 janvier 2021
Préserver les collections d’excellence > lignes directrices (1/2)
Partager cet article
Préserver les collections d’excellence > lignes directrices (1/2)
La préservation numérique : un « angle mort » dans la gestion des données
Que ce soit par l’activité de ses groupes de travail ou par le biais de ses appels à projet, CollEx-Persée encourage la constitution de collections d’objets numériques, qui viennent compléter, enrichir ou documenter les collections d’excellence qu’elles possèdent sur support. Les types de documents concernés sont multiples. Les documents ayant fait l’objet d’une numérisation rétrospective (imprimés, images fixes, images animées parfois) y tiennent la part la plus considérable. Il ne faut cependant pas oublier la part croissante de ressources plus complexes, souvent produites ou recueillies sous forme directement numérique : archives orales, archives institutionnelles ou scientifiques, documents interactifs ou jeux vidéo, captures de sites web… Ces objets, parfois produits par les chercheurs eux-mêmes, représentent des sources essentielles pour la recherche présente et future.
Or, la préservation numérique apparaît à ce jour comme un « angle mort » dans la gestion de ces données. Les solutions à disposition des établissements de l’ESR sont encore insatisfaisantes, très coûteuses, et dans tous les cas inadaptées à la grande masse des objets numériques à préserver. À côté des enjeux scientifiques, les membres de CollEx-Persée reconnaissent ainsi que se posent des questions financières – il paraîtrait économiquement absurde de devoir financer la re-numérisation de documents que l’on aurait perdus – et organisationnelles. Il s’agit de déterminer la responsabilité de chaque acteur suivant le type de document et l’étape dans la chaîne de préservation.
Le GIS s’efforce donc d’engager une démarche de pédagogie et de sensibilisation sur le sujet, d’identifier les besoins et problématiques propres aux établissements et d’initier un dialogue spécifique avec des opérateurs compétents (dont le CINES, la BnF, Huma-Num, les services d’archives publiques…). Au sein de CollEx-Persée, le GT « Préservation numérique » s’efforce de définir avec et pour les membres du réseau, une politique de la chaîne de collecte/production, accès et conservation à long terme, en fonction d’une typologie des données et de l’intérêt effectif d’une préservation.
Questions de sémantique
Les termes ne manquent pas pour désigner le maintien, à long terme, d’un accès aux collections numériques, et ce foisonnement peut parfois nuire à la compréhension de l’objectif recherché. Le terme « archivage » est le plus englobant, dans la mesure où il couvre toutes les étapes de la chaîne documentaire, de la collecte à la préservation voire à la mise à disposition. Il couvre aussi bien les questions relatives aux données, qu’aux métadonnées qui les décrivent.
Le terme de préservation (ou pérennisation) est plus restreint, et concerne plus spécifiquement les mesures visant à maintenir un accès à long terme aux données. Enfin, le terme de conservation numérique, moins employé, insiste sur les similarités entre les méthodes applicables aux documents numériques et aux documents sur support ; mais il est parfois limité à la sphère des opérations techniques, préventives ou curatives.
À ce titre, le GT a préféré le terme « préservation », qui précise mieux son périmètre et son positionnement par rapport à d’autres groupes (notamment le GT numérisation), tout en soulignant qu’il s’intéresse aux enjeux scientifiques, financiers et organisationnels autant qu’aux questions techniques.
Notons cependant que dans les documents du groupe, ces termes pourront être parfois utilisés comme synonymes, dans la mesure où ils se recoupent largement. Ils doivent en revanche être très clairement distingués de termes comme « stockage » et « sauvegarde », qui ne désignent que les opérations de fixation de l’information numérique sur un support matériel.
Relations avec d’autres organismes
L’enjeu de la préservation numérique est depuis longtemps identifié comme une question critique pour les institutions patrimoniales. Divers dispositifs, consortiums, ou groupes de travail ont été constitué, en France et à l’international, pour aborder ces sujets, sous des angles d’approche variés. Des normes se sont imposées, comme l’OAIS (modèle conceptuel destiné à la gestion, à l’archivage et à la préservation à long terme de documents numériques) et la NF 42-013 (Recommandations et exigences sur l’archivage électronique).
C’est sans doute dans le domaine de la technique qu’il existe le plus grand nombre d’initiatives, et même de conférences dédiées (par exemple, iPRES). Au niveau national, l’organisme de référence est l’association Aristote et son groupe PIN, qui réunit les plus grands acteurs du domaines (BnF, CINES, SIAF, Huma-Num, CNES…). Les travaux de sa cellule « formats » cherchent par exemple à référencer les formats utilisés par les institutions publiques, à étudier leurs caractéristiques et à référencer leurs outils de conservation.
Par ailleurs, des instances peuvent être dédiées à un type d’objet numérique particulier. Pour les archives des établissements de l’ESR, la section Aurore de l’Association des Archivistes Français regroupe les « archivistes des universités, des rectorats, des organismes de recherche et mouvements étudiants ». On peut aussi citer le COSO, dont le collège « données » peut s’intéresser à l’accès à long terme aux données de la recherche.
L’objectif du GT est d’harmoniser ses travaux avec ceux des organismes existants.
#GTPréservationNumérique
Partager l'événement