@SURTITRE:ENQUETE

@TITRE:L'archivage, un sous-produit des applications

@CHAPO:Toutes les entreprises archivent à partir de leurs bases de données, mais sans se doter d'outils spécialisés.

@TEXTE:A une exception près, les 127 entreprises interrogées pour notre enquête ont mis en place un archivage à long terme de leurs documents numériques.

@INTER:Toute entreprise archive ses données

@TEXTE:La durée de conservation dépend du type d'applications. Pour la gestion, elle est fixée à dix ans ou plus dans la moitié des entreprises et à trois ans seulement dans 18% des cas. Une petite minorité (2%) pousse jusqu'à trente ans. Il faut donc en déduire que les archives obligatoires relatives au personnel restent sur papier. Cette solution est d'ailleurs raisonnable, puisqu'il suffit pratiquement de conserver le duplicata des feuilles de paie : un archivage facile, peu volumineux et facilement réutilisable en cas de besoin (contestation, contrôle).

Les applications techniques bénéficient plus rarement d'un archivage à long terme: dix pour cent des réponses conservent leurs données dix ans, cinq pour cent cinq ans. A noter tout de même que trois pour cent poussent jusqu'à trente ans, pourcentage non négligeable car cette durée ne se justifie que rarement.

Une entreprise sur cinq dispose d'un archivage documentaire, s'étendant sur trois ans, dix ans ou plus. Toutes ont mis en place un plan d'archivage. La plupart tu temps au cours des années 80 ou plus tôt, les autres plus récemment. 5% seulement des répondants n'ont pas encore pris ces précautions, et pensent le faire seulement dans les cinq années à venir.

@INTER:Sauvegarde plutôt qu'archivage

@TEXTE:On peut s'interroger sur l'efficacité à long terme de cet archivage, car il semble conçu essentiellement comme un prolongement des applications actuelles, à la limite comme une sauvegarde, plutôt que comme un archivage proprement dit, prenant en compte les spécificités du long terme. En effet, à la question "Disposez-vous d'outils informatiques spécialisés dans l'archivage à long terme des documents numériques", la plupart des entreprises répondent en citant des bases de données relationnelles ou classiques. Il faudrait ici affiner les résultats, mais il ne semble pas qu'un système autonome, indépendant des applications en cours, ait été mis en place.

@INTER:La bande magnétique domine

@TEXTE:La plupart des entreprises utilisent concouramment plusieurs supports d'archivage. Les archives sur bandes magnétiques classiques, gérées manuellement, dominent nettement les autre supports: 70% des entreprises y recourent. Moins nombreuses, mais tout de même bien répandues, les armoires robotisées concernent 8% de notre échantillon.

Les disques magnétiques ou magnéto-optiques jouent un rôle important, au moins comme support intermédiaire en attendant les archivages à très long terme. Ils sont concurrencés par les disquettes, malgré leur capacité modeste. Mais leur facilité d'emploi, de transport et de stockage encouragent à leur utilisation. Elles sont d'ailleurs une solution toute naturelle pour les utilisateurs de micro-ordinateurs.

Reste à savoir dans quelle mesure ces archives magnétiques bénéficient d'une surveillance et d'un entretien régulier. Les auteurs américains citent des cas alarmants de grandes bandothèques laissées pratiquement à l'abandon. Quant aux disquettes, il arrive hélas assez souvent qu'elles ne se laissent pas relire après quelques mois.

Heureusement, disques optiques (14% des réponses) et CD-ROM (10% des réponses) arrivent à la rescousse. Et le microfilm, dans ses diverses formes (cassette de film, microfiche, carte à fenêtre) garde sa place dans un tiers des entreprises! On peut s'interroger sur son avenir à long terme, mais le microfilm apporte encore, et sans doute pour plusieurs années, une solution relativement économique et efficace. Enregistrement et consultation se contentent en effet de machines relativement bon marché.

La sécurité s'obtient dans la moitié des cas par une duplication des archives sur plusieurs sites, soit au sein de l'entreprises, soit sur chez ses prestataires de service. Les règles de sécurité en vigueur dans l'entreprise s'appliquent aux archives (43% des réponses). Deux réponses avouent n'avoir pris aucune disposition de sauvegarde pour ces données.

@INTER:Cinquante giga-octets

@TEXTE:Le volume typique des archives à long terme se situe aux alentours de 50 gigaoctets. 6% seulement des entreprises se situent en dessous d'un giga-octet, 11% dépassent les cent giga-octets. Le chiffre record relevé dans l'enquête atteint 1,2 téra-octets. Ces chiffres n'incluent pas, vraisemblablement, une évaluation en pixels ou en caractères des archives sur microfilm.

Le budget de l'archivage à long terme se compte en quelques pour mille du budget informatique. Il dépasse tout de même 1% dans 15% des cas (Ce ratio élevé tendrait à confirmer une certaine confusion entre archivage et sauvegarde, car normalement, les enjeux du long terme ne devraient conduire à de telles dépenses que dans des entreprises comme l'audio-visuel).

@INTER:Une responsabilité diffuse

@TEXTE:La responsabilité des archivages à long terme reste dans l'ensemble mal définie. 21% seulement des entreprises ont désigné un responsable. Dans la moitié des cas, il appartient au département production/exploitation de l'entreprise. Les autres citent aussi bien les Archives, la Documentation, l'Organisation ou les services généraux. Assez souvent (10% des cas), chaque service utilisateur gère ses propres archives.

Quant aux motivations, l'importance du patrimoine de données pour l'entreprise vient en tête des réponses (37%), suivie des exigences de la clientèle en matière de traçabilité (13%). La crainte du percepteur dans le cadre du contrôle des comptabilités informatisées reste l'exception (trois réponses).@SIGNATURE:P.B.

/////////////ENCADRE QU'ON POURRAIT TRANSFORMER EN NOTE

@ENCADRE TITRE:UNE ENQUETE EXCLUSIVE

@ENCADRE TEXTE:Réalisée par IDG Communications France en mai 1995 à la demande du Monde Informatique, l'enquête a comporté 127 entretiens téléphoniques avec des entreprises françaises. L'échantillon se répartit entre les différents secteurs économiques, avec une forte présente des services (21% banque-assurances, 47% servies non marchands, 36% industrie). Il s'agit d'entreprises moyenne et grandes, disposant de plus d'un ordinateur central et d'un parc micro de 100 à plusieurs centaines de postes.

///////////////

@SURTITRE:ARCHIVAGE A LONG TERME

@TITRE:Durée de vie, exhaustivité, accessibilité coûts... d'indispensables arbitrages

@CHAPO:Pour protéger à long terme son patrimoine informationnel, l'entreprise doit trouver un bon équilibre entre la fiabilité, l'exhaustivité, la facilité d'utilisation et, bien entendu, les coûts.

@TEXTE:La presse scientifique pousse un cri d'alarme. Jeff Rothenberg (Dans le Scientific american de janvier dernier, repris et adapté dans Pour la science de mars), se semande si ses petits-enfants, en 2045, pourront relire le CD-ROM qu'il vient de ranger dans son grenier. Le directeur de la Bibliothèque nationale de France, Jean Favier, s'inquiète lui aussi "une publication réalisée selon les nouvelles technologies a neuf chances sur dix d'être illisible dans vingt ans" (LMI du 2/12/1994).

D'un point de vue strictement technologique, les solutions existent désormais. Le CD-ROM sur verre (voir encadré) nous garantit une durée de vie d'au moins deux siècles. Encore faudra-t-il que nos descendants disposent de lecteurs capables de les lire... et de la documentation nécessaire à leur usage. Il faut dépasser la logique des supports pour construire une logique des systèmes d'archivage. Elle ne se laisse réduire ni à la GED, ni aux outils documentaires (voir article de Charles de Laubier) ni, a fortiori, à la sauvegarde au sens que lui donnent en général les informaticiens, comme le confirme notre enquête.

Il faut se faire une raison: aucun système ne peut conserver toute l'information générée ou acquise par l'entreprise, dans des conditions de fiabilité totale, indéfiniment dans le temps, sans effort par l'utilisateur non spécialiste et pour un coût négligeable. Il faut donc faire des arbitrages au moins sur les points suivants: choix des informations, détail et qualité de présentation, formats de plus ou moins haut niveau, combinaison des différentse formes de sécurité.

@INTER:Quelles informations méritent une conservation "éternelle" ?

@TEXTE:Quelles informations justifient une conservation définitive? Parmi les critères importants, on notera les contraintes légales: trente ans pour les données relatives au personnel par exemple, dix ans au moins pour les architectes. Certains contrats impliquent une conservation quasi-indéfinie, comme les retraites ou les informations nécessaires à la maintence d'installations industrielles ou militaires. Ce choix comporte toujours des hypothèses, plus ou moins contestables, sur les beoins des utilisateurs à long terme. Les professionnels de la documentation et de l'archivage peuvent ici transposer leur expérience et leurs pratiques.

Jusqu'où faut-il aller dans le détail et la qualité de présentation? Les volumes varient de 1 à 1000, sinon plus, selon que l'on se contente des données alphanumériques ou que l'on conserve une image graphique des documents à plus ou moins haute résolution.

@INTER:A quels formats standard se fier?

@TEXTE:Dans quelle mesure faut-il se fier à la durée des formats standards et des logiciels applicatifs qui les exploitent? A moins de conserver les documents sous forme analogique gravée dans le marbre... la numérisation suppose toujours un minimum de codage. Et en général de compression pour gagner de la place. On peut raisonnablement supposer que l'importance des masses documentaires conduira à maintenir longtemps les outils nécessaires à les relire les formats de base, de bas niveau (texte ASCII, bitmaps en BMP ou PCX par exemple).

En revanche, l'efficacité des applications conduit à employer des formats de haut niveau. Il faut donc accompagner les fichiers d'entêtes complexes, ne pouvant être interprétées que par des logiciels évolués. Ils ont l'inconvénient de viser souvent des clientèles réduites, et d'évoluer rapidemnet. Ils ont donc peu de chances d'exister encore dans cinquante ans, voire dans cinq! Les logiciels spécifiques élaborés par l'entreprise, et modifiés constamment pour s'adapter aux besoins des utilisateurs offrent moins de garanties encore. Un archiviste raisonnable transcrira donc ces données sous une forme standard, de lecture plus facile. Les Archives nationales de France, à Fontainebleau, qui ont fait en la matière oeuvre de pionnier, résument leur position en disant qu'il faut "conserver les données, pas les logiciels". Cela peut conduire à des volumes accrus et à un substantiel travail de transcodification au moment du "versement" des fichiers aux fonds d'archives.

Les choix varieront ici suivant l'importance de l'entreprise ou de l'administration. Les plus petites doivent choisir les normes standards les plus répandus, à commencer par ceux du grand public, du fait de leur masse. Les grandes organisations peuvent plus raisonnablement parier sur la puissance et la pérennité de leurs propres standards, et mettre en place les moyens nécessaires à la conservation à long terme des outils d'accès à la documentation. Quant aux Etats et aux instances internationales, ils commencent à assumer leur rôle de "conservatoire" des formats et des logiciels associés. La Bibliothèque nationale de France, en particulier, a élargi aux logiciels le concept de dépôt légal. En revanche, les Archives de France semblent avoir quelque difficulté à prendre la mesure de ces enjeux, malgré la dynamique de l'équipe de Fontainebleau.

@INTER:Durabilité des supports et multiplication des sites d'archivage

@TEXTE:Comment combiner les différents formes de sécurité pour garantir la survie des données à très long terme. Il faut ici combiner deux approches. D'une part le choix de supports aussi durables que possible et la duplication des bases d'archivage sur plusieurs sites géographiquement distincts. De l'autre l'organisation d'une recopie régulière, planifiée. Les fichiers numériques ont ici un avantage considérable sur les supports analogiques: la copie s'effectue avec un taux d'erreur très faible (quelques bits par milliards ou moins encore), alors que toute copie optique ou magnétique d'un support analogique apporte une quantité non négligeable de bruit.

L'organisation de ces reprises régulières aura en outre l'avantage de se combiner avec une mise aux normes de l'ensemble des fonds, allégeant ainsi les contraintes de conservation sur les matériels et les logiciels permettant leur lecture.

@INTER:Organiser l'archivage comme un système

@TEXTE:En parallèle avec le recensement des besoins et les arbitrages techniques, l'entreprise doit concevoir et mettre en place un système complet: matériels, logiciels, équipes formées et responsables. Suivant son importance et ses besoins, ces fonctions seront plus ou moins sous-traitées à des firmes spécialisées. A terme, réseaux locaux et publics à haut débit assureront liaisons entre le système d'archivage et les services utilisateurs (services opérationnels, documentation, informatique). Dans l'immédiat, et notamment pour les phases de reprises des fonds anciens sur papier ou sur microfilm, les transports physiques seront souvent plus économiques. @SIGNATURE:PIERRE BERGER

@ENCADRE TITRE:GARANTI DEUX SIECLES

@ENCADRE TEXTE:Le CD-ROM sur verre mis au point par Digipress est garanti pour 200 ans. Conforme au format le plus répandu (norme ISO 9660) il peut être lu sur tout lecteur grand public ou professionnel. Deux fois plus lourd qu'un modèle classique sur plastique, il offre une plus grande résistance aux températures extrêmes (de -250° à + 550°, contre -150° à + 140°). En prime, il peut tourner à 36 000 tours/minute (contre 4000). La réalisation d'un exemplaire unique est actuellement 2000 F (hors taxes). Le système complet de fabrication revient à environ 8 millions de F, et devient rentable pour les utilisateurs réalisant plus de 8000 disques par an (secteurs de l'audio-visuel essentiellement).

@LEGENDE PHOTO:Préparation d'un CD-ROM sur verre en salle blanche.

//////////////////

@SURTITRE:RICHARD COLLOT, DYNARCHIVE

@TITRE:"L'archivage a besoin de systèmes spécifiques"

@CHAPO:Ni la sauvegarde, ni la GED ne répondent aux exigences propres de l'archivage: il exige des moyens matériels et logiciels spécifiques et une logique applicative adaptée. Partenaire de Digipress (spécialiste des "masters" pour le pressage des CD-ROM), la firme caennaise Dynarchive se consacre à cette spécialité.

@INTERVIEW QUESTION:Pourquoi considérez-vous que l'archivage exige des moyens spécifiques. Les outils de sauvegarde, de documentation ou de GED ne peuvent-ils suffire?

@INTERVIEW REPONSE:RICHARD COLLOT:La GED (gestion électronique de documents) ne s'intéresse pas à la constitution d'une mémoire permanente. Elle traite les documents en liaison avec les applications opérationnelles. Ses technologies, trop évolutives, conduisent le plus souvent à des systèmes fermés. Enfin, elle ne peut pas s'appuyer sur un cadre normatif et conceptuel indispensable à l'archivage définitif.

La documentation se met au service de catégories définies d'utilisateurs. Elle doit avant tout leur fournir de l'information rapidement (voire en temps réel) et de manière ergonomique. Mais, à la différence de l'archivage, elle ne donne que peu d'importance à l'exhaustivité et à la valeur juridique.

La sauvegarde, enfin, a pour rôle d'assurer la continuité des applications en cours, qu'il s'agisse des données ou des logiciels d'application ou d'exploitation. Elle doit garantir une restauration aussi rapide que possible des systèmes opérationnels. Mais elle n'a cure, en principe au moins, de la conservation des états antérieurs et du patrimoine informationnel.

@INTERVIEW QUESTION:Quels sont les exigences majeures d'un bon système d'archivage?

@INTERVIEW REPONSE:R.C. Un système d'archivage idéal doit pouvoir fournir, à partir de l'information stockée, une restitution sur un support lisible aussi facilement que possible. Il doit assurer de la meilleure façon la durabilité dans le temps, l'universalité des formats, la flexibilité, la standardisation, le potentiel d'évolution et la valeur légale.

L'archiviste veut obtenir une image au sens perceptuel du terme. Un parchemin numérisé, à la limite. Il souhaite donc débarrasser le fonds d'archives des éléments, rapidement obsolescents, liés aux applications qui ont produit les documents. En particulier, il ne faut surtout pas archiver dans le format des applicatifs, Word par exemple pour le texte. Cela obligerait à constituer un musée de l'informatique avec toutes les versions de tous les logiciels employés. Il faut donc s'appuyer sur des produits et des standards grand public.

INTERVIEW QUESTION: L'informatique peut elle assurer la conservation du patrimoine informationnel?

INTERVIEW REPONSE:R.C. Oui, mais sous certaines conditions. Il faut en effet assure la pérennité des informations, la sécurité et la sûreté du système d'archivage, l'exploitation des archives. Il faut donc mettre en place une organisation matérielle et logicielle adaptée. La logique applicative s'appuiera sur des fichiers d'index et de liens pour retrouver les informations. Elle ne doit pas s'écrire sur les supports d'archivage, mais sur les serveurs du système dédié ou sur ceux des services utilisateurs.

A un poste-clé se situe la station "de production", sous la responsabilité de l'archiviste. Il s'agit non seulement de piloter la gravure des supports définitifs, mais plus encore, au moment du "versement" de traiter l'information à archiver pour la débarrasser de ses aspects temporaires et l'intégrer correctement à la logique de l'archivage.

J'envisage de mettre en place un laboratoire d'essais, pour mettre au point la station de production adaptée à chaque entreprise ou administration. Il faut en effet que les utilisateurs se rendent compte que l'archivage est un métier. Il ne se confond ni avec la documentation, ni avec la GED, ni a fortiori avec l'informatique.

@INTERVIEW QUESTION:Quels types d'activité ressentent le plus le besoin d'un archivage systématique?

@INTERVIEW REPONSE:R.C. Nous distinguons cinq secteurs d'activité particulièrement concernés par l'archivage à long terme: audio, vidéo, administration (en particulier les Archives de France), industriel (CAO-DAO), médical. On pourrait y ajouter les applications militaires.

///////////////

@SURTITRE:ENQUETE

@TITRE:L'archivage, un sous-produit des applications

@CHAPO:Toutes les entreprises archivent à partir de leurs bases de données, mais sans se doter d'outils spécialisés.

@TEXTE:A une exception près, les 127 entreprises interrogées pour notre enquête (*) ont mis en place un archivage à long terme de leurs documents numériques. La durée de conservation dépend du type d'applications. Pour la gestion, elle est fixée à dix ans ou plus dans la moitié des entreprises et à trois ans seulement dans 18% des cas. Une petite minorité (2%) pousse jusqu'à trente ans. Les applications techniques bénéficient plus rarement d'un archivage à long terme: dix pour cent des réponses conservent leurs données dix ans, cinq pour cent cinq ans. Une entreprise sur cinq dispose d'un archivage documentaire, s'étendant sur trois ans, dix ans ou plus.

On peut s'interroger sur l'efficacité à long terme de cet archivage, car il semble conçu essentiellement comme un prolongement des applications actuelles, à la limite comme une sauvegarde, plutôt que comme un archivage proprement dit, prenant en compte les spécificités du long terme.

@INTER:La bande magnétique domine

@TEXTE:La plupart des entreprises utilisent concouramment plusieurs supports d'archivage. Les archives sur bandes magnétiques classiques, gérées manuellement, dominent nettement les autre supports: 70% des entreprises y recourent. Moins nombreuses, mais tout de même bien répandues, les armoires robotisées concernent 8% de notre échantillon. Les disques magnétiques ou magnéto-optiques jouent un rôle important, au moins comme support intermédiaire en attendant les archivages à très long terme. Ils sont concurrencés par les disquettes, malgré leur capacité modeste.

Mais ces supports magnétiques, sensibles à la température, aux champs magnétiques, voire à l'humidité, sont-ils bien surveillées? Heureusement, disques optiques (14% des réponses) et CD-ROM (10% des réponses) arrivent à la rescousse. Et le microfilm, dans ses diverses formes (cassette de film, microfiche, carte à fenêtre) garde sa place dans un tiers des entreprises! La sécurité s'obtient dans la moitié des cas par une duplication des archives sur plusieurs sites, soit au sein de l'entreprises, soit sur chez ses prestataires de service.

@INTER:Cinquante giga-octets

@TEXTE:Le volume typique des archives à long terme se situe aux alentours de 50 gigaoctets. 6% seulement des entreprises se situent en dessous d'un giga-octet, 11% dépassent les cent giga-octets. Le chiffre record relevé dans l'enquête atteint 1,2 téra-octets.

Le budget de l'archivage à long terme se compte en quelques pour mille du budget informatique. Il dépasse tout de même 1% dans 15% des cas

La responsabilité des archivages à long terme reste dans l'ensemble mal définie. 21% seulement des entreprises ont désigné un responsable. Dans la moitié des cas, il appartient au département production/exploitation de l'entreprise. Les autres citent aussi bien les Archives, la Documentation, l'Organisation ou les services généraux. Assez souvent (10% des cas), chaque service utilisateur gère ses propres archives. @SIGNATURE:P.B.

@NOTE:(*) Réalisée par IDG Communications France en mai 1995 à la demande du Monde Informatique, l'enquête a comporté 127 entretiens téléphoniques avec des entreprises françaises. L'échantillon se répartit entre les différents secteurs économiques, avec une forte présente des services (21% banque-assurances, 47% servies non marchands, 36% industrie). Il s'agit d'entreprises moyenne et grandes, disposant de plus d'un ordinateur central et d'un parc micro de 100 à plusieurs centaines de postes.