La GEIDE COLD : techniques et applications
COLD : technology and applications

pour l'exploitation, l'archivage et la consultation de fichiers spools et d'états informatiques

par Philippe Hamon - © 1995 MOSARCA


Non ! GEIDE COLD n'est pas un terme qui désigne des systèmes de gestion et de conservation des documents par congélation ou en surgelés. Le mot COLD, présent dans cette expression, est un terme américain qui signifie Computer Output on Laser Disk en référence à un autre terme anglo-saxon COM, Computer Output on Microfilm, utilisé aux Etats-Unis dans le métier de la micrographie.


La ications de gestion électronique de documents spécialisées dans le stockage et l'archivage de données informatiques sur disque optique numérique ou supports équivalents. On entend par données informatiques toutes sortes d'informations produites par des applications sous forme d'états, de documents respectant un certain formalisme ou d'enregistrements.

En général, sont concernés par la GEIDE COLD :

- les états comptables (balances, journaux, grand livre);

- les documents commerciaux (factures clients, bons de livraison, commandes...);

- les documents financiers (relevés de compte, échelles d'amortissement,...)

ainsi que les bulletins de salaire, les relevés de transaction...

En fait, la GEIDE COLD est appropriée pour tous les documents qui répondent aux caractéristiques suivantes: des documents enregistrés et disponibles sous un format texte (par opposition à un document de type image, que l'on obtient par numérisation à l'aide d'un scanner), qui respectent un certain formalisme quant à la mise en page et dont la production est périodique ou récurrente.

Historique et positionnement

La GEIDE COLD se positionne, de par ses caractéristiques techniques et de par son coût, comme un complément mais aussi parfois comme un concurrent du microfilm et de la microfiche dans leurs usages traditionnels. Les applications informatiques génèrent un volume croissant de documents en tout genre, qui se présentent très souvent sous la forme d'états et qui sont imprimés soit périodiquement, soit à la demande des utilisateurs.

Cela ne va pas sans poser de problèmes à ces derniers, destinataires de l'information, ainsi qu'aux informaticiens, responsables de la production "on-time" de ces documents. D'un côté, les utilisateurs sont confrontés à des documents de plusieurs dizaines ou centaines de pages, difficiles à manipuler et au sein desquelles rien n'est plus fastidieux que de retrouver la ligne d'information souhaitée. D'un autre, ils ont des difficultés pour conserver et diffuser ces documents. Une armoire est vite remplie par des dizaines de journaux comptables ou par des milliers de bulletins de salaire. Ne parlons pas du coût des innombrables photocopies qui sont faites et refaites plusieurs fois par mois.

Pour l'utilisateur, la solution de facilité est bien souvent de demander au service informatique de lui donner la possibilité de sortir ces documents à la demande. Mais dans ce cas, outre le coût d'édition, se pose pour l'informatique le problème du stockage sur le moyen ou le long terme des informations et surtout, celui du temps machine mobilisé pour retraiter toutes ces données en vue de réimprimer les documents.

La micrographie, technique basée sur le principe de la photographie, a été la première solution qui a permis de résoudre une partie de ces problèmes. Depuis plusieurs dizaines d'années, elle permet de stocker sur le long terme les données sous une forme structurée, qui correspond visuellement au document auquel l'utilisateur est habitué. Par ailleurs, elle permet de réduire l'espace de stockage, décharge le système informatique de la conservation des données et lui évite d'avoir à retraiter des informations anciennes. Néanmoins, la micrographie nécessite bien souvent de faire appel à un prestataire de services extérieur, à moins d'investir un budget très important dans un système de microfilmage. Par ailleurs, elle réclame des matériels spécifiques (lecteur/reproducteur) et ne propose pas de fonctions de "localisation" et de diffusion de l'information très performantes malgré l'apparition de systèmes de RAO (Recherche Assistée par Ordinateur), qui restent limités et coûteux.

La GEIDE COLD, apparue au début des années 1980 aux Etats-Unis, dispose aujourd'hui de plus d'atouts et répond en tout point à la problématique posée, grâce à la micro-informatique, aux réseaux locaux, aux serveurs en tout genre et aux technologies de stockage optique. Ses principaux avantages par rapport à la micrographie sont de conserver les données sous une forme numérique et de les restituer à la demande grâce à des techniques de recherche et de diffusion incomparablement plus efficaces que celles de la micrographie.

Par ailleurs, un système de GEIDE COLD est le plus souvent basé sur une architecture informatique banalisée (micro-ordinateurs, réseaux locaux) et ne nécessite pas de matériels spécifiques. L'utilisateur peut utiliser son poste de travail de tous les jours pour accéder aux documents, reprendre tout ou partie du contenu de ceux-ci pour l'intégrer à un courrier ou à un rapport, les envoyer par messagerie électronique à un collègue ou par fax à un client... Et tout cela sans quitter son bureau ni son clavier ! Ce type de solution est plus facile et moins coûteux à mettre en place dans l'entreprise, ce qui évite parfois le recours à un prestataire de services. De plus, le fait que la GEIDE COLD soit entièrement basée sur des techniques informatiques rend le processus de classement automatisable à 100%, ce qui a pour effet de diminuer d'autant les problèmes d'exploitation.

Les grands principes de fonctionnement de la GEIDE COLD

Ce qui caractérise bien spécifiquement la GEIDE COLD est que l'on peut stocker et indexer les documents de manière automatique sans avoir à faire appel à un opérateur. C'est un atout de taille car les utilisateurs n'ont plus à se soucier de la partie fastidieuse qu'est le classement et l'indexation pour ne plus voir que la partie avantageuse du système, à savoir la consultation. Par ailleurs, la base de documents s'enrichit d'autant plus vite qu'il est possible d'envisager des reprises de passifs à moindre coût (si les données sont conservées sous une forme informatique). Le processus de classement se déroule en plusieurs phases. Souvent, il fonctionne en mode batch et se déclenche dans le cadre d'un processus automatique (démarrage à une heure fixée ou en fonction d'un événement quelconque défini par le système, par exemple la mise à disposition des données à archiver). Il est fréquent que ces processus tournent la nuit.

Le système doit en premier lieu récupérer les fichiers de données qui sont généralement des fichiers spools. Il existe plusieurs manières d'intercepter ou de transférer ces fichiers et elles dépendent en grande partie des systèmes d'exploitation utilisés. Les données peuvent être fournies au système sur cartouches, bandes ou par transfert de fichiers. Une fois cette opération terminée, le système doit reconnaître le format des données afin d'en analyser le contenu pour pouvoir le manipuler par la suite, notamment en ce qui concerne la visualisation et l'impression. En effet, les fichiers spools ou fichiers d'édition ont des formats bien précis qui dépendent du système informatique qui les a produit et de l'imprimante à qui ils sont destinés. Ils intègrent le plus souvent des codes spéciaux qui sont utilisés par les imprimantes pour la mise en page des documents (saut de ligne, changement de police de caractères, positionnement de texte, attribut des caractères...).

Le système de GEIDE prend donc en compte ces différentes caractéristiques afin de faire la distinction entre le contenu du document et les informations de mise en page. A partir de cet instant, en fonction des fichiers spools traités, le système doit considérer le fichier comme un seul document (cas d'une balance ou d'un grand livre) ou le découper en plusieurs documents d'une ou plusieurs pages (cas d'un spool de factures ou de bulletins de salaire). Chaque document est ensuite stocké et indexé en fonction de son contenu. Les informations servant à l'indexation sont directement extraites du document en utilisant plusieurs techniques. Une des plus simples est de considérer leurs positions dans le document sous la forme d'une ligne, d'une colonne, d'une largeur. Des techniques plus compliquées consistent à faire une analyse sémantique du document pour déterminer la position des informations qui serviront à l'indexation. Il est aussi possible d'envisager une indexation en texte intégral de chaque page mais cette technique est assez peu utilisée dans le cas de la GEIDE COLD, qui traite le plus souvent des documents structurés.

Des possibilités de stockage et de gestion sur de nombreux supports, y compris le CD-WORM

En général, les données sont compressées avant le stockage qui se fait, soit directement sur disque optique numérique, soit sur une mémoire disque dur utilisée en tampon pour des questions de performances. Certains systèmes copient les données archivées en double sur un autre support qui peut être immédiatement stocké dans un endroit sécurisé.

Il faut noter que les applications COLD sont peu gourmandes en capacité de stockage par rapport à des applications de GEIDE traitant des images numérisées. Les documents traités étant de type texte, il n'est pas rare de pouvoir stocker 800.000 à 1.000.000 de pages dans moins d'un giga-octet. En ce qui concerne les périphériques de stockage, ce sont souvent des unités de disques optiques non ré-inscriptibles (lecteur ou juke-box) et on note l'utilisation croissante du CD-R, de plus en plus présent dans les applications d'archivage. A ce sujet, il est bon de souligner que de nombreux prestataires de service en micrographie se sont tournés depuis plusieurs mois vers la GEIDE COLD et ont ajouté ce type de prestations à leurs catalogues. Dans ce cadre, ils choisissent le plus souvent le CD-R comme support.

Sur le plan de la recherche de l'information, les systèmes de GEIDE COLD offrent de nombreuses fonctionnalités. On accède aux documents en utilisant des techniques d'interrogation multi-critères ou des requêtes de type SQL. Les programmes de consultation sont souvent très conviviaux et permettent à n'importe quel utilisateur d'apprendre à faire ses recherches en quelques heures seulement. La recherche ne se borne généralement pas à l'accès aux documents mais permet aussi de localiser de manière très précise l'information contenue dans les documents. Par exemple, en utilisant des techniques de recherche en texte libre dans des colonnes, il est possible de retrouver une écriture comptable en particulier par son libellé ou son montant sans l'avoir au préalable indexée et ce, parmi des centaines de milliers d'écritures.

Très souvent, les programmes de consultation fonctionnent sur des micro-ordinateurs connectés au serveur de documents (il existe aussi des applications qui fonctionnent en autonome sur un seul poste) et tirent le meilleur parti d'interfaces graphiques telles que Windows. Notamment, de nombreux produits de GEIDE COLD assurent la gestion de fond de pages électroniques, c'est-à-dire offrent la possibilité de mixer les données provenant des fichiers à archiver et l'image d'un pré-imprimé, créant ainsi à l'écran et sur l'imprimante la notion d'édition sur papier pré-imprimé. Sans compter le confort de visualisation qu'elle procure, cette technique évite à l'utilisateur de charger un papier particulier dans l'imprimante en fonction du document à éditer et surtout évite de conserver des stocks de pré-imprimés, d'autant plus lourds à gérer que ces imprimés peuvent changer de présentation au fil des ans.

Restitution d'un document avec un fond de page

Ces documents peuvent bien entendu être consultés à l'écran ou imprimés mais aussi télécopiés, envoyés par messagerie électronique, intégrés dans un traitement de texte ou un tableur. De même, l'utilisateur peut utiliser des fonctions de post-it électronique, d'annotation ou de mise en valeur de certaines parties du document. Bref, un temps considérable de gagner sur des opérations qui n'auraient pu se faire simplement et rapidement avec un autre système.

La GEIDE COLD est l'application de Gestion Electronique de Documents la plus installée dans le monde. Elle l'était d'ailleurs avant que l'on invente le terme de GED, à plus forte raison de GEIDE. Son succès s'explique principalement par trois raisons. Elle est peu coûteuse et permet un retour sur investissement très court. Elle n'oblige pas à modifier les processus de fonctionnement de l'entreprise puisqu'elle ne fait que remplacer un outil d'archivage par un autre plus performant et moins contraignant. Enfin, elle permet de traiter automatiquement le processus de classement et délivre l'utilisateur de cette tâche ingrate, ce qu'il apprécie en général au plus haut point de même que le gain de temps pour accéder aux documents et les diffuser. D'une façon générale, c'est le service rendu aux utilisateurs, aux clients ou aux usagers qui gagne en qualité. Gageons que la GEIDE en général fera son entrée dans les entreprises et les administrations par le biais des applications COLD.

par Philippe Hamon - directeur général de la société Docubase et président de l'APROGED, l'association des professionnels français de la Gestion Electronique de documents.

(c) 1995 MOSARCA - Tous droits réservés

Cet article a été publié dans le magazine MOS 138 octobre 1995