Les textes électroniques

Jean-Didier Wagneur
Bibliothèque nationale de France
Gallica
jean-didier.wagneur@bnf.fr




retour

Site de référence : http://gallica.bnf.fr

Gallica a été mis en réseau en octobre 1997. L'enjeu était d'évaluer les capacités du réseau à supporter la consultation des ouvrages en mode image ainsi que les usages du fonds numérisé. On présente souvent rapidement Gallica comme une base sur le XIXe siècle francophone. Mais dans sa version actuelle, ce n'est qu'un échantillon des fonds numérisés de la BnF, représentatif des différents types de documents proposés, monographies, périodiques, images fixes. Pour ce faire, nous avons utilisé les premiers ouvrages disponibles avec trois fortes contraintes. Les documents devaient relever du domaine public, être acceptés à l'issue du contrôle qualité et enfin être catalogués. Le site est donc ouvert depuis cette date, et propose environ 2 300 textes en mode image, 300 monographies en mode texte qui proviennent de la base Frantext du CNRS (http://www.ciril.fr/INALF/inalf.presentation/frantext.htm), et 7 000 images des fonds de la BnF mais aussi des collections de la Maison de Pierre Loti, de l'École Nationale des Ponts et Chaussées et de la Bibliothèque du Musée de l'Homme.

L'objectif était de créer une bibliothèque numérique multimédia et non un serveur de fichiers. Aussi le c¦ur de Gallica est-il d'abord son catalogue qui provient de la base bibliographique BN-OPALE et est édité au format HTML.

Simultanément, nous voulions étudier d'autres mode d'accès permettant à des publics les plus divers de s'approprier Gallica et de naviguer parmi ses ressources. La première approche consista à utiliser les extraits significatifs des ouvrages. Après repérage des tables des matières, nous les avons fait saisir en mode texte. Elles accompagnent simultanément le document en mode image et permettent de naviguer plus rapidement dans celui-ci. Interrogeables globalement, elles viennent compléter le catalogue tant pour les imprimés que pour les images. Cet accès par les tables des matières s'est imposé pour des raisons techniques : en offrant la possibilité de ne télécharger que les pages nécessaires, et pour une meilleure navigation dans de vastes ensembles documentaires comme les périodiques, ou les fonds iconographiques. Ainsi est-il possible dans Gallica de rechercher un concept, un article ou un auteur très rapidement dans la Revue des Deux Mondes, dans les Annales de l'École des Chartes ou dans le fonds Atget. Aux tables des matières viennent s'ajouter d'autres pages. Une chronologie permet de resituer les oeuvres dans leur contexte historique et culturel. Une page domaine permet d'avoir une vue d'ensemble sur les disciplines et les sujets présents sur le site. Enfin des listes d'auteurs et de périodiques permettent un accès rapide. Toutes ces pages répondent à des objectifs et des temps de consultation différents, ce que les lecteurs ont bien compris vu la diversité de leurs parcours dans Gallica.

De même, nous avons accompagné Gallica de textes introductifs en Histoire, Politique, Droit, Économie, Sciences sociales, Littérature, Philosophie et Histoire des sciences, ainsi que pour les quatre collections qui représentaient un bel échantillon de l'iconothèque numérique : Eugène Atget, Pierre Loti, l'École nationale des Ponts et Chaussées et le Musée de l'Homme. Ces textes introductifs permettent aussi d'indiquer au lecteur l'existence d'autres ressources documentaires sur Internet.

La conjugaison de ces différents modes permet aux lecteurs de naviguer plus aisément à l'intérieur des ressources de Gallica. Depuis octobre 1997, nous en sommes à environ 100 000 connexions; 800 personnes consultent le site chaque jour.

Ce qui nous paraît important, c'est que les utilisateurs nous fassent part de leurs voeux concernant le fonds, les fonctionnalités et nous communiquent les difficultés qu'ils peuvent rencontrer dans la consultation. Sur le site nous avons créé une page « Vos réactions » spécialement à cet effet. Les messages sont dépouillés tous les mois. Les voeux des lecteurs vont influencer de manière significative le contenu du futur Gallica. On a noté que nombre de lecteurs recherchaient des ouvrages de type encyclopédique, des dictionnaires, des biographies. On étudie la mise en ligne de la Bibliographie de la France.

Nous préparons en ce moment la mise à jour de Gallica pour octobre 1998. Il y aura un million de pages supplémentaires, du son et de nouveaux fonds d'images fixes. A plus longue échéance, Gallica accueillera toutes les ressources numérisées de la BnF relevant du domaine public.

Quelques mots sur le fonds numérisé des imprimés (87.000 volumes) pour terminer. Le fonds a été constitué de manière à offrir l'image d'une bibliothèque patrimoniale et encyclopédique. On pourrait la représenter par l'image d'une cible.

Le premier cercle, contient les auteurs classiques, disponibles dans plusieurs éditions. Le deuxième, rassemble les auteurs secondaires, les minores très souvent étudiés par la recherche. Le troisième et dernier cercle nous a été inspiré par la bibliothèque Warburg. C'est une bibliothèque seiziémiste et dix-septièmiste qui a mis en libre accès dans sa salle de lecture, les usuels de ces époques, pour permettre aux chercheurs d'accéder aux mêmes ressources bibliographiques que celles qu'utilisaient Montaigne ou Raymond Lulle. Pour le fonds on a tenté de faire de même et à chaque fois que cela était possible de numériser des outils historiques, biographiques et linguistiques.

Enfin, de façon transversale, un fonds de périodiques tente de donner le maximum de cohérence à cet ensemble. Ces revues qui ont pour fonction d'offrir des états de la recherche dans toutes les disciplines, réunissent à la fois écrivains classiques et écrivains secondaires et "cimentent" le fonds.

Aussi Gallica n'est-il qu'une pièce d'un puzzle plus important. Le fonds des imprimés numérisés consultable sur le site donnera accès à 40 000 documents provenant de la librairie ou de l'Antiquariat et à 60 000 microformes provenant en grande partie de la Bibliothèque nationale, sélectionnées dans le plan de sauvegarde, ou fabriquées spécialement pour le fonds numérisé.

Pour l'histoire des sciences, domaine dans lequel la BnF n'était pas jusque ici un pôle d'excellence, deux programmes importants avec l'École Polytechnique et la faculté d'Orsay, ont été mis en place pour la fabrication de microformes sur des fonds pour lesquels des historiens des sciences ont apporté leur contribution intellectuelle.

Autre programme encore, celui mené avec la Bibliothèque municipale de Lyon à travers les Pôles Associés de la BnF, qui a pour projet de créer une bibliothèque virtuelle des imprimeurs lyonnais de la Renaissance, dont les fonds sont à la fois conservés à Lyon et à Paris. Ce programme, initié à la demande des seizièmistes sera consultable prochainement.

Mais le fonds numérisé va se développer à l'avenir sous une forme thématique. Plusieurs programmes sont déjà en cours de constitution. Un premier concerne les Voyages en France. Il rassemblera imprimés, manuscrits, images autour d'un grand panorama historique de la France. Un second traitera quant à lui des Voyages en Afrique. Enfin deux autres programmes sont en préparation, l'un avec les Pôles Associés sur les publications des Sociétés Savantes et l'autre sur les Utopies pour l'exposition de la BnF prévue pour l'an 2000.

Question
En ce qui concerne les textes qui sont proposés, en particulier les ouvrages, les revues, je comprends bien que vous ayez eu des contraintes qui vous aient obligés à les mettre en mode image, et peut-être qu'un jour, ça passera en mode texte. Ne pourriez-vous pas, en attendant, mettre les sommaires en mode texte, de manière à ce qu'on puisse accéder à une information plus fine que le document dans son ensemble.

Sur Gallica, tous les sommaires des ouvrages sont disponibles en mode texte. Pour Gallica en octobre 1998, nous offrirons la possibilité de faire des requêtes plein texte dans la base Frantext.


retour

Dernière mise à jour : 15 janvier 1999
Contact : Jean-Didier Wagneur