"Nous n'avons numérisé qu'une petite partie de l'iceberg et nous
n'aurons probablement jamais fini", explique Beth Dulabahn, une des
responsables de cette initiative à la Bibliothèque du Congrès. Quelque 11 millions de documents ont
été numérisés mais cela représente à peine 10% des 134 millions de
livres et documents emmagasinés sur les 853 km d'étagères de
l'immense bibliothèque, créée en 1815.
Droit d'auteur problématique
Pour contourner l'épineuse question des droits d'auteur, la
Bibliothèque a d'abord choisi de ne numériser que les documents
tombés dans le domaine public, souvent publiés avant 1923. Et pour
toucher sur le net un plus large public que les chercheurs, elle a
surtout sélectionné "des objets uniques", des photos, des
manuscrits fameux, des cartes.
Ces collections sont présentées sous différentes vitrines, comme
l'"American Memory" --des dossiers sur l'histoire américaine-- et
le "Global Gateway", où des bibliothèques étrangères, comme la
Bibliothèque nationale de France, sont mises à contribution.
Deux millions de pages lues par jour
Alors que la Bibliothèque du Congrès reçoit près de deux
millions de visiteurs par an dans sa salle de lecture, autant de
pages sont consultées sur son site en un jour. "Donner un accès par
internet est vraiment démocratique. C'est comme une libération qui
fait réagir les utilisateurs avec beaucoup plus d'engagement",
souligne Jeremy Adamson, qui dirige notamment le département
images.
Il raconte par exemple recevoir des emails en retour, corrigeant
les légendes de certaines photographies historiques, comme
récemment le nom de villages russes immortalisés avant la
Révolution de 1917, qui selon des internautes auraient été mal
identifiés.
Dans une petite pièce sombre, la technicienne d'une entreprise
sous-traitante époussette avec minutie une grande gravure, placée à
plat sous une caméra numérique qui prend 15 clichés de l'image pour
l'enregistrer numériquement. Parce que le document est grand et en
couleurs, le processus prend plus de 20 minutes mais d'ordinaire le
rythme d'une journée de travail permet de numériser entre 75 et 200
pages ou documents.
Sites web aussi conservés
Depuis 1994, la Bibliothèque du Congrès a dépensé 160 millions
de dollars pour la numérisation, sans compter 38 millions de
dollars de fonds privés. Des contrats sont conclus avec des
partenaires privés, sans exclusivité.
Google, qui se veut en pointe sur la numérisation de masse, a
aussi mis un pied à la Bibliothèque du Congrès en scannant 5000
livres tombés dans le domaine public et 18'000 documents d'audition
du Congrès.
Parallèlement au transfert des documents du passé sur un support
numérique, la Bibliothèque du Congrès numérise sur un autre front
en s'attachant à conserver des sites du web, alors que les
informations sur le net ont une espérance de vie très courte. Les
élections américaines, les Jeux Olympiques, le cyclone Katrina et
les blogs iraniens sont les quatre premiers chantiers de
préservation du net.
afp/cab
Google inquiète les spécialistes
La numérisation des grandes bibliothèques ne doit pas être monopolisée par un seul groupe comme Google, estime Jean-Claude Guédon, professeur de littérature comparée à l'Université de Montréal et vice-président de la Fédération canadienne des sciences humaines, interrogé par l'AFP.
Quels sont les enjeux de la numérisation des grandes bibliothèques?
Nous sommes dans une grande période de transition, celle qui fait passer une culture d'une assise imprimée à une assise numérisée. C'est l'équivalent du passage à l'imprimerie au XVe siècle. Tout le monde doit s'y mettre.
Des pays qui avancent vite et bien vont occuper une place importante dans le concert international de la culture et vont décider d'un bon nombre d'enjeux pour les siècles à venir. La numérisation est la forme ultime de l'écriture, on ne peut guère simplifier plus qu'en écrivant avec deux signes, un 1 et un 0.
Faut-il avoir peur de Google qui va numériser les livres de nombreuses grandes bibliothèques américaines?
Google peut numériser des dizaines de milliers de livres par mois. Une fois ces textes numérisés en masse, tout le monde pourrait être forcé de chercher ses textes à travers Google.
Comment voulez-vous justifier dans un organisme quelconque le projet de refaire pour un prix plus cher ce qui est déjà disponible par Google? Imaginez toutes les grandes bibliothèques du monde qui auraient leur catalogue contrôlé par une seule compagnie privée. C'est un peu inquiétant.
Ce que fait Google, c'est ce qu'à fait Microsoft sur les ordinateurs en imposant son système d'exploitation.