Appel à contribution pour corriger les bugs de la presse suisse numérisée

La numérisation de certains anciens journaux papiers n'est toujours parfaite. [Bibliothèque nationale]
La Bibliothèque nationale a besoin de votre aide! / Médialogues / 20 min. / le 26 octobre 2019
Durant tout le mois de novembre, la Bibliothèque nationale suisse propose une opération de production participative ou crowdsourcing. L'objectif est d’améliorer l’indexation du portail d’accès à la presse suisse numérisée.

La plateforme www.e-npa.ch donne accès à environ 110 titres de la presse suisse sous forme numérisée, soit actuellement près de 5 millions de pages en ligne et accessibles gratuitement.

Le public peut y faire par exemple des recherches par mots-clés, grâce à un logiciel de reconnaissance de caractères. "C'est là le problème pour lequel nous lançons cette campagne de crowdsourcing ou production participative", explique la cheffe de la section Utilisation de la Bibliothèque nationale suisse Liliane Regamey samedi dans l'émission Médialogues.

Impossible de contrôler les résultats

Car, au moment de la numérisation, certaines coquilles se sont glissées entre la version papier et la version numérisée des journaux. "Nous utilisons des logiciels de reconnaissance de caractères qui fonctionnent entièrement automatiquement et nous ne contrôlons pas les résultats, c'est matériellement impossible compte-tenu du nombre de pages", souligne Liliane Regamey.

"On met en ligne quelque chose d'assez bonne qualité, mais qui comporte des erreurs par rapport à l'original - qui est souvent d'assez mauvaise qualité. Le papier journal se dégrade vite, jaunit, il a quelquefois des taches... Donc le caractère n'est pas bien reconnu et on ne peut pas retrouver ensuite le mot en question. Si par exemple vous cherchez le terme 'suffrage féminin' et que le système a reconnu le mot 'suffrage' avec un seul 'f' et un astérisque parce qu'il n'a pas reconnu le 2e 'f', vous n'allez pas avoir cet article-là dans vos résultats lors d'une recherche. En revanche, lorsque quelqu'un aura corrigé le terme, cet article va s'ajouter à votre liste de résultats et donc permettre une meilleure exhaustivité de votre recherche."

Opération autour du suffrage féminin

L’opération commence le 1er novembre et durera un mois, avec comme thématique retenue le suffrage féminin, à l'occasion des 60 ans de la première votation populaire sur le suffrage féminin en 1959 mais aussi - relève Liliane Regamey - "parce 2019 est un peu l'année de la femme, avec la grève du 14 juin, avec la montée en force des femmes lors des dernières élections."

Un guide succinct d’utilisation en vidéo accompagne le projet. Un classement des contributrices et contributeurs les plus actifs sera établi en temps réel. Les meilleurs d'entre eux pourront bénéficier d’une visite gratuite personnalisée de la Bibliothèque nationale suisse.

Propos recueillis par Antoine Droux

Réalisation web: Olivier Angehrn

Publié Modifié

La fin des fameux microfilms

La Bibliothèque nationale n'a abandonné définitivement le support des microfilms au profit du numérique qu'en 2018 pour l'archivage de la presse suisse.

S'ils les premiers ont perduré aussi longtemps, c'était en raison des incertitudes autour de l'archivage à long terme sur des supports électroniques, alors qu'un microfilm est censé durer 500 ans.

"Cela fait une quinzaine d'années que l'on numérise", rappelle cependant Liliane Regamey. "Il y a aussi une question de budget, il faut faire des choix. On a fait le choix du numérique puisque c'est cette méthode-là qui permet de donner accès facilement à ce matériel."