Bibliothèque numérique : Google face à l’Europe
Rendre, via Internet, le contenu des bibliothèques accessibles à tous est l’ambition de divers projets. Le plus connu et le plus controversé est Google Books. La Bibliothèque numérique européenne1, lancée en fanfare il y a cinq ans, n’a pas atteint son objectif : être une alternative européenne à Google. Cet échec nous invite à une réflexion sur l’efficacité du discours politique et de l’action européenne.
REPÈRES
Le 15 décembre 2004, Google annonçait son projet Google Books de numérisation de 15 millions de livres en six ans, en partenariat avec les plus importantes bibliothèques américaines. Trois mois plus tard, le président de la Bibliothèque nationale de France (BNF), Jean-Noël Jeanneney, lançait un vibrant plaidoyer en faveur d’une bibliothèque numérique européenne ; Jacques Chirac enfourchait alors ce cheval de bataille et, avec cinq autres chefs d’État (Allemagne, Espagne, Hongrie, Italie, Pologne), écrivait au président de l’Union européenne pour promouvoir le projet. À l’époque, ce projet soulevait un grand enthousiasme et le pouvoir politique y voyait l’occasion de redorer l’image de l’Europe à la suite de l’échec du référendum sur la Constitution en mai 2005.
Cinq ans après son lancement, la Bibliothèque numérique européenne (Europeana) est loin de répondre aux attentes soulevées à sa création. L’écart entre ce projet et celui de Google s’est fortement creusé.
Europeana n’est pas conçue pour rivaliser avec Google Books
Europeana, mise en service le 20 novembre 2008, a eu un démarrage laborieux : le site a été fermé plusieurs semaines car mal dimensionné par rapport au nombre d’accès. La force de Google est justement le nombre de ses serveurs et la rapidité de traitement des requêtes faites. Le site Europeana fonctionne maintenant, mais il se limite à un portail de recherche de documents multimédias (livres et imprimés, manuscrits, fonds photographiques, vidéos…), renvoyant aux sites des bibliothèques de chaque pays, avec des visualisations très diverses. Le document est parfois visible sur Europeana, parfois sur le site de la bibliothèque contributrice, chacune avec un visualiseur différent, ou directement en format d’affichage HTML ou PDF ; trois à quatre clics sont nécessaires pour y accéder.
La sobriété, marque de fabrique de Google
À l’inverse, sur Google Books, la simplicité l’emporte ; Google y applique la recette de son moteur de recherche, afficher une page d’une grande sobriété. On n’y trouve que des livres, tous présentés de la même manière. Europeana est un site magnifique, une médiathèque bling-bling, renvoyant vers de nombreuses bibliothèques ou vidéothèques ; Google Books est une bibliothèque numérique effective et fonctionnelle, où l’on sait quoi trouver. Europeana est un site pour curieux occasionnels, potentiellement nombreux – un site d’agrément ; Google Books est un site d’habitués – un outil de travail. À notre époque d’hypercommunication, il faut livrer un message simple, ce que fait Google. Sans faire l’apologie de Google, on peut néanmoins déplorer le décalage d’avec la réalité des discours politico-médiatiques tenus en France et en Europe : Europeana n’est certainement pas conçue pour rivaliser avec Google Books.
Différents projets, pour Google comme pour les éditeurs
Clarifions un point rarement évoqué par les journalistes ou par Google. Sont à distinguer la numérisation de livres patrimoniaux, libres de droits d’auteur – et la mise en ligne de livres sous droits d’éditeur et d’auteur, qui défraie la chronique judiciaire dans divers pays. Nombre d’éditeurs récusent Google Books, d’autres y participent, avec leurs livres en » aperçu limité « .
Internet et la confiance
Les projets de diffusion de la connaissance sur Internet, bibliothèques ou encyclopédies en ligne, tablent sur la confiance, confiance faite à l’internaute pour démêler le bon grain de l’ivraie, confiance mutuelle entre contributeurs, ou entre contributeurs et lecteurs, sur Wikipédia. Ceux qui agitent ces épouvantails (ordre des résultats de recherche sur Google, qualité des pages de Wikipédia) sont d’une génération qui, n’ayant pas toujours compris ses usages, voit en Internet surtout ses dangers.
La sphère privée a d’ailleurs réagi fort différemment suivant les pays. En France, les éditeurs ont crié au charron et se sont retournés vers les pouvoirs publics pour bénéficier d’un soutien financier à la mise en ligne d’extraits d’ouvrages : à cet effet, la taxe parafiscale sur les photocopieurs-scanners a été augmentée dans une certaine discrétion, fin 2006, dégageant environ 10 millions d’euros supplémentaires par an, gérés par le Centre national du Livre. On trouvera, par exemple, 230 extraits d’ouvrages Gallimard sur Gallica ; et, à nouveau, pour chaque éditeur une visualisation différente.
En Allemagne, pays où l’appel à l’État est limité, le lobby culturel peu prégnant et le monde des bibliothèques moins centralisé, 1 000 éditeurs et libraires se sont regroupés dès 2005 en consortium et ont mis en ligne, avec une visualisation unique, 100 000 ouvrages (voir http://libreka.de).
Y a‑t-il un réel besoin de consulter un ouvrage ancien écrit dans une autre langue ?
Début 2005, Google Books avait été critiqué pour son fameux page ranking (ordre des résultats de recherche) – ainsi la Révolution française y aurait été vue à travers des ouvrages vantant » les vaillants aristocrates britanniques triomphant des jacobins sanguinaires2 « .
Cette crainte est largement infondée – on sait comment fonctionne un moteur de recherche, s’appuyant sur les références les plus consultées. Elle procède d’une diabolisation de l’Internet et d’un manque de confiance en l’internaute : quiconque utilise un moteur ou une bibliothèque numérique effectue, dès le premier clic, un travail de recherche – l’internaute est capable d’analyser lui-même les informations reçues.
Qu’est-ce que le patrimoine européen ?
Sacoche d’un micro-ordinateur, sous forme de livre ancien (Société Twelwe South). |
La France avait, en 2004, une longueur d’avance sur Google et sur les autres pays européens : le site Gallica de la BNF existait depuis cinq ans et cumulait 80 000 ouvrages. On aurait pu capitaliser sur cette avance en lançant, avec le même portage politique fort, une bibliothèque numérique francophone3, développant autour de Gallica les projets de nombreuses bibliothèques (universitaires notamment), en France et dans la francophonie. Une autre option a été choisie, celle d’une bibliothèque européenne : le projet fut long à démarrer, la Commission européenne a attendu que les 24 autres pays se mettent à niveau avant d’organiser laborieusement l’assemblage de ce patrimoine numérique babélien.
Google prévient toute concurrence avec d’autres moteurs de recherche
Mais y a‑t-il un réel besoin de l’internaute à consulter un ouvrage ancien écrit dans une autre langue – sachant que les ouvrages littéraires et scientifiques importants sont généralement traduits ? Un mythique » patrimoine européen » fut souvent évoqué : n’est-ce pas justement ce qu’a numérisé Google en cinq ans, laissant Europeana loin derrière ? Le patrimoine des grandes bibliothèques américaines alliées à Google est justement le patrimoine allemand, anglais, espagnol, français, italien… autrement dit le patrimoine de l’émigration européenne qui a fait les États-Unis. Une bibliothèque numérique bénéficiait en 2005 d’une » fenêtre de tir » avec le soutien politique fort existant à l’époque. Mais la Commission européenne a ralenti le projet en le transformant en médiathèque et non simple bibliothèque d’imprimés ; elle a proclamé le projet prioritaire sans dégager des financements pour la numérisation : ceux-ci restent du ressort de chaque » État membre « .
Coopération ou compétition ?
Même si l’exercice paraît facile a posteriori, demandons-nous ce qui aurait pu être fait à partir de 2005. Dans l’option européenne (répétons qu’elle ne nous paraissait pas la meilleure), on aurait pu mener une négociation commune, par exemple sous l’égide de la Commission européenne, entre l’ensemble des bibliothèques et Google.
Cela aurait fourni le chaînon manquant – le financement de la numérisation – au projet européen. Après la diabolisation de Google, ç’eût été Canossa : mais justement, quelles sont les contreparties que requiert Google en échange de la numérisation gratuite des livres patrimoniaux ? Elles sont connues, car la loi américaine impose à toute structure publique de publier ses contrats. La bibliothèque dispose de ses ouvrages numérisés par Google, qu’elle peut placer sur son site.
Il y a toutefois deux restrictions importantes. D’abord, la bibliothèque ne peut en faire d’usage commercial, car Google se réserve à terme le droit de vente de l’impression de la copie numérique sous forme de livre – se positionnant ainsi sur le marché potentiel du livre numérique à imprimer. Ensuite, Google prévient toute concurrence avec d’autres moteurs de recherche (Bing, Yahoo, AOL…) en spécifiant la non-indexabilité des fichiers du site de la bibliothèque : la bibliothèque numérique de l’université reste invisible à un quelconque moteur de recherche externe – sachant que pour Google l’indexation de la copie du livre sur ses propres serveurs est automatique.
Ainsi, un internaute assidu du site University of California, ou présent dans la bibliothèque et y utilisant l’Intranet, trouvera sans problème les oeuvres numérisées sur le site de cette université ; un autre internaute (99 % des cas) trouvera l’œuvre via Google et la consultera sur Google Books. Nous ne jugeons pas ce que certains en France qualifient de » pacte faustien » des bibliothèques – il s’agit bien de diabolisation, même si elle reste feutrée et littéraire ! – nous nous contentons de fournir des éléments d’analyse. Quant aux bibliothèques qui ont signé avec Google, elles estiment de leur mission que leur patrimoine soit ainsi diffusé, même en dehors de leur site.
La foire à la numérisation
Quaero (latin pour « Je cherche »)
La coexistence en 2005–2006 des deux projets Quaero (moteur de recherche franco-allemand) et BNUE (Bibliothèque numérique européenne), tous les deux dirigés contre Google, apportait une certaine confusion dans l’esprit du grand public, voire de nos décideurs : certains imaginaient que Quaero serait le « moteur » de BNUE. L’ensemble de ces projets (Quaero, BNUE, Géoportail) faisait partie en 2005 d’une stratégie politique au plus haut niveau (voir Wall Street Journal, « Le Google », 4 août 2006).
Concernant Quaero, un bilan d’utilisation des fonds publics serait là aussi utile à dresser.
Depuis 2005, le paysage a profondément changé, comme souvent sur Internet. Microsoft a abandonné MSN Books en mai 2008 ; il reste partenaire d’une bibliothèque numérique, Open Content Alliance, qui ne bénéficie pas de la notoriété de Google. Même du côté de Google, les opportunités pourraient se tarir ; suite aux atermoiements du projet européen et en l’absence d’un projet francophone alternatif, trois bibliothèques francophones d’importance ont contracté avec Google : la Bibliothèque universitaire de Lausanne (Suisse), celle de Gand (Belgique) et la Bibliothèque municipale de Lyon. Elles contiennent une partie importante du patrimoine de langue française.
L’obligation de dépôt légal ne porte en France que sur l’exemplaire papier
Quel intérêt Google aurait-il à numériser un ouvrage déjà numérisé par une autre bibliothèque ? Il y va de la saine gestion de ses fonds. Question duale – qu’une bibliothèque ou des gestionnaires publics pourraient se poser : quel intérêt y a‑t-il à numériser sur fonds publics un ouvrage qu’on peut déjà trouver sur Internet ? Et, en corollaire, qu’est-ce qu’une bibliothèque numérique : un site lié à l’institution (BNF, Bibliothèque de Lyon, etc.), ou une plateforme universelle comme l’est Google Books ?
Ces questions ne sont pas neutres, lorsqu’on parle comme en ce moment de remèdes miracle pour la numérisation du patrimoine, l’appel au » grand emprunt » salvateur, ou la coopération franco-allemande… Cette dernière idée laisse perplexe vu l’échec d’un autre projet informatique franco-allemand, le moteur de recherche Quaero, lui aussi lancé en fanfare en 2005, censé être le moteur de recherche européen rivalisant avec Google, et finalement abandonné par les Allemands.
La bataille des référencements
Dépôt légal sous format numérique ?
Il est un point malheureusement fort peu mentionné dans les débats actuels. Alors que tous les ouvrages existent sous forme numérique chez l’auteur, l’éditeur et l’imprimeur, l’obligation de dépôt légal en France ne porte actuellement que sur l’exemplaire papier. Une loi de 2005 a rendu possible – c’est bien le moins – mais non obligatoire le dépôt légal des fichiers numériques, en complément du livre papier. Que penseront nos petits-enfants dans soixante-dix ans, une fois ces ouvrages libres de droit, quand ils voudront les intégrer dans leur bibliothèque numérique, et ne retrouveront plus chez les éditeurs les fichiers numériques correspondants ?
Il pourrait bien se faire que les positions soient figées pour un certain temps dans la diffusion de la connaissance sur Internet. À Wikipédia les encyclopédies en ligne – Google semble avoir renoncé à développer son encyclopédie Knol. À Google les bibliothèques numériques : la guerre Europeana-Google Books n’aura pas lieu. De nombreux chercheurs, mais aussi de jeunes internautes du type geek, privilégient des références Google Books : la bataille des réfé- rences données par les prescripteurs (par exemple, les contributeurs à Wikipédia) est importante, car elle draine les internautes vers telle ou telle bibliothèque numérique. Europeana est sans doute morte avant d’avoir vécu – elle continuera à engloutir de l’argent européen pour la confection du site, le graphisme, les serveurs – tout sauf la numérisation ; à l’instar de nombreux sites européens, coûteux, esthétiques et à audience limitée, elle attirera quelques internautes comme curiosité mais non comme outil de travail. Gallica, en avance en 2004, reste un bon outil de travail. On peut redouter néanmoins que les postures du monde administrativo-politique, son incompréhension chronique des usages de l’Internet, sa vision baroque et son évocation mystique d’une « exception culturelle », enfin la lourdeur de la surcouche européenne, définie comme prioritaire, n’aient déjà compromis l’avenir de cet outil.
_______________________________
1. BNUE, ou Europeana, www.europeana.eu
2. Jean-Noël Jeanneney, « Quand Google défie l’Europe », Le Monde, 24 janvier 2005.
3. J’avais, dans mon rapport au ministre de la Culture R. Donnedieu de Vabres (avec Valérie Tesnière et Noémie Lesquins, janvier 2006, www.bibnum.net), préconisé cette option (voir aussi Alexandre Moatti, « Pour une bibliothèque numérique francophone », Le Monde, 20 septembre 2007).