View in

English

Éthique, ouvert et non commercial : le projet « Open Web Search » a été conçu en vue d’offrir à l’Europe la meilleure option pour remplacer les autres moteurs de recherche

Le CERN a récemment accueilli le cinquième colloque international sur la recherche web ouverte (« International Open Search »), où plus de cent spécialistes ont discuté de la façon de rendre les recherches sur le web plus équitables et plus sûres

|

satellite image of Europe with the OWS logo

(Image: openwebsearch.eu / using images by NASA, Unsplash (christopher-burns-dzejyfCAzIA-unsplash), OpenClipart-Vectors from Pixabay (1293096))

En octobre 2023, le CERN a accueilli le cinquième colloque international sur la recherche web ouverte (« International Open Search »). Étaient présents plus de cent spécialistes, dont des représentants de 60 instituts et universités, ainsi que des représentants de l’industrie et des décideurs politiques, qui se sont rassemblés pour discuter de la façon de rendre les recherches sur le web équitables, sûres et plus neutres dans toute l’Europe. Ce colloque était le dernier événement organisé dans le cadre d’un projet qui, à la suite d’un atelier tenu en 2017, à Munich, a pris corps au fil des ans. Intitulé « Open Web Search », le projet a été lancé par un groupe de 14 partenaires du monde la recherche afin de favoriser la souveraineté numérique de l’Europe et de promouvoir un moteur de recherche ouvert et centré sur l’humain.

« Au niveau mondial, la recherche sur le web est entre les mains de cinq acteurs, explique Andreas Wagner, membre du département IT du CERN, participant au projet. Le rôle du CERN dans le projet “Open Web Search” est de diriger la conception et le déploiement des infrastructures de données distribuées nécessaires au projet. »

Indexer la quantité gigantesque d’informations actuellement disponibles sur internet est une entreprise titanesque, et le faire en évitant les biais ajoute un degré de difficulté supplémentaire. « Avec nos partenaires, nous avons simplement commencé par discuter des différentes manières possibles d’établir un nouveau système d’indexation qui soit neutre, poursuit Andreas. Bien que le système soit encore à un stade préliminaire, l’utiliser au CERN sur nos propres pages web s’est révélé très utile car cela nous a permis d’apprendre des choses très importantes sur notre propre moteur de recherche interne. En d’autres termes, le projet permettra également au CERN d’améliorer les capacités de son propre moteur de recherche et de mettre à disposition une fonction de recherche fondée sur la science ouverte dans de nombreux répertoires d’informations du CERN. »

Pour bâtir un nouveau moteur de recherche, il faut d’abord créer un bot qui va télécharger l’ensemble du contenu des pages web. On lance ensuite un algorithme sur les pages téléchargées afin de constituer l’index proprement dit. Si l’index comporte des biais, cela peut mettre en avant certaines pages et réduire la visibilité d’autres.

« Indexer, cela revient en quelque sorte à prendre une photo du monde numérique, si bien que les droits d’auteur et les questions d’ordre juridique et éthique entrent aussi en jeu », indique Andreas. La dimension éthique est au cœur de tout le projet « Open Web Search ». Les moteurs de recherche actuellement disponibles présentent à l’utilisateur une liste de résultats sélectionnés selon un algorithme personnalisé qui oriente tout le processus. « Tout est conçu pour satisfaire l’utilisateur, donc seule une partie des documents pertinents est montrée, confirme Andreas. Les moteurs de recherche commerciaux utilisent des techniques de profilage afin d’apporter des résultats sur mesure, ce qui pose des problèmes sur le plan de l’éthique et de la vie privée. »

Pour que les nouveaux algorithmes soient neutres et transparents, l’équipe envisage des solutions qui ne soient pas fondées sur le profilage individuel, mais qui prennent en compte le comportement de groupes d’utilisateurs anonymisés pour apporter des résultats pertinents.

« Les moteurs de recherche actuels vous arrêtent délibérément sur telle ou telle page et font en sorte de détourner votre attention car cela sert leurs intérêts commerciaux, poursuit Andreas. Notre but est d’emmener l’utilisateur directement à sa destination d’une manière équitable, efficace et transparente. »


Le projet OpenWebSearch.EU a reçu un financement du programme Horizon 2020 de l’Union européenne pour la recherche et l’innovation (accord de subvention n° 101070014).