vendredi 28 août 2009

A qui profitent réellement les connecteurs OAI ?

Durant la rédaction de mon mémoire ainsi que dans ce blog, j’ai beaucoup parlé des connecteurs OAI et des différents milieux professionnels qui les utilisent. Mais je n’ai pas vraiment pensé à l’utilisateur final, c’est-à-dire au lecteur. En effet, à qui profitent les collectes effectuées via les connecteurs OAI ? Certainement pas aux bibliothèques mais bien évidemment au lectorat de celles-ci. Les bibliothécaires qui « téléchargent » des notices pour les intégrer dans leur catalogue voire en créer un nouveau n’y voient aucune autre utilité.

En ce qui concerne l’utilisateur final, tout cela à un enjeu particulier et bénéfique. En effet, il ne devra plus localiser les documents dont il possède les références car le fichier numérique ou le lien vers l’intégralité de l’article accompagnera ces références et il n’aura qu’à le télécharger afin de le consulter.

Les avis divergent sur l’utilité des connecteurs OAI et des archives ouvertes en bibliothèque publique et universitaire mais nous n’avons même pas pris la peine de nous mettre à la place de l’utilisateur final. Pour lui, c’est une chose extraordinaire que d’avoir directement accès à l’information qu’il cherchait sans devoir se déplacer ailleurs que dans la bibliothèque de sa ville.

Il ne reste plus, qu’à présent, un peu de bonne volonté pour établir une relation équitable entre les données des bibliothèques universitaires et publiques afin de diffuser l’information auprès d’un public aussi large que possible qui, rappelons-le, est l’objectif de toute bibliothèque. Et il faut que chaque participant à l’OAI se rende bien compte de cela et peut-être, assisterons-nous à la naissance de plusieurs catalogues collectifs voire méta-catalogues.

Confusion dans l’utilisation des différents termes

Cet article rejoint un peu le précèdent qui abordait le problème de compréhension entre serveurs OAI et connecteurs OAI. Celui-ci parlera plus de l’utilisation des différents termes qui ont, pourtant, la même signification.

Par exemple, une personne discute des métadonnées contenues dans sa base de données alors que l’interlocuteur se demande de quoi elle parle, alors qu’il suffit d’employer le terme « rubriques » pour tout de suite faire le rapprochement.

Cet exemple a pour but de montrer que notre société aime évoluer avec de nouveaux termes techniques pour faire un peu plus « savant ». Alors que les personnes du métier n’arrivent pas à suivre cette mouvance.

Voici une autre situation à laquelle j’ai dû faire face : lorsque j’ai enquêté auprès des bibliothèques publiques, je parlais d’entrepôt OAI. Lorsque j’en suis venue aux bibliothèques universitaires, une personne interrogée m’a répondu qu’elle ne connaissait pas les entrepôts mais les dépôts institutionnels.

Cela prouve qu’on essaie d’innover dans le vocabulaire technique mais que celui-ci n’est pas encore appliqué voire connu dans le milieu professionnel. Il y a un certain manque de communication au sein des différents services travaillant pour la diffusion de l’information en ce qui concerne les nouvelles technologies.

Qui fait quoi ?

J’ai constaté que la plupart des SIGB s’orientent plus vers l’optique d’être fournisseurs de données que fournisseurs de services. Pourquoi les concepteurs ne mettent-ils pas tout de suite en place les deux fonctions ? Ce paramétrage permettrait aux utilisateurs de se rendre compte de la nécessité de partager des données et par la même occasion, de valoriser leur propre fonds. Je pense que du point de vue de l’utilisateur, la différenciation entre les serveurs OAI ou entrepôts OAI et la collecte voire le moissonnage n’est pas encore claire dans leur esprit. Je crois donc important de vraiment montrer les différences mais aussi le lien qui unit ces deux types de fonctionnalité.

Je trouve dommage qu’il n’y ait pas encore une certaine confiance entre les différents producteurs. J’entends par là, que la plupart des institutions n’ont pas conscience de la qualité des productions, qui sont créées de par le monde, est peut-être équivalente à la leur. Peut-être que cette peur est née du fait des piratages informatiques mais il n’y a aucune raison de s’en faire étant donné que les concepteurs ainsi que les deux types de fournisseurs savent ce qu’ils font.

Bibliothèque publique et bibliothèque universitaire : quels enjeux ?

C'est bien beau de parler des connecteurs mais quels peuvent être les enjeux en bibliothèque publique et bibliothèque universitaire. C'est une question qui revenait souvent soit au fil de mes lectures soit dans mes enquêtes.

Réflexion personnelle

Dans les différentes enquêtes qui ont été menées durant mon travail (articles à venir), je pose toujours la même question : « Pensez-vous que les connecteurs OAI peuvent être utiles tant en bibliothèque universitaire qu’en bibliothèque publique ? ». Les réponses ont été, dans la majorité, « oui » mais toujours accompagné de la mention « tendance bibliothèque universitaire ». Pourtant le doute subsiste avec le « quoique » en fin de phrase. Pourquoi les archives ouvertes ne peuvent-elles pas être utilisées en bibliothèque publique ? Là est toute la question dans laquelle réside mon travail. Pourquoi, si cela n’est pas destiné aux bibliothèques publiques, les concepteurs de logiciels documentaires proposent ou mettent-ils en place des connecteurs OAI dans leur produit ?

Beaucoup de personnes interrogées disent que « oui, cela peut-être intéressant pour les bibliothèques publiques » mais dans quel but et quelles sont les limites ? Car les connecteurs OAI sont un outil « quelconque » dans les bibliothèques universitaires ou spécialisées mais pour les bibliothèques publiques ce sont tout simplement des outils innovateurs ou comme nous les appelons aujourd’hui, des nouvelles technologies.

Qui dit nouvelles technologies dit forcément prix onéreux. Mais pour avoir des outils « convenables », il faut savoir, de nos jours, dépenser un certain budget. Ce n’est pas en utilisant Socrate, le logiciel le moins cher du marché, que l’on arrivera à faire une collecte de données pertinente. En effet, ce n’est pas Socrate qui proposera une fonction « connecteurs OAI ». Mais si au contraire, nous montons un peu plus haut dans la gamme, nous arrivons à Adlib et Vubis Sm@rt. Et là, jackpot, Vubis Sm@rt propose cette fonctionnalité mais malheureusement, cette fonction n’est pas activée dans les produits vendus en Belgique. Pourquoi vendre un produit qui ne fournit pas les mêmes fonctionnalités de bases dans les différents pays ?

De nos jours, on pourrait comparer les SIGB à des voitures. J’entends par là que pour avoir des extras, il faut payer des compléments. J’appelle cela des extras mais je devrais plutôt dire des « options ». Dans l’automobile, nous pouvons avoir l’option « cuir » ou bien l’option « lecteur CD ». Et bien dans le monde des sciences de l’information, c’est à peu près la même chose : « Y a-t-il possibilité d’avoir l’option « connecteurs OAI » en plus du prix de base ? ». Je trouve aberrant que dans un domaine qui se veut « ouvert », nous puissions encore avoir des différences aussi flagrantes. Pourquoi toutes les bibliothèques, selon leur catégorie, n’ont-elles pas le même le logiciel ? Pourquoi une bibliothèque est-elle avantagée par rapport à une autre car elle reçoit plus de subsides ?

Je disserte énormément sur le cas des bibliothèques publiques. Pourquoi ? Parce que les bibliothèques universitaires ne sont pas dans ce cas de figure. En effet, des moyens financiers sont débloqués pour mettre à la disposition du public toute une gamme d’outils tels que les abonnements aux périodiques, à des bases de données spécialisées, etc. Tout cela dans le seul et unique but d’apporter et d’offrir le savoir et la connaissance aux usagers. Les bibliothèques publiques ont exactement la même mission et le même objectif mais malheureusement, pas le même suivi financier. C’est pour cela que les connecteurs OAI peuvent leurs apporter une certaine aide pour aboutir à la réussite de ce projet. Le seul inconvénient est qu’il faut former mais avant tout, informer les bibliothécaires de cette nouvelle fonctionnalité afin qu’ils puissent utiliser voire collecter des données via les connecteurs OAI sans pour autant exagérer dans la quantité mais avoir suffisamment de données pour enrichir au mieux leur catalogue ou bien mieux encore, créer une base de données dédiée à ces collectes.

Les archives ouvertes en Europe

Après avoir discuté sur la littérature spécialisée et l'enrichissement ou la pollution des catalogues, j'aimerai aborder la problématique des archives ouvertes en Europe. En effet, ce système est très bien intégré dans les pays anglo-saxons mais qu'en est-il chez nous?

Voici ce que j'en pense :

Comme dit auparavant, le protocole OAI est beaucoup plus présent dans le monde anglo-saxon. Heureusement, de plus en plus de bibliothèques européennes veulent commencer à travailler avec ce protocole. Mais, on constate que la pression d’un tel changement en Europe vient de beaucoup plus haut.

Lors de la lecture d’un article, je suis tombée sur un passage assez marquant que voici et qui montre d’où vient l’importance voire la nécessité d’avoir l’OAI chez nous : « Les représentants de l’Open Archives Initiative souhaitent une plus grande implication de l’Europe à la fois dans le comité de direction et dans le comité technique de l’OAI ». L’OAI étant une découverte américaine, on pourrait penser que les Etats-Unis veulent faire main basse sur les ressources européennes. Ce n’est pas le cas. Je pense que si l’Europe acceptait d’entrer dans ce système d’ « échanges », il y aurait une avancée extraordinaire au point de vue scientifique mais aussi au point de vue des relations internationales.

Le passage, qui suit, apporte la preuve que les dirigeants de l’OAI font tout pour intégrer les bibliothèques européennes dans leurs systèmes. Les bibliothèques européennes peuvent apporter des « extras » vu l’étendue de l’Union Européenne qui ne fait que s’élargir de jour en jour. C’est pour cela que l’auteur de l’article aborde le sujet de l’organisation LIBER (Ligue des Bibliothèques Européennes de Recherche). Je cite : « LIBER devrait participer au développement de l’OAI en Europe, en élaborant des normes ou des recommandations (…). LIBER peut aussi jouer un rôle de coordinateur technique et fédérateur pour les bibliothèques en Europe, tout en œuvrant pour une diffusion large et rapide de l’OAI ».

On ne s’en rend pas compte mais la mise en place des archives ouvertes est un phénomène spectaculaire qui permettrait à n’importe quelle bibliothèque de créer sa propre base de données. Et je crois que c’est pour cela que les dirigeants de chaque pays européens devraient réfléchir sur la question car, tout comme à l’arrivée d’Internet, nous sommes en face de quelque chose qui peut révolutionner le monde scientifique mais aussi la connaissance au sein de bibliothèques moins importantes telles que les bibliothèques publiques. Je pense que les personnes responsables de la culture, dans chaque pays européens, devraient mettre en place de nouveaux services pour innover dans les différents secteurs culturels.

Et vous, qu'en pensez-vous?

Source des extraits en italique :

L'open archives initiative et la validation des publications scientifiques : un séminaire sur l'OAI à Genève / Schmitt, Jean-Philippe. In : Documentaliste-Sciences de l'information. 2001, vol. 38, n°2, p. 124-126. ISSN 0012-4508

lundi 24 août 2009

Dans la littérature spécialisée

Voici une autre problématique rencontrée lors de l'élaboration de ce travail. En effet, au début de mes recherches, j'ai eu du mal à trouver des articles ou monographies traitant des connecteurs OAI. Finalement, j'ai dû m'orienter vers les archives ouvertes et voir si on abordait la notion des "connecteurs OAI". C'est pourquoi, il me semble important d'aborder cette difficulté pour des personnes voulant en apprendre plus sur ce sujet.

Réflexion personnelle

On aborde de plus en plus le domaine des archives ouvertes sans pour autant parler des connecteurs OAI. En effet, la littérature spécialisée dans les sciences de l’information ne fait que citer les connecteurs OAI sans pour autant entrer dans plus de détails. Pour trouver des articles traitant réellement du sujet, j’ai dû m’orienter vers des descripteurs en anglais. Lors de mes recherches, je me suis rendue compte que les pays anglo-saxons tels que les Etats-Unis ou le Canada ont une longueur d’avance sur nous. J’entends, bien évidemment, par « nous », les pays européens. Ce manque de renseignements dans le monde francophone se confirme grâce à mes enquêtes. En effet, j’ai appris que différentes personnes interrogées avaient commencé des recherches dans le domaine de l’OAI mais qu’elles les avaient abandonnées.

En temps normal, j’utiliserai le terme « moissonneur » vu qu’il s’agit de la traduction littérale du mot en anglais « harvest ». Mais lors de l’utilisation de ce terme, les personnes qui m’entourent pensent tout de suite à l’agriculture. Hors ce n’est pas le cas, c’est pourquoi, il convient mieux d’emprunter l’expression « Connecteurs OAI » au manuel de PMB. Celle-ci me paraît plus correcte étant donné que la collecte est réalisée à l’aide d’une connexion entre le fournisseur de services et le fournisseur de données.

Enrichissement ou pollution des catalogues ?

Voici la partie la plus importante de mon travail de fin d'études : il s'agit bien évidemment des différentes problématiques rencontrées mais celle qui nous intéresse aujourd'hui est "enrichissement ou pollution des catalogues". Les autres questions seront abordées un peu plus tard dans ce blog.

Avant de poursuivre, je souhaite vous avertir qu’il s’agit de mon avis et qu’il peut exister bien d’autres thèses ou réponses contraires ou parallèles à mes propos.

Réflexion personnelle sur le sujet

Voici la question tant attendue : « Les connecteurs OAI dans les SIGB : enrichissement ou pollution des catalogues ? ». Pour répondre à celle-ci, il existe plusieurs solutions et j’ai décidé de me diriger vers un avis partagé. Pourquoi ? La première raison est que je ne possède pas l’expérience du terrain. Ensuite, mon avis peut être tout à fait discuté, c’est pour cela que je trouve ce sujet si intéressant. Il n’y a pas UN avis mais des divergences d’opinions.

A mon avis, il faut bien étudier la question de la mise en place des connecteurs OAI au sein de sa bibliothèque. Pour les bibliothèques publiques, ceux-ci pourraient n’avoir aucune utilité vu que le but principal de ces dernières est de promouvoir la lecture et de fournir l’accès aux connaissances dites « générales ». Ces propos ne signifient pas que les connecteurs OAI ne sont pas les bienvenus en bibliothèque publique. Cependant, il faut que le bibliothécaire se mette en tête qu’il doit les utiliser à bon escient. Une exagération de sa part, lors d’une collecte, pourrait venir « polluer » sa base de données. L’effet négatif, suite à cela, serait une analyse complète et un tri total de la base de données pour la nettoyer.

A ce sujet, PMB offre la possibilité via les connecteurs OAI de collecter dans tous les entrepôts existants. Mais quelque chose me tracasse… Pourquoi PMB qui est, rappelons-le un SIGB, a mis en place cette fonction alors que les données collectées seront toutes « scientifiques » ? PMB n’a pas développé cette fonction suite à une demande de ses clients mais je pencherai plus pour le fait qu’il veut suivre la concurrence. Pourquoi mettre un outil aussi sophistiqué dans un logiciel principalement utilisé dans les bibliothèques scolaires ? Je ne vois pas les bibliothécaires commencer à faire une base de données sur un domaine bien précis alors que le rôle de ces bibliothèques est d’apporter un plus dans la formation des étudiants tout au long de leurs études. Quel « usager » normal irait consulter une base de données contenant des articles scientifiques portant sur des thématiques complexes ? La réponse est « personne » excepté une personne férue dans ce genre de domaines.

Mais il n’y a pas que des aspects négatifs. En effet, une bibliothèque peut décider de réaliser un catalogue collectif dans lequel, chaque bibliothèque participante y intégrerait ces données les plus susceptibles d’intéresser des lecteurs, ou bien la bibliothèque, qui met en place ce projet, n’a plus qu’à « récolter » les données dans chaque base et ainsi créer un catalogue collectif. Ce système permettrait à différentes bibliothèques de mettre en place un réseau bien spécifique.

Venons-en maintenant aux bibliothèques universitaires. Malgré mon avis mitigé, je suis plus du côté de ces dernières. Pourquoi ? Les connecteurs OAI ont une plus grande importance au sein d’universités ou de bibliothèques nationales telles que la BnF. Leur mission est d’offrir, au monde scientifique mais aussi à un public assez large, un accès gratuit à des résultats et articles scientifiques. Cela est vraiment intéressant car les chercheurs ne sont plus obligés de se déplacer pour pouvoir consulter les travaux de leurs confrères étrangers. Au cœur des bibliothèques universitaires, les connecteurs vont permettre de créer une nouvelle base de données ou mieux encore de remodeler plusieurs bases en une seule permettant ainsi à l’usager de ne lancer qu’une fois sa requête. Les archives ouvertes touchent, aujourd’hui, beaucoup de domaines tels que la physique ou bien encore les sciences de l’information.

Comme vous pouvez le constater, la réponse que j’apporte à la question principale de mon TFE s’oriente vers la pollution des bibliothèques publiques lors de l’utilisation des connecteurs OAI. Mais, n’ayant jamais travaillé sur le terrain, mon opinion changera peut-être lorsque l’occasion se présentera à moi de mettre en place une base de données réalisée exclusivement sur base de collectes via les connecteurs OAI.

Pour conclure, j’ouvre, maintenant, une ou plusieurs piste(s) de réflexion sur cette problématique et celles qui suivront car mon avis n’est pas celui des autres et ce dont je viens de parler est peut-être sujet à être contredit par d’autres personnes bien plus qualifiées que moi en la matière.

jeudi 20 août 2009

Implémentation d'un connecteur OAI

Bien évidemment, pour interroger un entrepôt OAI, il faut forcément avoir un connecteur OAI actif dans son SIGB ou bien faire appel à des connecteurs externes.

Introduction

Je sais grâce à mes enquêtes que certains bibliothécaires utilisent les entrepôts OAI sans avoir installé de connecteurs OAI et vice versa.

La plupart des personnes pense que le connecteur OAI fait tout. Mais cela est faux. Derrière toutes ces collectes, il y a l'organisation des bibliothécaires qui doivent décider des entrepôts à "visiter" mais aussi gérer les données collectées.

Je me suis rendue compte qu'il s'agissait d'un travail colossal lors d'une collecte via les connecteurs OAI proposés par le SIGB, PMB. En effet, vu le nombre d'entrepôts proposés sur le site officiel de l'Open Archives Initiative et les items qui se trouvaient à l'intérieur de ceux-ci, j'ai constaté qu'il fallait vraiment prendre le temps de regarder les données qui pouvaient être pertinentes pour les bibliothécaires.

Mise en place

La collecte OAI permet donc à une bibliothèque de collecter des métadonnées contenues dans des entrepôts OAI dans tout l'Internet. Il ne suffit pas de développer un moissonneur. En effet, il faut, pour cela :
  • Etablir le processus de recherche et de sélection des URL des bases à moissonner avec la fréquence de visites et de mise à jour pour chaque base. Cette action se fait en amont.
  • Déterminer le stockage, l'indexation, l'exploitation et l'affichage des données. Cette action se fait en aval.
Pour implémenter un moissonneur, on peut s'aider du guide de l'Open Archive Initiative et recourir à des kits librement diffusés (comme par exemple, le kit d'implémentation).

La plupart des principales plates-formes de gestion de ressources numériques « open source », permettant de collecter, d'indexer et de diffuser des contenus numériques, sont compatibles avec le protocole OAI et permettent d'implémenter un moissonneur ou un entrepôt.

Source :

Nawrocki, François. Le protocole OAI et ses usages en bibliothèque [en ligne]. Ministère de la culture et de la communication, 2005 [mise à jour 15 février 2005].

Communication entre le connecteur et l'entrepôt

Voici comme promis dans l'article précédent, le déroulement d'une communication entre un connecteur OAI et un entrepôt.

Préambule

Le connecteur OAI soumet des requêtes XML aux entrepôts en recourant aux protocoles HTTP et URL (universellement répandus) pour une interopérabilité optimale. Les réponses reçues sont également en syntaxe XML.

Requêtes

Les requêtes, appelées communément « verbes » ou « commandes », correspondent à un ensemble de réponses standardisées et sont au nombre de six. Celles-ci permettent au connecteur OAI de :
  • Vérifier si le service désigné est un répertoire OAI (Identify),
  • Demander la liste des formats de métadonnées que l'entrepôt est capable de fournir (ListMedataformats),
  • Obtenir, lors du cas échéant, la liste des ensembles formés par le fournisseur de données (ListSets),
  • Obtenir la liste des identifiants et des dates de dernière modification des items disponibles dans la base (ListIdentifiers),
  • Collecter l'information d'un item spécifique (GetRecord),
  • Récupérer en bloc l'ensemble des items d'un répertoire (ListRecords).
Ces requêtes permettent de définir les caractéristiques de l'exploitation que chaque connecteur OAI fait d'un entrepôt.

Déroulement

Après que l'entrepôt et son offre documentaire aient été identifiés, le responsable du connecteur OAI doit choisir les lots (sets) ou la liste des données qui doivent être collectés selon des critères prédéfinis. Ensuite, il doit attribuer la fréquence à laquelle le connecteur OAI ira moissonner les collectes ciblées. Cela se fera après chaque mise à jour des données cibles du ramassage.

Source :

Nawrocki, François
. Le protocole OAI et ses usages en bibliothèque [en ligne]. Ministère de la culture et de la communication, 2005 [mise à jour 15 février 2005].

Entrepôt OAI

Vous devez vous dire : "C'est bien beau toutes ces explications mais comment fonctionnent réellement les connecteurs OAI?".

Pour qu'un connecteur puisse collecter correctement les données désirées, il faut d'abord mettre en place un entrepôt OAI.

Définition

Ce dernier est une base de métadonnées constituée par un fournisseur de données. Les métadonnées y sont disponibles dans différents formats afin de répondre à différents types de demandes. Lorsqu'il rentre en "liaison" avec un connecteurs OAI, il peut répondre à six requêtes que l'on verra un peu plus loin.

Modèles

Avant de créer un entrepôt OAI, tout fournisseur de données potentiel doit choisir entre l'un de ces deux modèles :
  • Modèle partagé d'entrepôt : cela signifie que l'on veut rendre nos données accessibles à tous les moissonneurs OAI qui parcourent la toile.
  • Modèle réservé d'entrepôt : cela concerne les fournisseurs de données qui ne veulent diffuser leurs données au sein d'un cercle restreint de clients bien identifiés. Ces partenaires ont en commun un même projet et ils sont liés par des accords ou une charte.
Ce qui différencie ces deux modèles est bien évidemment l'ajout d'une restriction par rapport à l'accès aux contenus.

Les entrepôts de modèle réservé sont le plus souvent conçus pour alimenter un seul fournisseur de service (comme par exemple, un catalogue collectif) mais il peut aussi servir d'étape intermédiaire dans un projet et ensuite, se transformer en un entrepôt partagé.

Exemples
  • Archivage et diffusion en ligne des prépublications d'articles scientifiques : E-Prints , Pubmedcentral,
  • Thèses : Archimède , Pastel , Cyberthèses (projet),
  • Articles scientifiques : Aladin,
  • Archivage et valorisation de collections documentaires spécifiques : Lacito.
Source :

Nawrocki, François. Le protocole OAI et ses usages en bibliothèque [en ligne]. Ministère de la culture et de la communication, 2005 [mise à jour 15 février 2005].

mardi 18 août 2009

Lexique

Avant de continuer les explications au sujet des connecteurs OAI, je vous propose un petit lexique reprenant quelques termes spécifiques qui ont été ou seront utilisés.

Agrégateur

Rassemble les métadonnées provenant de plusieurs fournisseurs de données et les rend accessibles dans un entrepôt OAI.

Dublin Core

C’est une norme de description bibliographique, créée en 1995, conçue à la base pour s’appliquer aux documents électroniques et facilement encodable en XML : elle définit des métadonnées génériques et développe des outils pour implémenter des métadonnées dans les ressources.

Enregistrement (record)

Représentation XML concrète de métadonnées issues d’un item (objet documentaire), dans un format compatible avec le protocole OAI. Plusieurs enregistrements (formats DC non qualifié, DC qualifié, MarcXML…) peuvent être produits pour un même item.

Entrepôt OAI (repository)

Base de métadonnées constituée par un fournisseur de données. Les métadonnées y sont disponibles dans différents formats afin de répondre à différents types de demandes.

Fournisseur de données

Il détient des métadonnées et les met à la disposition des fournisseurs de services pour la réalisation d’une application. Il crée un entrepôt de métadonnées OAI.

Fournisseur de services

Il lance un programme (le moissonneur) pour collecter les métadonnées d’un ou plusieurs fournisseur(s) de données et les rassemble pour créer un service (par exemple, une base de données).

Interopérabilité

L’interopérabilité désigne la possibilité qu’une donnée produite par un système puisse être utilisée par d’autres systèmes. En résumé, les données doivent être produites dans un langage compatible avec les bases de données qui permettent des échanges de données. Pour ce faire, l’utilisation des normes est requise. Il existe 4 niveaux : l’interopérabilité technique, l’interopérabilité sémantique, l’interopérabilité syntaxique et l’interopérabilité organisationnelle.

Item

L’item est l’objet documentaire qui décrit une ressource. L’item est générateur d’enregistrements de métadonnées qui pourront être échangés grâce au protocole OAI, à la seule condition qu’à chaque item puisse être associé un identifiant unique au sein de son entrepôt.

Lot OAI (set)

Un lot ou ensemble OAI est un groupe d’items ou éléments définis dans l’entrepôt. Un item peut appartenir à plusieurs lots. Les lots OAI peuvent être eux-mêmes divisés en sous-lots.

Métadonnées

Les métadonnées sont des données descriptives et elles sont appelées plus communément « rubriques ».

Moissonneur

Programme lancé par le fournisseur de service pour la collecte de métadonnées auprès d’un ou plusieurs entrepôts OAI.

Open Archives Initiative

L’Open Archives Initiative, créée par la convention de Santa Fe en 1999 pour la promotion des archives ouvertes, développe un ensemble de protocoles communs et des standards d’interopérabilité facilitant la diffusion des contenus de documents, les métadonnées.

Protocole

Un protocole est une série de questions posées par une machine et auxquelles une autre machine peut effectuer une série de réponses. Un système qui comprend et utilise ce langage commun est compatible avec le protocole. Le protocole OAI définit que les questions et réponses sont encapsulées dans des balises XML et transportées par le protocole HTTP du World Wide Web.

Recherche fédérée

L’objectif d’une recherche fédérée est de créer une fonction de recherche appliquée à plusieurs bases de données comme si elle ne portait que sur une seule. Il existe deux techniques de recherche :
  • Interrogation simultanée : une requête est envoyée simultanément à plusieurs bases de données,
  • Agrégation des métadonnées : une nouvelle base, sur laquelle s’appliquera la recherche, rassemble les métadonnées des bases individuelles.
Ressource

On entend par ce terme tous les documents de toutes natures stockés dans des bases de données.

XML

XML est l’évolution voire une simplification du langage SGML (Standard Generalized Markup Language). SGML permettait d’encoder différents types de documents qu’ils soient complexes ou volumineux. Le format XML permet l’échange de données et peut facilement s’adapter sur Internet. Le format XML a été créé par le W3C (World Wide Web Consortium).

Sources :

Nawrocki, François. Le protocole OAI et ses usages en bibliothèque [en ligne]. Ministère de la culture et de la communication, 2005 [mise à jour 15 février 2005]

Rivier, Alexis. Aide-mémoire d'informatique documentaire. Éditions du Cercle de la Librairie, 2007. 156 p. ISBN 978-2-7654-0953-3

samedi 15 août 2009

Fournisseurs

Pour que les connecteurs OAI puissent fonctionner, il faut bien évidemment des acteurs qui permettent ces collectes de données. Dans ce cas-ci, ils sont deux :

Fournisseurs de services

Le fournisseur de services (service provider) ou moissonneur (harvester) utilisent l’OAI-PMH pour collecter les métadonnées qu’ils hébergent. On peut aussi l’appeler « agrégateur » étant donné qu’il peut moissonner plusieurs fournisseurs de services. Un fournisseur de services est conforme à l’OAI-PMH lorsqu’il est capable de rapatrier des métadonnées à l’aide des moyens définis dans le protocole.

Fournisseurs de données

Le fournisseur de données (data provider) ou entrepôt de données (OAI repository) utilise le protocole OAI pour rendre accessibles leurs métadonnées, c’est-à-dire fournir à la demande du « client » des informations concernant les documents hébergés. Un fournisseur de données est conforme au protocole OAI-PMH s’il autorise l’extraction des métadonnées sous ce protocole.

Schéma explicatif


Ce schéma montre bien la relation qui existe entre les fournisseurs de services et les fournisseurs de données. Sans cette coopération, l'utilisateur final ne pourrait pas consulter les documents déposés dans les entrepôts.

Cette représentation est extraite de : Nawrocki, François. Le protocole OAI et ses usages en bibliothèque [en ligne]. Ministère de la culture et de la communication, 2005 [mise à jour 15 février 2005].

jeudi 13 août 2009

Connecteurs OAI

Après avoir expliqué ce qu'étaient les archives ouvertes, je vais aborder aujourd'hui les connecteurs OAI. Cet article n'est qu'un prélude pour ceux à venir.

Définition

Un connecteur OAI, est une application qui permet de gérer des interrogations contrôlées par le protocole OAI-PMH. Celui-ci est mis en place par un fournisseur de services pour collecter des métadonnées dans les différents entrepôts disponibles.

Protocole OAI-PMH

Ce protocole donne aussi la possibilité de créer, alimenter et tenir à jour des réservoirs d'enregistrements grâce à des procédures automatisées. Ces réservoirs permettent de signaler, décrire et rendre accessibles les documents sans devoir les dupliquer ou modifier leur localisation initiale.

Un des grands avantages du protocole OAI est qu'il peut faire communiquer des bases de données entre elles. Cela met en place des partenariats entre plusieurs établissements par rapport aux collections et au public.

Objectifs
  • Repousser les barrières du web invisible étant donné que les archives ouvertes en font encore partie,
  • Tendre à diminuer le phénomène de la littérature grise,
  • Faciliter l'interopérabilité des ressources documentaires culturelles. Cela signifie qu'il n'y aura ni duplication ni déchargement des documents primaires,
  • Mettre à jour simplement et automatiquement les métadonnées collectées et les liens. On ne fait que récupérer les dernières modifications des réservoirs sources, cela permet de ne plus copier à nouveau l'intégralité des données,
  • Encourager l'utilisation d'un format de description assez générique,
  • Intégrer des ressources numériques d'origine diverses.

mardi 11 août 2009

Archives ouvertes

Afin de vous expliquer le concept de l'OAI, je vais vous parler des archives ouvertes qui sont le point de départ pour la mise en place des connecteurs OAI.

Définition


Il s'agit d'un serveur dont le contenu (documents scientifiques et techniques) est accessible en ligne librement sur le web. Les chercheurs peuvent y déposer leurs résultats tout en les soumettant dans des revues professionnelles. Le but des archives ouvertes est d’assurer la diffusion du savoir et des connaissances aussi bien au monde scientifique qu’à un public plus large.

Schéma explicatif


Ce schéma explique tout le circuit suivit lors de la création d'une archive qui sera ensuite appelée, archive ouverte. Dans cette représentation, nous pouvons déjà remarquer la présence des entrepôts et des connecteurs OAI. Ces termes seront expliqués plus en détails dans les prochains articles.
  • Les ellipses blanches représentent les acteurs principaux de ce circuit.
  • Les rectangles aux coins arrondis caractérisent les centres de diffusion.
  • Les rectangles écornés symbolisent les documents.
Le schéma est extrait de : Tosca Consultants. Logiciels portails pour bibliothèques et centre de documentation et archives. ADBS éditions. 2007, p. 144. ISBN 978-2-84365-091-8