Nomenclatures : 4.2.2.4 Nomenclatures relatives aux notices
Concernant la remise en qualité des notices, et notamment le dé doublonnage, une expérimentation a été effectuée dans le cadre du projet Conditor. Il en résulte que (source : Métadonnées Conditor : bilan) :
« Dans les notices décrivant une production, on distingue trois types de métadonnées :
- Les métadonnées utilisées pour l'appariement des notices bibliographiques entre elles ou dédoublonnage : titres, auteurs, « sources » (titre ou identifiant de niveau supérieur donc de revue pour un article, de l'ouvrage pour un chapitre...), collations (volume, numéro, première page pour un article), identifiants de documents ou autres productions, date de publication...
- Les métadonnées utilisées pour les alignements avec le RNSR (adresses, affiliations) en vue de l'attribution de l'identifiant national de structure et avec IdRef (auteurs) pour détecter des identifiants IdRef potentiels.
- Les métadonnées non indispensables aux appariements et alignements avec les référentiels de structures ou d'auteurs, mais très utiles à partager entre partenaires (identifiants d'auteurs, mots clés, classification, données de recherche associées, financements, liens vers texte intégral, données de gestion...).
Concernant les métadonnées utilisées pour l'appariement entre notices, la façon dont il se fait a une incidence sur l'obligation de disposer ou pas d'une métadonnée en entrée de Conditor :
- Si un identifiant partagé de document (DOI, UT, Hal, PPN, NNT) est présent dans 2 notices et surtout est fiable (ce qui est loin d'être toujours le cas), un alignement strict sur chaîne de caractères de cet identifiant peut suffire au dédoublonnage.
- Dans tous les autres cas, c'est une combinaison de métadonnées présentes dans 2 notices qu'il est nécessaire d'aligner (volume, numéro, première page, ISSN, titre, auteur...).
Les métadonnées utilisées pour cet appariement ou pour l'alignement avec les référentiels doivent impérativement être normalisées, en entrée de Conditor ou à défaut dans Conditor (comme cela a été le cas lors de l'expérimentation).
Les métadonnées présentes dans chaque notice dépendent du type de production.
Sept types ont été définis lors de l'expérimentation en fonction des corpus de notices utilisés (essentiellement des publications) : article, congrès, chapitre d'ouvrage, ouvrage, rapport, thèse et autre.
Ces types « Conditor » sont issus de regroupements entre les différentes typologies utilisées par les fournisseurs de corpus de notices.