Le Thésaurus PACTOLS

Un vocabulaire pour l’archéologie

Pour organiser les mots-clés utilisés dans l’indexation des notices du Catalogue Collectif Indexé, l’équipe à l’origine de Frantiq a créé le thésaurus PACTOLS. Il est organisé en 6 domaines et une liste dont les intitulés lui ont donné son nom : Peuples et cultures, Anthroponymes, Chronologie, Toponymes, Œuvres, Lieux et Sujets. Particulièrement adapté au traitement des collections des bibliothèques du réseau, il couvre toutes les thématiques de l’archéologie, depuis la Préhistoire jusqu’à l’époque contemporaine. Sa spécialisation de départ dans les sciences de l’Antiquité tend à se gommer avec l’intégration de nouvelles ressources sur des périodes plus anciennes (Pré- et Protohistoire) ou plus récentes (Moyen âge, époque contemporaine).

Son assiette documentaire et son évolutivité en font aujourd’hui un outil de référence qui intéresse les communautés métiers de l’archéologie : éditeurs scientifiques et gestionnaires des données de la recherche y trouvent les métadonnées contrôlées et ouvertes, nécessaires à l’enrichissement et au partage de l’information sur le web sémantique.

C’est ainsi que des éditeurs, des gestionnaires de collections patrimoniales et de données de la recherche ont adopté PACTOLS comme référentiel pour l’enrichissement et le contrôle de leurs métadonnées thématiques.

Un vocabulaire libre, contrôlé et interopérable

  • PACTOLS répond à la norme ISO 25964 sur les thésaurus multilingues et sur l’organisation et l’interopérabilité des thésaurus.
  • Il est multilingue : les concepts sont traduits dans six des langues européennes (français langue de référence, anglais, allemand, espagnol, italien, néerlandais) et en langue arabe.
  • Il est librement consultable en ligne sur https://pactols.frantiq.fr
  • Son utilisation est soumise à la licence libre ODC Open Database License (ODbL) v1.0, c’est à dire que vous pouvez le consulter et utiliser les concepts en citant leur source.
  • Chaque concept possède un identifiant pérenne (ARK) qui en fait un objet web unique, citable et réutilisable dans le web sémantique.

PACTOLS est géré avec le logiciel Opentheso, développé en libre par M. Rousset, responsable de la plateforme Web sémantique et Thesaurii, à la Maison de l’Orient et de la Méditerranée, pour les besoins initiaux de PACTOLS. Celui-ci bénéficie des fonctions avancées de Opentheso pour la gestion avancée des concepts et des branches, de la polyhiérarchie, du multilinguisme et du mode d’alimentation collaborative. Ainsi, PACTOLS est exportable dans des formats non propriétaires (CSV, SKOS, JSON-LD) et interopérable via un Webservices ouvert de type REST.

Plusieurs connecteurs sont déjà opérationnels pour des systèmes Koha (gestion de bibliothèques), AtoM (archives), Drupal et OmékaS (CMS), Métopes (édition XML). Cela a permis à plusieurs réservoirs de ressources d’utiliser dynamiquement les micro-thesauri PACTOLS pour enrichir leurs métadonnées.

Au total, PACTOLS est conforme aux principes FAIR édicté par FORCE11 pour le partage des données sur le web.

Structure du thésaurus

Les 50000 concepts que compte aujourd’hui le thésaurus sont organisés dans sept thématiques éponymes : six domaines hiérarchisés et une liste des toponymes

  • PEUPLES : noms de cultures préhistoriques, peuples antiques et modernes, groupes humains
  • ANTHROPONYMES : noms d’artistes, de divinités et héros, d’écrivains, de gouvernants, de religieux, de savants
  • CHRONOLOGIE : datation absolue (du XIe millénaire avant J.-C. jusqu’au IIIe millénaire), ères géologiques, événements historiques, périodisation
  • TOPONYMES : liste alphabétique de sites et toponymes non intégrés au domaine LIEUX
  • ŒUVRES : œuvres artistiques, textes juridiques, littéraires et religieux
  • LIEUX : par continent, lieux imaginaires, monde antique, monde médiéval
  • SUJETS : soit 26 hyperonymes regroupant les domaines d’études de l’archéologie et des sciences de l’Antiquité

Programme de réorganisation (2017-2021)

Depuis plus de 30 ans, le lexique de PACTOLS n’a cessé d’évoluer. Pour faciliter son appropriation par une communauté d’utilisateurs élargie et sa portabilité sur le web, il devenait urgent de repenser l’organisation du thésaurus. Le projet s’est mis en place en 2017 avec le soutien du Consortium MASA. Le recours à l’expertise méthodologique de S. Dalbin (ATD) a permis de définir une méthode de travail avec une feuille de route et des outils de suivi de projet et d’administration qui n’existaient pas. Le travail s’oriente dans trois directions :

  1. Consolider le thésaurus dans sa structure
    1. en respectant des règles rigoureuses dans les relations. Par exemple, la relation hiérarchique est un/est un type de ou est une partie de (éperon barré EST UN TYPE DE fortification ; Anubis EST UNE divinité égyptienne ; doigt EST UNE PARTIE DE corps) ; en multipliant les règles d’association (sel EST ASSSOCIE A grenier à sel, marais salant, route du sel…)
    2. en réorganisant les domaines sur des modèles sémantiques élaborés favorisant les alignements (Art & Architecture Thesaurus par exemple). La réorganisation porte essentiellement sur le domaine SUJETS dont les thématiques remonteront à un niveau de visibilité équivalent aux autres domaines de PACTOLS.
  2. Enrichir son lexique avec des vocabulaires de spécialité avec deux objectifs : gommer des déséquilibres actuels dans certaines thématiques et répondre aux demandes précises des scientifiques pour la description des données.
  3. Faire évoluer ses modalités d’alimentation vers un collectif élargi en accompagnant les utilisateurs dans l’appropriation d’un outil partagé et contrôlé.

En 2018, il nous est apparu que la réorganisation thématique envisagée ne répondait finalement pas suffisamment aux nécessités d’interopérabilité avec d’autres vocabulaires en ligne. Nous nous inspirons d’une structure plus conceptuelle, avec facettes, telle que mise en œuvre dans le BackBone Thesaurus développé par le Groupe de travail Thesaurus Maintenance de l’Infrastructure européenne DARIAH.

Pour procéder à cette réorganisation structurelle, nous avons figé la version publique du thésaurus qui n’est plus mise à jour depuis janvier 2019. La version en développement intègre les propositions de candidats, les demandes spécifiques des experts, qui sont déplacées petit à petit depuis les domaines PACTOLS vers les nouvelles thématiques.

Cette nouvelle version devrait être livrée fin 2021.

Workflow collaboratif

Le Groupe de travail PACTOLS assure la maintenance des + 50000 concepts avec des mises à jour en continu. Il est garant de l’intégrité structurelle du thésaurus, gère les candidats, propose des enrichissements sémantiques, assure la liaison avec les contributeurs de Frantiq et les partenaires. Composé d’archéologues et de documentalistes qui connaissent bien la discipline, il consulte des spécialistes dans certains cas complexes pour valider des créations ou pour améliorer les contenus.

Le comité de pilotage impliqué dans la réorganisation se réunit toutes les trois semaines : il étudie le déplacement des concepts depuis les micro-thesauri vers la nouvelle structure, intègre les candidats en attente et procède aux changements dans la version de développement.

Il associe étroitement les communautés de spécialistes pour chacun des dossiers concernés, par exemple :

  • GAAF, Groupement des archéologues et anthropologues funéraires
  • Groupe de travail sur les Matériaux du réseau CAIRN des archéomètres du CNRS
  • Céramopôle de la Maison méditerranéenne des sciences de l’homme
  • réseau ICERAMM

Mises à jour récentes

  • Traduction en langue arabe (2015-2016)
  • CHRONOLOGIE (2016-2018) : mise à jour de la périodisation, déplacement de concepts dans de nouveaux dossiers datation absolue et événements historiques
  • LIEUX: mise en conformité de FRANCE sur la réorganisation administrative avec alignements sur GeoNames et Wikidata (INIST, 2016-2018)
  • METHODOLOGIE (2017)
  • Gel de la version publique PACTOLS en vue de sa réorganisation (2019-2020)

Partenaires

  • Maison de l’Orient et de la Méditerranée : pour le soutien au développement du logiciel Opentheso et le projet Arkéo de génération d’identifiants pérennes de type ARK
  • TGIR Huma-Num, au travers de
    1. ISIDORE, l’assistant de recherche des sciences humaines et sociale du CNRS exploite le multilinguisme de PACTOLS et enrichit ses résultats de recherche avec le thésaurus
    2. Consortium MASA : depuis 2013, PACTOLS y est proposé comme vocabulaire de référence à tous les projets de gestion ou de valorisation des données de la recherche, développés par les partenaires
  • INIST : réalise pour Frantiq les alignements des concepts du domaine Lieux avec GeoNames, l’Insee (pour la France) et Wikidata
  • Métopes : développe la connexion dynamique de PACTOLS dans la chaîne de production éditoriale XML-TEI déployée auprès des éditeurs scientifiques de l’archéologie.
  • OpenEdition : adapte l’exploitation des index de revues d’archéologie élaborés à partir de PACTOLS à la plateforme OpenEdition Journals
  • ARIADNE et ARIADNEPlus: l’infrastructure européenne pour l’archéologie a intégré PACTOLS parmi les vocabulaires contrôlés alignés sur le Art & Architecture Thesaurus (AAT)
  • Thesaurus maintenance WG de DARIAH-EU : Frantiq participe au nom du CNRS au comité de pilotage du BackBone Thesaurus.