Athar : Numérisation, indexation et mise en ligne enrichie des bulletins du Comité de conservation des monuments de l'art arabe (1882-1953) Hélène Bégnis helene.begnis@persee.fr Université Lyon, ENS de Lyon, CNRS, France Antonio Mendes d a Silva antonio.mendes@inha.fr INVISU, Institut National d'Histoire de l'Art, France Le projet Athar (de l'arabe traces ou empreintes, et par extension monuments ou antiquités) met a disposition, en open access, l’integralite des travaux du Comité de conservation des monuments de l'art arabe (1882-1953), instance creee au Caire pour inventorier, decrire et restaurer les monuments islamiques puis coptes d’Égypte. Sur le modeie des rapports de la Commission des monuments historiques en France, cette publication annuelle, redigee en français, aujourd’hui eteinte et libre de droits, se compose de 41 volumes publies au Caire entre 1882 et 1953, totalisant 8 000 pages et près de 800 planches. Ce corpus rassemble parfois l’unique documentation encore subsistante sur des monuments disparus, très degrades ou radicalement transformes. Par ses illustrations, il se trouve en relation avec les riches fonds de la photographie commerciale prèsente au Caire a partir de 1860, diffusee de façon croissante sur Gallica et Éuropeana. Les partenaires Ce projet est le résultat d’une collaboration fructueuse entre trois structures du monde scientifique et universitaire français : le laboratoire InVisu, l'Institut français d'archeologie orientale et Persee. La complementary des expertises de chacun de ces partenaires a ete essentielle pour mener a bien ce projet. Le laboratoire InVisu, grâce a son savoir-faire documentaire, a pris en charge la structuration fine du corpus et l’indexation des toponymes a l’aide du Cairo Gazetteer. Ce réferentiel multilingue (français, arabe, anglais) permet d’identifier, de decrire et de localiser finement les 600 edifices classes du Caire au titre de monuments historiques en proposant les variantes orthographiques de ces toponymes. L’IFAO a permis la completion de la collection en prêtant les volumes manquants et a apporte ses competences sur la toponymie et la cartographie egyptiennes. Persee, grâce a son expertise de plus de 10 ans en matiere de numerisation, d’ocerisation et de diffusion du patrimoine scientifique, a mis au service du projet sa plateforme technique (JGAlith : application integrée et complete, developpee par Persee, qui permet a l'ensemble de ses partenaires impliques dans le processus de traitement des collections de communiquer et de partager les informations apportees par chacun) et ses ressources humaines assurant ainsi la gestion de l’ensemble du cycle des documents (dematerialisation, documentation, diffusion web, sauvegarde et archivage perenne). Technologies et formats, usage du Linked Open Data Les technologies et formats utilises reposent sur les normes et les standards en vigueur dans le contexte de l’open access et de l’interoperabilite. Les metadonnees generèes par la structuration du corpus sont encodees au format XML selon les schemas Dublin Core, MarcXML et MODS. Le texte integral issu de l’OCR non corrige est disponible selon le schema TÉI et l’ensemble des donnees est decrit et organisé dans un container XML au format METS. Le contenu du Cairo Gazetteer, deploye grâce à Ginco (outil de gestion de rèferentiels terminologiques), est mis a disposition de la communaute des humanites numeriques par le biais du format SKOS. Il offre une solution innovante pour résoudre les difficultes liees a la translitteration des toponymes arabes. [194-1] Illustration 2. Les données du Cairo Gazetteer encodées en RDF [194-2] Illustration 1. Une fiche du Cairo Gazetteer [194-3] Illustration 4. Dans JGalith, sélection du monument à lier vers le label correspondant dans le Cairo Gazetteer Des liens vers deux référentiels disponibles au niveau international ont été insérés dans les données de structuration du corpus : IdRef pour les auteurs et le Cairo Gazetteer pour les édifices. Ces liens permettent de déduire des alignements vers des ressources extérieures complementaires telles que data.bnf.fr, DBpedia, les Subject Headings de la Library of Congress et GeoNames. Le developpement et l'implémentation par l'équipe informatique de Persee d'un module spécifique dans la plateforme de JGALITH a ete nécessaire pour réaliser cette etape. [194-4] Illustration 3. Dans JGalith, inclusion d'une balise dans le titre de l'article pointant vers l'entité nommée correspondante dans le Cairo Gazetteer Diffusion du corpus La diffusion de ce corpus est actuellement réalisée sur le portail Persée. [194-5] A l'horizon 2017-2019 un site corpus sera développe par Persee faisant ainsi évoluer son offre de services. L'ensemble des données produites et agrégées dans le cadre du projet Athar sera intégré dans un écosystéme plus large pour offrir une information plus riche, plus complété et centralisée pour l'utilisateur du site dédié. Des pages composites construites a partir des données produites par la chaîne Persee et celles récupérées grâce a l'alignement avec les référentiels extérieurs sélectionnés seront aussi développées. Elles viendront compléter l'éventail des fonctionnalités de navigation et d'exploration (index auteur, table des matiéres, références croisées, table des illustrations) déjà mis en œuvre dans le portail Persee. Parallèlement a la diffusion web, une exposition des données par le biais d'un entrepôt OAI et d'un SPARQL endpoint sera également déployée.