Catalogiseren in het linked data-tijdperk #5

RDA richt zich op “gebruikersgerichte linked data-applicaties”. Wat wordt daarmee bedoeld? Waarom richt RDA zich daarop? En welke linked data-applicaties zijn er voor de bibliotheek- en erfgoedsector?

RDA en linked data

Alle entiteiten, data-elementen en vocabulaires in de RDA Registry hebben een persistente identificatie gekregen. Deze duurzame verwijzingen naar specifieke onderdelen van RDA maken de standaard geschikt voor gebruik in een linked data-omgeving. Anders geformuleerd: de RDA Registry maakt het mogelijk RDA-data uit te drukken in RDF (Resource Description Framework) statements, oftewel in subject-predicaat-object-triples.

Bij gebruik van RDA in een linked data-toepassing kan een computer conclusies trekken op basis van de in het model gedefinieerde verbanden. Zo weet hij dat een “librettist” een specifiek type “auteur” is en een “auteur” een specifiek type “maker” en kun je hem bijvoorbeeld opdracht geven alle soorten “makers” mee te nemen in een zoekactie. Ook met inversies kan hij moeiteloos overweg: wanneer persoon A de auteur is van werk B weet de computer ook dat werk B geschreven is door persoon A.

Waar een populaire standaard als Schema.org alleen voorziet in generieke labels, biedt RDA alle specifieke elementen die gebruikt worden in de bibliotheeksector en de relaties tussen die elementen. Een grotere granulariteit moet het makkelijker maken om aansluiting te vinden in vergelijkbare concepten van andere gemeenschappen. Het maakt samenwerking mogelijk met instellingen die niet noodzakelijkerwijs hetzelfde vocabulaire gebruiken. Het uiteindelijke doel is – uiteraard – de gebruikerservaring te vergroten door “dingen” (bronnen, personen, plaatsen, concepten etc.) op een nieuwe manier samen te brengen. Zo kan de gebruiker niet alleen gemakkelijker vinden wat hij zoekt, maar ook gemakkelijker verwante “dingen” ontdekken binnen én buiten de eigen instelling of sector.

Onderdeel van “het web” worden

Het denken in entiteiten stelt ons in staat om de resources in onze collecties op verschillende manieren te verbinden aan de data in gegevensverzamelingen buiten collectiebeherende instellingen. Een plaatsnaam gerelateerd aan een resource kan gekoppeld worden aan een geografische dataset of zelfs aan toeristische data. We hoeven al die data niet in onze catalogus op te nemen. Maar, hoe meer mensen gebruik maken van internationaal geaccepteerde vormen van identificaties (die passen bij de complexiteit van de entiteit), hoe meer combinaties gemaakt kunnen worden met linked data-instrumenten.

Neem bijvoorbeeld een evenementenkalender op internet. Hun onderliggende database lijkt niet erg op een bibliografische database maar ze onderscheiden wel een titel van een evenement, een gerelateerde plaats, tijdspanne (datum en tijd), persoon of groep. Stuk voor stuk kunnen dit aanknopingspunten zijn om data te identificeren en over en weer automatisch extra content te etaleren. Denk aan “Alvast in de stemming komen voor de aangekondigde lezing? In onze collectie vindt u deze werken van dezelfde persoon”, of iets dergelijks.

RDA biedt veel granulariteit en bij gegevensuitwisseling met minder gedetailleerde datasets of toepassingen zit dat soms in de weg. De minder uitgebreide gegevensverzameling weet bijvoorbeeld niet wat het verschil is tussen Titel van het Werk en Titel van de Manifestatie en heeft bijvoorbeeld “Uitvoerende artiest” in plaats van onderscheid te maken tussen personen, corporaties en families. Modeltechnisch kan de ontvangende verzameling niet overweg met elementen die gebonden zijn aan die specialistische entiteiten, maar ze maken wellicht wel onderscheid tussen Resources (informatiebronnen, beschreven eenheden) enerzijds en Actoren (betrokken partijen) anderzijds. Het is dan ook niet verwonderlijk dat een ambitieus project als de Shared Entity Management Infrastructure (SEMI) van OCLC begint bij de entiteiten Werk en Persoon.

De RDA Toolkit gebruikt elementen die gebonden zijn aan de LRM-entiteiten. In de RDA Registry zit ook een ongebonden variant met unconstrained properties, die wel binnen LRM passen, maar niet zonder verlies van granulariteit terug naar RDA kunnen. Deze ongebonden elementenset is bedoeld voor toepassingen die niet met de LRM-entiteiten werken en kan een belangrijke rol spelen in de toekomstige samenwerking met instellingen buiten ons vakgebied.

Nieuwe generatie bibliotheeksoftware

De afgelopen jaren hebben softwareleveranciers veel werk verricht om het uiterlijk van de publiekscatalogus te moderniseren. Een rondgang langs catalogiseerafdelingen leert echter dat de modules voor catalogusonderhoud nog steeds als ouderwets ervaren worden, zeker door een nieuwe generatie collega’s die geen specifieke bibliotheekopleiding gevolgd heeft. Nationale bibliotheken en universiteiten werken nu samen aan platforms om met linked data te werken, en dit biedt kansen voor partijen om nieuwe applicaties te ontwikkelen. Voorbeelden van dergelijke initiatieven zijn RIMMF, Sinopia en Folio.

Meer informatie

Voorbeelden van linked data-applicaties:

  • RIMMF (Marc of Quality) – RDA in Many Metadata Formats, trainingshulpmiddel om te oefenen met entiteiten en hun relaties. Gebruikt door de University of Edinburgh om de linked data van hun portrettencollectie te onderhouden.
  • Sinopia van LD4P (LC-PCC, Casalini en Amerikaanse universiteiten) – platform om linked data te gebruiken in een productie-omgeving van bibliotheken.
  • FOLIO van Open Library Foundation – open source platform voor innovatie in bibliotheken.

U kunt hieronder reageren of een vraag stellen.

Catalogiseren in het linked data-tijdperk #4

RDA: internationale standaard

RDA is ontwikkeld vanuit de Anglo-Amerikaanse traditie, maar door wereldwijde input wordt RDA steeds meer een internationale contentstandaard. En dat is ook precies wat de RDA Board voor ogen staat.

Vertalingen

RDA is reeds beschikbaar in het Engels, Frans, Spaans, Catalaans, Italiaans, Noors, Fins, Hongaars en Arabisch. Er wordt nog gewerkt aan Hebreeuws en Hongaars. In december 2020 is de nieuwe Engelse tekst van de RDA Toolkit online gekomen. Deze nieuwe versie is nu beschikbaar in het Engels, Noors en Fins. De andere talen volgen zodra ze klaar zijn.

Bij de invoering van de standaard in Nederland in 2014 is besloten geen Nederlandse vertaling te maken. Aanvankelijk was het alleen mogelijk de volledige RDA Toolkit te vertalen. Sinds 2016 is het echter ook een optie om alleen de data-elementen en hun definities te vertalen. Dit wordt de RDA Reference Set genoemd.

Voorbeelden uit het vocabulaire Type Content.

Deze RDA Reference Set is inmiddels (gedeeltelijk) beschikbaar in meerdere talen, waaronder het Nederlands, Duits, Deens, Grieks, Ests en Lets. Er zijn voorbereidingen voor het Hebreeuws, Oekraïens, Portugees, Slowaaks, Zweeds en Vietnamees. De Reference Set zal in alle genoemde talen openbaar gepubliceerd worden in de RDA Registry, en is daarmee beschikbaar voor ontwikkelaars van bibliotheeksoftware. In de werkgroep Translations leren de diverse vertaalteams van elkaar en worden voorstellen gedaan om RDA nog minder Anglo-centrisch te maken.

Community resources

Inmiddels zijn diverse specifiek Anglo-Amerikaanse instructies geïdentificeerd en sinds april 2021 staan die niet meer in de officiële RDA. Ze zijn verplaatst naar het “Community resources” gedeelte van de RDA Toolkit, waarin content staat die weliswaar aan RDA voldoet, maar zich richt op een specifieke taal en/of gemeenschap en daardoor geen internationale geldigheid heeft. Het betreft bijvoorbeeld instructies voor het formuleren van ingangen. RDA schrijft die niet langer voor, maar laat het aan de communities over daar regels voor op te stellen. Ook richtlijnen voor de transcriptie van bijvoorbeeld Cyrillisch of Arabisch schrift naar Latijns schrift vallen hieronder.

Naast deze zogeheten community refinements bevat dit gedeelte van de RDA Toolkit ook community vocabularies. Je vindt daar, per taal geordend, uiteenlopende lijsten met afkortingen en termen, zoals bijvoorbeeld Terms for Books of the Bible in English en Terms for medium of performance in English. De Nederlandse RDA-Commissie heeft de lijsten uit Fobid ISBD voor Bijbelboeken en Medium van uitvoering (instrumentatie) inmiddels ook voorbereid om als vocabulaire in RDA-records te gebruiken.

Meer informatie

U kunt hieronder reageren of een vraag stellen.

Catalogiseren in het linked data-tijdperk #3

RDA omschrijft zichzelf als “een pakket van data-elementen, richtlijnen en instructies voor het maken van metadata voor bibliotheken en erfgoedinstellingen”. Vergeleken met de oorspronkelijke RDA is de nieuwe RDA Toolkit veel meer een data dictionary geworden.

Data-elementen in de nieuwe RDA Toolkit

Voor titelbeschrijvers zal het wel even wennen zijn: in plaats van een regelwerk dat in grote lijnen het catalogiseerproces volgt, ligt er nu een standaard waarin de richtlijnen en instructies gegroepeerd zijn per data-element.

Ieder data-element in de Toolkit (er zijn er meer dan 3000) is op dezelfde manier gedocumenteerd. De Toolkit-pagina begint met 1] de definitie en afbakening van het element, daarna volgen 2] een overzicht met “technische gegevens” (de zogeheten element reference), 3] instructies voor het vastleggen van informatie in het data-element, 4] eventueel een voorbeeld waarin het element in context wordt getoond en 5] een overzicht met verwante elementen.

1) De definitie wordt, net als enkele andere onderdelen van de pagina, opgehaald uit de RDA Registry, waar linked data-representaties van de elementen en vocabulaires uit RDA beschikbaar zijn. Deze informatie is in verschillende talen verkrijgbaar, waaronder het Nederlands, en zonder abonnement te benaderen. Software-ontwikkelaars kunnen de gegevens daardoor gebruiken in bijvoorbeeld helpteksten of veldlabels.

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

2) De element reference bevat o.a. informatie over de entiteit waar het element bijhoort, de entiteit waar het element naar verwijst (het merendeel van de data-elementen is een relatie-element) en een mapping naar MARC 21.

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

3) Het volgende voorbeeld laat een (klein) deel zien van de instructies voor het vastleggen van de “hoofdtitel”:

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

4) Bij diverse data-elementen geeft de RDA Toolkit een uitgebreider voorbeeld, waarin het betreffende data-element wordt weergegeven in combinatie met een aantal andere data-elementen. Hieronder een voorbeeld bij het element “hoofdtitel”:

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

5) Verwante elementen zijn er in twee soorten. Allereerst heb je de omkeringen bij relatie-elementen. Wanneer er bijvoorbeeld een element “heeft auteur” is, dat van een werk naar een persoon verwijst, is er ook een element “is auteur van” gedefinieerd, dat van een persoon naar een werk verwijst. Daarnaast kun je te maken hebben met hiërarchie tussen elementen, vergelijkbaar met die tussen “broader terms” en “narrower terms” in een thesaurus. Zo is “maker” breder dan “auteur”, dat op zijn beurt weer breder is dan “librettist”.

Meer informatie

Wie de data-elementen in RDA wil verkennen kan de nieuwe RDA Toolkit raadplegen. Als korte introductie zijn de volgende RDA Concepts video’s van de RDA Toolkit aan te bevelen:

  • Elements – Uitleg van Kate James over de rol van elementen in RDA en de verschillende typen elementen in de nieuwe toolkit.
  • Domain and range – Kate James legt uit hoe de begrippen “domein” en “bereik” in RDA gebruikt worden voor relatie-elementen.
  • Element labels – Kate James geeft uitleg over naamgevingsconventies en alternatieve labels voor RDA-elementen.

Andere interessante bronnen zijn:

Schermafbeeldingen van de RDA Toolkit (www.rdatoolkit.org) zijn gebruikt met toestemming van de houders van het auteursrecht voor RDA (American Library Association, Canadian Federation of Library Associations, en CILIP: Chartered Institute of Library and Information Professionals).

U kunt hieronder reageren of een vraag stellen.

Catalogiseren in het linked data-tijdperk #2

Het IFLA Library Reference Model (LRM) uit 2017 vormt het fundament van de nieuwe RDA Toolkit. Waar komt dit model vandaan en waarom is het zo belangrijk voor het catalogiseren in het linked data-tijdperk?

Van de FR-familie naar LRM

De oorspronkelijke RDA was gebaseerd op de FR-familie van entiteit‐relatie-modellen. Deze modellen definieerden de bouwstenen van de catalogus, hun eigenschappen en hun onderlinge verbanden. Omdat de uitwerking voor titelrecords (FRBR, 1998) anders was dan die voor ingangsrecords – voorheen catalogusbouw (FRAD, 2009 en FRSAD, 2010), sloten de modellen niet naadloos op elkaar aan, en bleven sommige onderdelen van RDA leeg tot nadere harmonisatie had plaatsgevonden.

LRM, het resultaat van deze harmonisatie, is een overzichtelijk model dat bestaat uit 11 entiteiten. De kern ervan wordt gevormd door de vertrouwde werk-, expressie-, manifestatie- en item-entiteiten uit FRBR:

Het model biedt de gebruiker de mogelijkheid om consequent onderscheid te maken tussen “dingen” (objecten, concepten, personen etc.) en hoe je die dingen noemt of aanduidt. Dit onderscheid en de manier waarop de 11 entiteiten met elkaar in verband gebracht worden, maken het model bij uitstek geschikt voor gebruik in een linked data-omgeving.

Overzicht van de relaties en entiteiten in LRM

Van LRM naar RDA

In de nieuwe RDA worden 13 entiteiten gebruikt die gebaseerd zijn op de entiteiten in LRM. In aanvulling op LRM heeft RDA de entiteitsgrenzen aangescherpt, dat wil zeggen, RDA heeft richtlijnen opgesteld voor wat je als een nieuw werk, een nieuwe manifestatie etc. moet beschouwen. De eigenschappen en relaties in RDA zijn eveneens afgeleid van die in LRM. Vaak zijn ze veel fijnmaziger dan in LRM, maar altijd passen ze in de door LRM vastgestelde structuur.

De volgende keer wordt dieper ingegaan op de data-elementen in RDA.

Meer informatie

Wie zich verder wil verdiepen in het Library Reference Model kan de volgende bronnen gebruiken:

  • IFLA Library Reference Model (LRM) – De officiële website van de IFLA. Je vindt hier niet alleen het volledige model, maar ook aanvullende documentatie over de transitie van FRBR, FRAD en FRSAD naar LRM.
  • IFLA Library Reference Model: What and Why? – Een videopresentatie van Chris Oliver uit juni 2018. Ze geeft hierin een overzicht van het model en van de gevolgen voor de catalogiseerpraktijk.
  • IFLA ISBD to LRM Mapping (2018) – Voor wie LRM wil bekijken vanuit het perspectief van de ISBD-elementen; achtergrondinformatie bij de mapping staat in het eindrapport van de werkgroep.

Wie nieuw is op het gebied van modellen voor catalogusdata vindt de volgende bronnen wellicht ook interessant:

Wie meer wil weten over de entiteiten in RDA kan de nieuwe RDA Toolkit raadplegen of de volgende videos uit de RDA Concepts afspeellijst op het YouTube-kanaal van de RDA Toolkit bekijken:

  • Entities – Een korte introductie van Kate James op de entiteiten in de nieuwe RDA.
  • Entity boundary – Kate James legt uit hoe entiteitsgrenzen in RDA gebruikt worden om te bepalen of je een nieuwe entiteit moet beschrijven.

Laat hieronder een reactie of een vraag achter.

Catalogiseren in het linked data-tijdperk #1

Op 15 december 2020 is de nieuwe RDA Toolkit van kracht geworden. De oorspronkelijke RDA-richtlijnen zijn vervangen door “een pakket van data-elementen, richtlijnen en instructies voor het maken van metadata voor bibliotheken en erfgoedinstellingen, die voldoen aan internationale modellen voor gebruikersgerichte linked data-applicaties”.

Wat eraan vooraf ging

In 1996 heeft de IFLA alle lokale varianten van ISBD – waaronder de FOBID Regels voor de Titelbeschrijving – achterhaald verklaard. Nederland was in 2014 het zevende land dat Resource Description and Access (RDA) omarmde als content-standaard. De oorspronkelijke RDA Toolkit, het bijbehorende online hulpmiddel, bestaat inmiddels 10 jaar en is vanuit technologisch perspectief hoogbejaard. Tussen 2016 en 2019 hebben de makers van de Toolkit het hulpmiddel volledig opnieuw opgebouwd. Het fundament voor de nieuwe RDA Toolkit is het Library Reference Model (LRM) dat de IFLA in 2017 gepubliceerd heeft.

Welke onderwerpen zullen behandeld worden

Wat zijn de belangrijkste wijzigingen in de nieuwe RDA Toolkit? Wat is de achtergrond ervan? En wat betekenen de wijzigingen voor de catalogiseerpraktijk?

De komende tijd publiceert de RDA Commissie een reeks korte bijdragen over catalogiseren met RDA in het linked data-tijdperk. Aan bod komen o.a. de volgende onderwerpen:

  • Van FRBR naar LRM
  • Een pakket van data-elementen, richtlijnen en instructies
  • Internationale focus
  • Gebruikersgerichte linked data-applicaties
  • Nieuwe generatie bibliotheeksoftware
  • Breed inzetbaar
  • Breed toepasbaar

Meer informatie

Kijk voor een eerste kennismaking naar de officiële New RDA Toolkit Demo video.


Plaats desgewenst een reactie, of vraag, hieronder.