Catalogiseren in het linked data-tijdperk #5

RDA richt zich op “gebruikersgerichte linked data-applicaties”. Wat wordt daarmee bedoeld? Waarom richt RDA zich daarop? En welke linked data-applicaties zijn er voor de bibliotheek- en erfgoedsector?

RDA en linked data

Alle entiteiten, data-elementen en vocabulaires in de RDA Registry hebben een persistente identificatie gekregen. Deze duurzame verwijzingen naar specifieke onderdelen van RDA maken de standaard geschikt voor gebruik in een linked data-omgeving. Anders geformuleerd: de RDA Registry maakt het mogelijk RDA-data uit te drukken in RDF (Resource Description Framework) statements, oftewel in subject-predicaat-object-triples.

Bij gebruik van RDA in een linked data-toepassing kan een computer conclusies trekken op basis van de in het model gedefinieerde verbanden. Zo weet hij dat een “librettist” een specifiek type “auteur” is en een “auteur” een specifiek type “maker” en kun je hem bijvoorbeeld opdracht geven alle soorten “makers” mee te nemen in een zoekactie. Ook met inversies kan hij moeiteloos overweg: wanneer persoon A de auteur is van werk B weet de computer ook dat werk B geschreven is door persoon A.

Waar een populaire standaard als Schema.org alleen voorziet in generieke labels, biedt RDA alle specifieke elementen die gebruikt worden in de bibliotheeksector en de relaties tussen die elementen. Een grotere granulariteit moet het makkelijker maken om aansluiting te vinden in vergelijkbare concepten van andere gemeenschappen. Het maakt samenwerking mogelijk met instellingen die niet noodzakelijkerwijs hetzelfde vocabulaire gebruiken. Het uiteindelijke doel is – uiteraard – de gebruikerservaring te vergroten door “dingen” (bronnen, personen, plaatsen, concepten etc.) op een nieuwe manier samen te brengen. Zo kan de gebruiker niet alleen gemakkelijker vinden wat hij zoekt, maar ook gemakkelijker verwante “dingen” ontdekken binnen én buiten de eigen instelling of sector.

Onderdeel van “het web” worden

Het denken in entiteiten stelt ons in staat om de resources in onze collecties op verschillende manieren te verbinden aan de data in gegevensverzamelingen buiten collectiebeherende instellingen. Een plaatsnaam gerelateerd aan een resource kan gekoppeld worden aan een geografische dataset of zelfs aan toeristische data. We hoeven al die data niet in onze catalogus op te nemen. Maar, hoe meer mensen gebruik maken van internationaal geaccepteerde vormen van identificaties (die passen bij de complexiteit van de entiteit), hoe meer combinaties gemaakt kunnen worden met linked data-instrumenten.

Neem bijvoorbeeld een evenementenkalender op internet. Hun onderliggende database lijkt niet erg op een bibliografische database maar ze onderscheiden wel een titel van een evenement, een gerelateerde plaats, tijdspanne (datum en tijd), persoon of groep. Stuk voor stuk kunnen dit aanknopingspunten zijn om data te identificeren en over en weer automatisch extra content te etaleren. Denk aan “Alvast in de stemming komen voor de aangekondigde lezing? In onze collectie vindt u deze werken van dezelfde persoon”, of iets dergelijks.

RDA biedt veel granulariteit en bij gegevensuitwisseling met minder gedetailleerde datasets of toepassingen zit dat soms in de weg. De minder uitgebreide gegevensverzameling weet bijvoorbeeld niet wat het verschil is tussen Titel van het Werk en Titel van de Manifestatie en heeft bijvoorbeeld “Uitvoerende artiest” in plaats van onderscheid te maken tussen personen, corporaties en families. Modeltechnisch kan de ontvangende verzameling niet overweg met elementen die gebonden zijn aan die specialistische entiteiten, maar ze maken wellicht wel onderscheid tussen Resources (informatiebronnen, beschreven eenheden) enerzijds en Actoren (betrokken partijen) anderzijds. Het is dan ook niet verwonderlijk dat een ambitieus project als de Shared Entity Management Infrastructure (SEMI) van OCLC begint bij de entiteiten Werk en Persoon.

De RDA Toolkit gebruikt elementen die gebonden zijn aan de LRM-entiteiten. In de RDA Registry zit ook een ongebonden variant met unconstrained properties, die wel binnen LRM passen, maar niet zonder verlies van granulariteit terug naar RDA kunnen. Deze ongebonden elementenset is bedoeld voor toepassingen die niet met de LRM-entiteiten werken en kan een belangrijke rol spelen in de toekomstige samenwerking met instellingen buiten ons vakgebied.

Nieuwe generatie bibliotheeksoftware

De afgelopen jaren hebben softwareleveranciers veel werk verricht om het uiterlijk van de publiekscatalogus te moderniseren. Een rondgang langs catalogiseerafdelingen leert echter dat de modules voor catalogusonderhoud nog steeds als ouderwets ervaren worden, zeker door een nieuwe generatie collega’s die geen specifieke bibliotheekopleiding gevolgd heeft. Nationale bibliotheken en universiteiten werken nu samen aan platforms om met linked data te werken, en dit biedt kansen voor partijen om nieuwe applicaties te ontwikkelen. Voorbeelden van dergelijke initiatieven zijn RIMMF, Sinopia en Folio.

Meer informatie

Voorbeelden van linked data-applicaties:

  • RIMMF (Marc of Quality) – RDA in Many Metadata Formats, trainingshulpmiddel om te oefenen met entiteiten en hun relaties. Gebruikt door de University of Edinburgh om de linked data van hun portrettencollectie te onderhouden.
  • Sinopia van LD4P (LC-PCC, Casalini en Amerikaanse universiteiten) – platform om linked data te gebruiken in een productie-omgeving van bibliotheken.
  • FOLIO van Open Library Foundation – open source platform voor innovatie in bibliotheken.

U kunt hieronder reageren of een vraag stellen.

Catalogiseren in het linked data-tijdperk #4

RDA: internationale standaard

RDA is ontwikkeld vanuit de Anglo-Amerikaanse traditie, maar door wereldwijde input wordt RDA steeds meer een internationale contentstandaard. En dat is ook precies wat de RDA Board voor ogen staat.

Vertalingen

RDA is reeds beschikbaar in het Engels, Frans, Spaans, Catalaans, Italiaans, Noors, Fins, Hongaars en Arabisch. Er wordt nog gewerkt aan Hebreeuws en Hongaars. In december 2020 is de nieuwe Engelse tekst van de RDA Toolkit online gekomen. Deze nieuwe versie is nu beschikbaar in het Engels, Noors en Fins. De andere talen volgen zodra ze klaar zijn.

Bij de invoering van de standaard in Nederland in 2014 is besloten geen Nederlandse vertaling te maken. Aanvankelijk was het alleen mogelijk de volledige RDA Toolkit te vertalen. Sinds 2016 is het echter ook een optie om alleen de data-elementen en hun definities te vertalen. Dit wordt de RDA Reference Set genoemd.

Voorbeelden uit het vocabulaire Type Content.

Deze RDA Reference Set is inmiddels (gedeeltelijk) beschikbaar in meerdere talen, waaronder het Nederlands, Duits, Deens, Grieks, Ests en Lets. Er zijn voorbereidingen voor het Hebreeuws, Oekraïens, Portugees, Slowaaks, Zweeds en Vietnamees. De Reference Set zal in alle genoemde talen openbaar gepubliceerd worden in de RDA Registry, en is daarmee beschikbaar voor ontwikkelaars van bibliotheeksoftware. In de werkgroep Translations leren de diverse vertaalteams van elkaar en worden voorstellen gedaan om RDA nog minder Anglo-centrisch te maken.

Community resources

Inmiddels zijn diverse specifiek Anglo-Amerikaanse instructies geïdentificeerd en sinds april 2021 staan die niet meer in de officiële RDA. Ze zijn verplaatst naar het “Community resources” gedeelte van de RDA Toolkit, waarin content staat die weliswaar aan RDA voldoet, maar zich richt op een specifieke taal en/of gemeenschap en daardoor geen internationale geldigheid heeft. Het betreft bijvoorbeeld instructies voor het formuleren van ingangen. RDA schrijft die niet langer voor, maar laat het aan de communities over daar regels voor op te stellen. Ook richtlijnen voor de transcriptie van bijvoorbeeld Cyrillisch of Arabisch schrift naar Latijns schrift vallen hieronder.

Naast deze zogeheten community refinements bevat dit gedeelte van de RDA Toolkit ook community vocabularies. Je vindt daar, per taal geordend, uiteenlopende lijsten met afkortingen en termen, zoals bijvoorbeeld Terms for Books of the Bible in English en Terms for medium of performance in English. De Nederlandse RDA-Commissie heeft de lijsten uit Fobid ISBD voor Bijbelboeken en Medium van uitvoering (instrumentatie) inmiddels ook voorbereid om als vocabulaire in RDA-records te gebruiken.

Meer informatie

U kunt hieronder reageren of een vraag stellen.

Catalogiseren in het linked data-tijdperk #3

RDA omschrijft zichzelf als “een pakket van data-elementen, richtlijnen en instructies voor het maken van metadata voor bibliotheken en erfgoedinstellingen”. Vergeleken met de oorspronkelijke RDA is de nieuwe RDA Toolkit veel meer een data dictionary geworden.

Data-elementen in de nieuwe RDA Toolkit

Voor titelbeschrijvers zal het wel even wennen zijn: in plaats van een regelwerk dat in grote lijnen het catalogiseerproces volgt, ligt er nu een standaard waarin de richtlijnen en instructies gegroepeerd zijn per data-element.

Ieder data-element in de Toolkit (er zijn er meer dan 3000) is op dezelfde manier gedocumenteerd. De Toolkit-pagina begint met 1] de definitie en afbakening van het element, daarna volgen 2] een overzicht met “technische gegevens” (de zogeheten element reference), 3] instructies voor het vastleggen van informatie in het data-element, 4] eventueel een voorbeeld waarin het element in context wordt getoond en 5] een overzicht met verwante elementen.

1) De definitie wordt, net als enkele andere onderdelen van de pagina, opgehaald uit de RDA Registry, waar linked data-representaties van de elementen en vocabulaires uit RDA beschikbaar zijn. Deze informatie is in verschillende talen verkrijgbaar, waaronder het Nederlands, en zonder abonnement te benaderen. Software-ontwikkelaars kunnen de gegevens daardoor gebruiken in bijvoorbeeld helpteksten of veldlabels.

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

2) De element reference bevat o.a. informatie over de entiteit waar het element bijhoort, de entiteit waar het element naar verwijst (het merendeel van de data-elementen is een relatie-element) en een mapping naar MARC 21.

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

3) Het volgende voorbeeld laat een (klein) deel zien van de instructies voor het vastleggen van de “hoofdtitel”:

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

4) Bij diverse data-elementen geeft de RDA Toolkit een uitgebreider voorbeeld, waarin het betreffende data-element wordt weergegeven in combinatie met een aantal andere data-elementen. Hieronder een voorbeeld bij het element “hoofdtitel”:

©2010-2021 – American Library Association, Canadian Federation of Library Associations,
en CILIP: Chartered Institute of Library and Information Professionals.

5) Verwante elementen zijn er in twee soorten. Allereerst heb je de omkeringen bij relatie-elementen. Wanneer er bijvoorbeeld een element “heeft auteur” is, dat van een werk naar een persoon verwijst, is er ook een element “is auteur van” gedefinieerd, dat van een persoon naar een werk verwijst. Daarnaast kun je te maken hebben met hiërarchie tussen elementen, vergelijkbaar met die tussen “broader terms” en “narrower terms” in een thesaurus. Zo is “maker” breder dan “auteur”, dat op zijn beurt weer breder is dan “librettist”.

Meer informatie

Wie de data-elementen in RDA wil verkennen kan de nieuwe RDA Toolkit raadplegen. Als korte introductie zijn de volgende RDA Concepts video’s van de RDA Toolkit aan te bevelen:

  • Elements – Uitleg van Kate James over de rol van elementen in RDA en de verschillende typen elementen in de nieuwe toolkit.
  • Domain and range – Kate James legt uit hoe de begrippen “domein” en “bereik” in RDA gebruikt worden voor relatie-elementen.
  • Element labels – Kate James geeft uitleg over naamgevingsconventies en alternatieve labels voor RDA-elementen.

Andere interessante bronnen zijn:

Schermafbeeldingen van de RDA Toolkit (www.rdatoolkit.org) zijn gebruikt met toestemming van de houders van het auteursrecht voor RDA (American Library Association, Canadian Federation of Library Associations, en CILIP: Chartered Institute of Library and Information Professionals).

U kunt hieronder reageren of een vraag stellen.

Catalogiseren in het linked data-tijdperk #1

Op 15 december 2020 is de nieuwe RDA Toolkit van kracht geworden. De oorspronkelijke RDA-richtlijnen zijn vervangen door “een pakket van data-elementen, richtlijnen en instructies voor het maken van metadata voor bibliotheken en erfgoedinstellingen, die voldoen aan internationale modellen voor gebruikersgerichte linked data-applicaties”.

Wat eraan vooraf ging

In 1996 heeft de IFLA alle lokale varianten van ISBD – waaronder de FOBID Regels voor de Titelbeschrijving – achterhaald verklaard. Nederland was in 2014 het zevende land dat Resource Description and Access (RDA) omarmde als content-standaard. De oorspronkelijke RDA Toolkit, het bijbehorende online hulpmiddel, bestaat inmiddels 10 jaar en is vanuit technologisch perspectief hoogbejaard. Tussen 2016 en 2019 hebben de makers van de Toolkit het hulpmiddel volledig opnieuw opgebouwd. Het fundament voor de nieuwe RDA Toolkit is het Library Reference Model (LRM) dat de IFLA in 2017 gepubliceerd heeft.

Welke onderwerpen zullen behandeld worden

Wat zijn de belangrijkste wijzigingen in de nieuwe RDA Toolkit? Wat is de achtergrond ervan? En wat betekenen de wijzigingen voor de catalogiseerpraktijk?

De komende tijd publiceert de RDA Commissie een reeks korte bijdragen over catalogiseren met RDA in het linked data-tijdperk. Aan bod komen o.a. de volgende onderwerpen:

  • Van FRBR naar LRM
  • Een pakket van data-elementen, richtlijnen en instructies
  • Internationale focus
  • Gebruikersgerichte linked data-applicaties
  • Nieuwe generatie bibliotheeksoftware
  • Breed inzetbaar
  • Breed toepasbaar

Meer informatie

Kijk voor een eerste kennismaking naar de officiële New RDA Toolkit Demo video.


Plaats desgewenst een reactie, of vraag, hieronder.

Community vocabularies

De oorspronkelijke tekst van RDA was gebaseerd op de Anglo American Cataloguing Rules, en in het belang van internationale harmonisering zou de contentstandaard ontdaan moeten worden van vooringenomenheid ten opzichte van de westerse cultuur. Niet elke taal gebruikt woorden, dus je kan niet voorschrijven om bepaalde woorden af te korten. Niet elk land heeft een geautoriseerde versie van de Bijbel (dat zou in Nederland de Statenvertaling kunnen zijn), dus een instructie om de verkorte titel van een Bijbelboek te gebruiken conform de geautoriseerde versie is niet bruikbaar. Ook zijn bezwaren geopperd tegen de indeling van personen als enkel Vrouw of Man.

Bij de nieuwe versie van de RDA Toolkit, die op 15 december verwacht wordt, zijn al deze cultuurafhankelijke vocabulaires daarom verwijderd uit de hoofdtekst en verplaatst naar een apart onderdeel Community vocabularies (termen die in een beperkte metadatagemeenschap gebruikt worden). De naamgeving en de plaats binnen de Toolkit kunnen nog veranderen, maar de RDA Steering Committee heeft de wens uitgesproken dat de sectie Community vocabularies opengesteld wordt voor alle gemeenschappen, ongeacht of het applicatieprofiel onderdeel uitmaakt van de Toolkit. Voor Nederland is in het verleden werk gemaakt van een lijst Soortnamen voor muziekinstrumenten en Bijbelboeken, en deze zouden geëvalueerd kunnen worden voor opname in de RDA Toolkit als de nieuwe plaats duidelijk is.

RDA in het Nederlands?

RDA is werkelijk een wereldwijde contentstandaard, en de RDA Toolkit is reeds beschikbaar in het Engels, Frans, Duits, Spaans, Catalaans, Italiaans, Noors, Fins en binnenkort Chinees.

De werkgroep die zich in 2011 heeft gebogen over het invoeren van RDA in Nederland en Vlaanderen, heeft (helaas) moeten concluderen dat het niet haalbaar is om de volledige RDA Toolkit in het Nederlands te vertalen, omdat we de middelen niet hebben om een dergelijk omvangrijk werk en de jaarlijkse updates bij te houden.

In 2016 heeft de RSC echter de mogelijkheid geboden om niet alleen de hele Toolkit te vertalen, maar in plaats daarvan de RDA Reference set. Het gaat dan om de terminologie met bijbehorende definities in het Nederlands, veldnamen en keuzelijsten voor klassieke systemen en bijbehorende links en identificaties voor linked data systemen.

De FOBID RDA Commissie heeft het vocabulaire nu vertaald, en beschikbaar gesteld via RDAregistry.org. De komende tijd zullen we ons ook inspannen om ook alle beschrijvingselementen te vertalen.