Insights & Data Blog

Insights & Data Blog

Meningen op deze blog weerspiegelen de opvattingen van de schrijver en niet per definitie die van de Capgemini Group

De juiste metadata voor uw documenten

Documenten beheren zonder metadata is onmogelijk. Een verzameling documenten zonder metadata is bijna te vergelijken met een stapel oud papier: een berg documenten die nauwelijks te doorzoeken en te beheren is. Om optimaal beheer mogelijk te maken moeten de documenten in een ECM-systeem worden voorzien van de juiste metadata.
 
Metadatering van documenten
Metadata voor documenten in een ECM-systeem kunnen worden beschouwd als labels die zijn toegevoegd aan documenten. Op de labels zijn gegevens over de documenten vastgelegd. Metadatering wordt daarom soms ook wel ‘tagging’ genoemd.
 
 
 
Metadatering van documenten hangt nauw samen met classificatie (ordening) van documenten waarover ik in mijn vorige blog post heb geschreven. De plaats van een document in een classificatieschema is in feite ook een metagegeven van het document.
 
Niet alleen om te kunnen zoeken
Metadata zijn niet alleen maar kenmerken waarmee documenten teruggevonden kunnen worden. Een systeem voor document- of archiefbeheer is immers veel meer dan een zoekmachine voor documenten. Metadata maken onder meer het volgende mogelijk:
  • Terugvinden van documenten (met metadata als onderwerp, auteur en datum)
  • Interpreteren van documenten (met metadata als titel, onderwerp en samenvatting)
  • Beheren van documenten (met metadata als bewaartermijn, autorisatie en bestandsformaat)

Onderscheid in soorten metadata
Bij metadata voor documenten in een ECM-systeem kan onderscheid worden gemaakt tussen metadata die door het systeem worden vastgelegd (systeemmetadata) en metadata die door gebruikers worden vastgelegd.
 
Elk ECM-systeem genereert systeemmetadata, zoals de datum en het tijdstip waarop een document in het systeem is opgenomen, de bestandsgrootte van het document en de inlognaam van de gebruiker die het document in het systeem heeft opgenomen. Systeemmetadata zijn door gebruikers niet te wijzigen. Onder de systeemmetadata vallen ook de loggegevens, gegevens die het systeem kan bijhouden van handelingen die met een document zijn uitgevoerd (opvragen, wijzigen, verwijderen enz.) en die samen een audit-trail kunnen vormen.
 
Elk ECM-systeem biedt ook de mogelijkheid om door gebruikers invulbare metadatavelden aan het systeem toe te voegen. Sommige systemen hebben standaard al een groot aantal van dergelijke metadatavelden. In bijvoorbeeld een RMA (recordsmanagementapplicatie) die is gecertificeerd voor de DoD 5015.2-STD, de internationaal geaccepteerde standaard voor software voor records management, zijn alle metadatavelden opgenomen die deze standaard voorschrijft.
 
Standaarden voor metadata
Voor metadata voor documenten bestaan zeer veel verschillende standaarden. Een veel gebruikte standaard is de Dublin Core, een set van 15 basale metadata-elementen zoals Title, Creator, Subject en Description. Deze 15 basale metadata-elementen kunnen worden uitgebreid en verfijnd met een beperkt aantal aanvullende metadata-elementen.

De belangrijkste standaard voor metadata van archiefwaardige documenten (archiefbescheiden oftewel ‘records’) is de ISO 23081. De ISO 23081 bestaat uit drie delen. Deel 1 beschrijft algemene principes, zoals de verschillende voordelen en soorten van metadata voor archiefbescheiden. Deel 2 gaat in op zaken rondom de implementatie van een metadataschema voor archiefbescheiden. Deel 3 biedt een leidraad voor een self assessment op metadata voor archiefbescheiden.
 
In artikel 19 van de Archiefregeling (een onderdeel van de archiefwetgeving) staat dat overheidsorganen een metadataschema zoals bedoeld in de ISO 23081 moeten vastleggen ten behoeve van permanent te bewaren archiefbescheiden. Zo’n metadataschema op basis van de ISO 23081 is uitgewerkt in de Richtlijn Metagegevens Overheidsinformatie.
 
Tips voor het opstellen van een metadataschema
Het opstellen van een metadataschema voor documenten in een ECM-systeem wordt vaak uitgevoerd door een informatie- of ECM-specialist. Deze kan gebruikmaken van een of meer standaarden voor metadata en de inbreng van de toekomstige gebruikers van het ECM-systeem. Omdat alle gebruikers van het ECM-systeem worden geconfronteerd met metadatavelden die zij moeten invullen (als zij documenten in het systeem opnemen) of in ieder geval moeten gebruiken (als zij documenten zoeken) heeft elke gebruiker wel zijn eigen ideeën over het metadataschema. Bij het opstellen van een metadataschema is het vooral de kunst om een evenwicht te vinden tussen de visies en de voorkeuren van de verschillende soorten gebruikers. Daarbij kunnen de drie algemene tips worden toegepast die ik in mijn vorige blog post al voor een goede classificatie heb gegeven: houd het eenvoudig, houd het doel voor ogen, en schakel zo nodig deskundige hulp in.
 
Tips voor de configuratie van metadatavelden
De ervaring leert dat niet alle gebruikers even consciëntieus zijn in het invullen van metadatavelden. Verder blijkt dat verschillende gebruikers - bijvoorbeeld vanwege een gebrek aan kennis - dezelfde metadatavelden vaak met verschillende waarden vullen. Hieronder geef ik een aantal tips voor een efficiënte configuratie van metadatavelden die ertoe kan bijdragen dat metadatavelden zo goed mogelijk worden ingevuld terwijl tegelijkertijd de inspanning voor de gebruikers wordt geminimaliseerd:
  • Automatische invulling: Laat indien mogelijk het systeem de metadatavelden invullen.
  • Standaardwaarden: Gebruik zoveel mogelijk standaardwaarden (‘default values’) voor metadatavelden.
  • Verplichte metadatavelden: Maak essentiële metadatavelden verplicht zodat de gebruikers gedwongen worden ze in te vullen.
  • Keuzelijstjes: Gebruik keuzelijstjes voor metadatavelden en vergeet daarbij niet de kwaliteitseisen voor een goede classificatie, zoals de eenheid van verdelingskarakteristiek.
  • Validaties: Gebruik validaties voor metadatavelden om het invullen van ongeldige waarden te voorkomen (bijv. voor een veld waarin een postcode moet worden ingevuld).
  • Afgedwongen vorm: Dwing de vorm voor de waarde die moet worden ingevuld af (bijv. DD-MM-JJJJ voor een datum).
  • Metadata voor een set documenten: Leg metadata die gelden voor een hele set van documenten (bijv. een dossier) indien mogelijk alleen vast op het niveau van die set of laat ze anders automatisch overerven door de documenten in de set. 

Over de auteur

Sjef Philippi
Sjef Philippi
Als ECM consultant help ik klanten om hun digitaal document- en archiefbeheer te optimaliseren. Ik heb jarenlange ervaring in de overheidssector en daarbuiten en ruime kennis van de archiefwetgeving en de belangrijkste ECM-pakketten. Daarmee kan ik een brug slaan tussen de behoeften die klanten hebben en de steeds verder toenemende mogelijkheden die ECM-oplossingen bieden.

Plaats een reactie

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *.