Skip to content

Algemene informatie

keestrautwein edited this page Dec 15, 2021 · 28 revisions

Deze pagina bevat algemene uitgangspunten zodat die niet telkens herhaald hoeven te worden op andere plaatsen. Voorlopig wordt er veel informatie op deze pagina verzameld, die wellicht nog anders kan worden geordend.

Best Practices

Catalogrecord: Bijhouden wijzigingen

Zie Issue #16 : Openstaande vraag: In welke gevallen is het nuttig om om een Catalog record aan te maken van iedere wijziging?

Met het Catalogrecord worden wijzigingen bijgehouden van resources zoals Catalog, Dataset en Dataservice. Dit kan zowel een wijziging in de gegevens van een Dataservice betreffen, als een wijzigingen in de DCAT gegevens zelf, zoals de wijzigingen van een titel. Omdat iedere Catalogrecord een datum van wijziging heeft, kan hierbij een complete administratie van alle wijzigingen op een DCAT element worden bijgehouden.

Merk op dat de laatste wijziging bijgehouden wordt bij alle classes, zowel in Catalog, Dataset en Dataservice als in Distribution met dct:modified. (Zie onder)

Opbouw DCAT

Vereenvoudigd diagram samenhang DCAT klassen

Vereenvoudigd diagram samenhang DCAT klassen

DCAT wordt gebruikt om een gegevensverzameling te beschrijven die door een partij wordt aangeboden. Indien de gegevens als een bestand worden aangeboden, wordt de informatie daarover in een Distribution vastgelegd. Indien de informatie met behulp van queries bevraagd kan worden definiëren we in DCAT een Dataservice aan.

Een Dataservice kan op zichzelf staan, maar een Distribution maakt altijd deel uit van een Dataset. Een Dataset beschrijft algemene informatie over de gegevens in één of meer Distributies en over de beschrijvingen van de Distributies. Een 'Dataset kan behalve 'Distributies ook één of meer Dataservices bevatten. Een Dataset organiseert verschillende Distributies en Dataservices die over dezelfde gegevens gaan. De aanbieder van de gegevens bepaalt volgens welke criteria deze distributies en data services bij elkaar horen.

Indien er veel Datasets zijn, kunnen die gegroepeerd worden met behulp van een Catalog. Meerdere Catalogs kunnen in een andere Catalog verzameld worden.

Dezelfde eigenschap op meerdere plaatsen

Er zijn verschillende eigenschappen die op verschillende niveaus voorkomen. Hieronder wordt gedefinieerd hoe hiermee om te gaan.

Als algemene regel gaan we er van uit dat specifiekere instellingen voorrang hebben over die er boven. Dus een property van een Distribution beschrijft de gegevens in de distributie, terwijl dezelfde eigenschap in een Dataset slechts betekent dat deze eigenschap kan voorkomen bij een Distributie of Dataservice uit de Dataset

Verder kan een eigenschap op een hoger niveau nooit in tegenspraak zijn met die op een lager. Het mag bijvoorbeeld niet voorkomen dat de licentie van een Distributie "Open" is, maar die van de Dataset erboven "gesloten.

Daaruit volgt dat properties meerdere keren kunnen voorkomen om daarmee alle resources en distributies daaronder te beschrijven. Als er verschillende talen voorkomen verspreid over een aantal Datasets, dan zal de Catalog waarin al deze Datasets voorkomen, iedere waarde van dct:language ook bevatten.

Property Catalog Dataset Dataservice Distribution
release date - - - W
update/modification date W W W W
frequency - WE - -
dct: access rights / Licence /rights / has policy W W W W
dct:theme W W W -
dcat:keyword W W W -
dct:language W W - -

Wijzigingen aangeven

Er zijn drie eigenschappen die aangeven wanneer een verandering heeft plast gevonden: release date, update/modification date en frequency. dct:modified

release date

Type: dct:issued, een subproperty van xsd:Datetime stamp.

Release date is een optionele eigenschap die alleen voor Distributies bestaat. Hiermee wordt aangegeven wanneer deze voor het eerst werd aangeboden. Deze waarde wordt eenmalig ingesteld en daarna niet meer gewijzigd zolang de Distributie blijft bestaan, behalve om een fout te verbeteren.

frequency

De eigenschap frequency bestaat alleen voor een Dataset en geeft aan hoe vaak de Dataset worden gepubliceerd. Deze waarde moet gelezen worden in aanvulling op de update/modification date. Als er veelvuldige en regelmatige wijzigingen zijn aan de Dataset hoeft de update/modification date niet telkens gewijzigd te worden, maar volstaat het de frequency eigenschap goed in te vullen.

VRAAG Waarom is frequency gedefinieerd op het niveau van Dataset en niet op het niveau van Distribution. Het is eenvoudig om een scenario te zien waarbij verschillende verwachten op het niveau van de Distributie omdat dezelfde Dataset meerdere Distributies kan hebben met verschillende frequenties.

update/modification date

Deze waarde legt vast wanneer de laatste wijziging is geweest op de informatie. Het is belangrijk goed te definiëren welke wijzigingen door welke eigenschap worden vastgelegd, omdat zowel de gegevens zelf als de DCAT beschrijving kunnen wijzigen.

Tijdzones

Met DCAT worden gegevensverzamelingen gesynchroniseerd ook over landen heen, met name binnen de EU. Omdat landen in verschillende tijdzones liggen, kunnen er synchronisatie problemen optreden als datum en tijd gegevens zonder tijdzone worden uitgewisseld. Dezelfde problemen kunnen optreden als gegevens verzameld tijdens zomertijd worden vergeleken met die uit wintertijd. In alle tijden, datums en periodes types in DCAT is ruimte om de tijdzone aan te geven.

Echter voor de meest toepassingen is een verschil van één of twee uur niet significant, waardoor het probleem niet vaak speelt, Dit wordt versterkt doordat de tijdzones in de EU liggen dicht tegen elkaar aan liggen. Is systemen waar de overgang van winter- naar zomertijd en v.v. speelt, zijn meestal al oplossingen geïmplementeerd.

Impliciete tijdzone

Als er geen tijdzone wordt meegegeven met gegevens, betekent dit dat er wordt uitgegaan van een "impliciete" tijdzone, namelijk die van het verwerkende systeem. Dat zal vaak de tijd zijn die het verwerkende systeem hanteert. Helaas kan deze systeemtijd in verschillende systemen anders kan zijn zonder dat externe partijen weten welke tijd wordt gehanteerd.

Aanbevolen

Het verdient daarom aanbeveling om datum en tijd informatie zoveel mogelijk inclusief de tijdzone uit te wisselen. Indien het systeem hiervoor geen mogelijkheid biedt, bijvoorbeeld omdat de gebruikersinterface deze mogelijkheid niet biedt, dan moeten deze "impliciete" tijdzone bij voorkeur wel in DCAT worden opgenomen.

Gebruik van talen

Clone this wiki locally