Skip to content

Distribution

keestrautwein edited this page Dec 14, 2021 · 63 revisions

Class: Distribution

Een distributie beschrijft hoe een specifieke representatie van een dataset kan worden verkregen. Meestal betreft het hier een downloadable bestand.

De aanbieder van een dataset kan de gegevens aanbieden in meerdere verschillende formaten en/of samenstellingen die zijn afgestemd op de behoeften van afnemers. Deze worden elk als afzonderlijke distributies beschreven en gerelateerd aan de dataset. Als een dataset (ook) wordt aangeboden in de vorm van een dataservice, dan worden hierover aanvullende gegevens opgenomen in een voorkomen van de klasse DataService en gerelateerd aan de bijbehorende distributie.

De eigenschappen worden hieronder beschreven.

Property: title

Deze eigenschap bevat de titel van de distributie.

RDF Property: dct:title
Bereik rdfs:Literal
Cardinaliteit 1..1, Verplicht
Opmerking De titel is belangrijk voor de herkenbaarheid van een distributie, dus kies deze zorgvuldig. Voor iedere taal kan één aparte titel worden opgenomen per taal aangeduid een "language tag" achter de literal. Merk op dat er een dct:language, zie hieronder, setting moet zijn voor iedere taal.
XXX: uitwerken waar de dct:language waarde voor deze meta-data wordt ingesteld en waar de taal van de inhoud van de dataset
DONL De titel wordt slechts in een taal opgenomen. Deze taal wordt aangegeven in eigenschap dct:language van de dataset.

Property: description

Deze eigenschap bevat een beschrijving van de distributie in aanvulling op de titel waarmee gebruikers een goed beeld krijgen welke gegevens in de Distributie aanwezig zijn.

RDF Property: dct:description
Bereik rdfs:Literal
Cardinaliteit 1..1, Verplicht
Opmerking De beschrijving is met de titel het belangrijkste waarmee een gebruiker een distributie kan beoordelen, dus kies deze zorgvuldig. Voor iedere taal kan één beschrijving worden opgenomen per taal aangeduid een "language tag" achter de literal.
Opmerking Voor overige informatie over de Distributie is de eigenschap Documentation beschikbaar, waarin naar aanvullende webpagina's verwezen wordt.
DONL De beschrijving wordt slechts in een taal opgenomen. Deze taal wordt aangegeven in eigenschap dct:language van de dataset.

Property: release date

Deze eigenschap bevat de datum waarop de data-eigenaar de distributie voor de eerste keer heeft gepubliceerd.

RDF Property: dct:issued
Bereik xsd:dateTime
Cardinaliteit 0..1, Optioneel
Opmerking De datum en tijd waarop deze dataset voor de eerste keer in de huidige vorm werd aangeboden. Dit veld biedt geen informatie over de wijzigingen van de gegevens sindsdien.
Opmerking Als tijd niet bekend is, kan hier de tijd 0:00 worden ingevuld.
DONL Als er geen tijdzone wordt opgegeven, gaat DONL uit van de Nederlandse tijd.

Property: update/modification date

De datum waarop de gegevens in de distributie of de metadata voor het laatst zijn gewijzigd.

Deze eigenschap bevat de datum waarop de data-eigenaar de distributie voor het laatst heeft gewijzigd. Dat geldt zowel voor een wijziging van de inhoud van de distributie als in de metadata van de distributie.

RDF Property: dct:modified
Bereik xsd:dateTime
Cardinaliteit 0..1, Aanbevolen
Opmerking Bij de eerstvolgende wijziging wordt de oude wijzigingsdatum overschreven.
Opmerking Als de gegevens automatisch kort na elkaar worden aangepast hoeft deze waarde niet telkens gewijzigd te worden. Gebruikers kunnen dan uitgaan van de frequency waarde.
Vraag De wijzigingsdatum is een belangrijk gegeven om enig inzicht te krijgen in de actualiteit van de gegevens in de distributie. Is het beter om dit gegeven verplicht te maken? Zie Issue #4

Property: license

Deze eigenschap beschrijft de formele of wettelijke toestemming waaronder de gegevens in de distributie gebruikt mogen worden.

RDF Property: dct:license
Bereik Waardelijst donl:License, zie https://waardelijsten.dcat-ap-donl.nl/donl_license.json
Cardinaliteit 1..1, Verplicht
Opmerking 1 Licenties kunnen complex zijn, wat uitwerking en invulling van dit veld kan bemoeilijken. De licenties van toepassing op gegevensuitwisseling binnen de overheid zijn meestal vrij eenvoudig. Om die reden is gekozen voor een waardelijst die een aantal eenvoudige licenties bevat die met name naar de Creative Commons licenties verwezen. Zie ook https://creativecommons.nl/uitleg/.
Opmerking 2 Als de gegevens in de distribution niet open zijn, moet worden gekozen voor de waarde "Geen open licentie".
Opmerking 3 Er kunnen ook licentie gegevens op het niveau van de Dataset worden vastgelegd. Die mogen niet in tegenspraak zijn met de licenties van de Distributies.

Property: access rights

Deze eigenschap beschrijft de toegangsrechten tot de distributie. Net als bij de properties dct:license of dct:rightskan ook de Dataset van de Distributie access rights vastleggen, die niet in tegenspraak mogen zijn met die van de Distributies.

RDF Property: dct:accessRights
Bereik Waardelijst Overheid:Openbaarheidsniveau, zie https://waardelijsten.dcat-ap-donl.nl/overheid_openbaarheidsniveau.json
Cardinaliteit 0..1, Aanbevolen
Opmerking Omdat binnen de Nederlandse en Europses overheid de toegangsrechten slechts in beperkte variatie voorkomen en omdat complexe toegangsrechten beschrijven veel werk is, gebruiken we de eenvoudige waardelijst van DCAT-AP-EU, https://op.europa.eu/en/web/eu-vocabularies/concept-scheme/-/resource?uri=http://publications.europa.eu/resource/authority/access-right
Vraag Is het nodig om naast eigenschap dct:accessRights in de dataset ook een eigenschap op te nemen in de distribution? Zie Issue #6.

Property: rights

Deze eigenschap beschrijft de overige gebruiksrechten die niet worden gedekt met dct:license of dct:accessRights, zoals de copyright statements. Net als bij deze properties kan ook de Dataset van de Distributie rights vastleggen, die niet in tegenspraak mogen zijn met die van de Distributies.

RDF Property: dct:rights
Bereik xsd:string
Cardinaliteit 0..1, Optioneel
Opmerking

Property: has policy

De eigenschappen access rights, rights en license beschrijven de gebruiks- en toegangsrechten. Om de afspraken over het gebruik van data tussen aanbieder en vrager/eindgebruiker uitgebreider te beschrijven heeft W3C de standarad Open Digital Rights Language (ODRL) ontwikkeld.

De has policy eigenschap verwijst naar een instantie van de ODRL klasse, waarin gebruikscondities van de data zijn vastgelegd in een machineleesbare vorm.

RDF Property: odrl:hasPolicy
Bereik odrl:Policy
Cardinaliteit 0..1, Optioneel
Opmerking Deze eigenschap is onderwerp van een uitbreidingen voor data.overheid.nl die nog verder moet worden uitgewerkt.
Vraag Zie Issue #7.

Property: access URL

Deze eigenschap bevat het web-adres (URL) van de site die toegang verschaft tot de data, aan de hand van bijvoorbeeld een webformulier, een zoekopdracht of een API-call. Als op deze URL de gegevens beschreven door deze distributie direct te downloaden zijn, dan is de waarde van deze URL gelijk aan die in dcat:downloadURL.

Deze eigenschap zorgt ook voor backwards compatibiliteit met DCAT Version 1. In DCAT versie 1 was er geen Data Service gedefinieerd, maar werden die in een Distribution aangegeven met deze eigenschap access URL.

RDF Property: dcat:accessURL
Bereik xsd:anyURI
Cardinaliteit 0..1, Aanbevolen <- DIT IS IN HET AP PROFILE EEN VERPLICHTE PROPERTY
Opmerking 1 Deze eigenschap moet niet worden verward met dcat:downloadURL. Deze eigenschap verwijst direct naar de locatie om de data te downloaden.
Opmerking 2 If the distribution(s) are accessible only through a landing page (i.e. direct download URLs are not known), then the landing page URL associated with the dcat:Dataset SHOULD be duplicated as access URL on a distribution.

Property: access service

Deze eigenschap is alleen van toepassing wanneer de distributie via een dataservice bereikbaar is. De dataservice biedt dan toegang tot het bestand of de bestanden van deze distributie. Access service wordt niet ingevuld als de toegang tot de distributie niet via een Dataservice verloopt. Merk op dat een Dataservice die geen Distribution aanbiedt, dat wil zeggen complete bestanden, ook geen Distribution gedefinieerd kan hebben.

RDF Property: dcat:accessService
Bereik dcat:DataService
Cardinaliteit 0..1, Aanbevolen
Opmerking Deze eigenschap is nieuw in DCAT2 en biedt aanbieders van datasets de mogelijkheid om extra informatie te verstrekken over datasets die via een dataservice wordt aangeboden. In DCAT1 bood eigenschap dcat:accessURL de mogelijkheid om te verwijzen naar de locatie van de webservice. Deze eigenschap blijft beschikbaar in DCAT 2, zodat het backwards compatible blijft met DCAT 1.

Property: download URL

Deze eigenschap bevat de URL waarmee eindgebruikers het bestand kunnen downloaden in een van de beschikbare formaten. Dit formaat wordt aangegeven in de distributie in eigenschap dct:format en/of dcat:mediaType.

RDF Property: dcat:downloadURL
Bereik xsd:anyURI
Cardinaliteit 0..1, Aanbevolen

Property: byte size

De omvang van de distributie (het feitelijke bestand) in bytes

RDF Property: dcat:byteSize
Bereik xsd:decimal
Cardinaliteit 0..1, Aanbevolen

Property: spatial resolution

Deze eigenschap geeft een indicatie van het geografische detailniveau in meters van de gegevens in de distributie.

RDF Property: dcat:spatialResolutionInMeters
Bereik xsd:decimal
Cardinaliteit 0..1, Optioneel
Opmerking 1 Deze eigenschap komt ook voor in dcat:Dataset.
DONL Deze eigenschap wordt niet overgenomen in het toepassingsprofiel van data.overheid.nl.

Property: temporal resolution

Deze eigenschap beschrijft de kleinste periode tussen twee data-items in de distributie.

RDF Property: dcat:temporalResolution
Bereik xsd:duration
Cardinaliteit 0..1, Optioneel
Opmerking 1 Deze eigenschap komt ook voor in dcat:Dataset.
DONL Deze eigenschap wordt niet overgenomen in het toepassingsprofiel van data.overheid.nl.

Property: conforms to, linked schemas

Deze eigenschap verwijst naar een vastgestelde standaard waaraan de data in de distributie voldoet. Deze property kan meerdere keren voorkomen.

RDF Property: dct:conformsTo
Bereik Waardelijst <- LIJKT ME MOEILIJK OM MET (MEERDERE) WAARDELIJSTEN DEKKEND TE ZIJN.
Cardinaliteit 0..1, Aanbevolen
Opmerking De gebruikte standaard kan heel divers zijn en verschillen per context. Denk bijvoorbeeld aan een standaard die beschrijft hoe de gegevens in de dataset zijn verzameld. Of aan een standaard hoe de gegevens zijn gecodeerd. Of hoe de gegevens in een model passen. of welke representatie of view deze gegevens van het geheel bevatten, etcetera.
Opmerking Merk op dat het technisch formaat van de gegevens of het media type elders worden vastgelegd.

Property: media type

Deze eigenschap bevat informatie over de bestandsindeling (of MIME type) van de distributie, volgens de indeling van IANA [IANA-MEDIA-TYPES].

RDF Property: dcat:mediaType
Bereik Waardelijst iana:Mediatypes, zie https://waardelijsten.dcat-ap-donl.nl/iana_mediatypes.json
Cardinaliteit 0..1, Aanbevolen
Zie ook dct:format.
Opmerking Afstemmen met Willem, omdat zijn opmerking afwijkt van die in DCAT2.
Opmerking Het kiezen van een media-type uit de lijst heeft zeer de voorkeur boven het kiezen van een eigen waarde met behulp van dct:format. De waardelijst is zeer lang en behoorlijk volledig.
Vraag Zie Issue #8.

Property: format

Deze eigenschap bevat informatie over het bestandsformaat van de distributie volgens de indeling van het publicatiebureau van de EU.

RDF Property: dct:format
Bereik Waardelijst mdr:Filetype, zie https://waardelijsten.dcat-ap-donl.nl/mdr_filetype_nal.json
Cardinaliteit 0..1, Optioneel
Zie ook dct:mediaType. Eigenschap dcat:mediaType heeft de voorkeur boven dct:format.
Opmerking Afstemmen met Willem, omdat zijn opmerking afwijkt van die in DCAT2.
Vraag Zie Issue #8.

Property: compression format

De Distributie kan zijn gecomprimeerd om de omvang van het bestand te verminderen. In dat geval specificeert edze eigenschap het compressie-formaat dat is toegepast.

RDF Property: dcat:compressFormat
DONL Deze eigenschap wordt niet overgenomen in het toepassingsprofiel van data.overheid.nl.
Vraag Zie Issue #9.

Property: packaging format

Deze eigenschap is van toepassing op distributies van datasets die zijn samengesteld uit meerdere bestanden en vervolgens worden gebundeld in bijvoorbeeld een zip-bestand. Als dit het geval is, geeft deze eigenschap het media type van het pakket.

RDF Property: dcat:packageFormat
Bereik Waardelijst iana:Mediatypes, zie https://waardelijsten.dcat-ap-donl.nl/iana_mediatypes.json
Opmerking Deze eigenschap wordt niet opgenomen in het toepassingsprofiel van data.overheid.nl, omdat het in praktijk niet voorkomt.
Vraag Zie Issue #9.

Property: availability

Deze eigenschap geeft aan hoe lang de distributie beschikbaar zal blijven.

http://data.europa.eu/r5r/availability/1.0:

  • temporary: Data can disappear at any time, no planning.
  • experimental: Data is available on a trial basis, the expected availability is roughly a year.
  • available: Data is available for a few years, medium term planning.
  • stable: Data will remain available in the long term.
RDF Property: dcatap:availability
Bereik Waardelijst bestaande uit de volgende waarden: temporary, experimental, available, stable.
Opmerking 1 Deze property is specifiek voor DCAT-AP-EU en komt niet voor in DCAT2.
DONL Deze eigenschap wordt niet opgenomen in het toepassingsprofiel van data.overheid.nl.

Property: checksum

Met een checksum of controlegetal kan een afnemer eenvoudig vaststellen of een gedownload bestand identiek is aan het aangeboden bestand (en dus niet tussentijds is gewijzigd). Deze eigenschap bevat de uitkomst van de checksum of controlegetal die de bronhouder heeft berekend over de inhoud van het data-bestand in de distributie. Wanneer afnemers deze checkum zelf ook berekenen, nadat ze het bestand hebben gedownload, kunnen zij met behoorlijke zekerheid vaststellen dat zij het originele bestand hebben gedownload, door de checksums met elkaar te vergelijken. Deze moeten aan elkaar gelijk zijn.

RDF Property: spdx:checksum
Bereik spdx:Checksum
Cardinaliteit 0..1, Optioneel
Opmerking 1 Deze property is specifiek voor DCAT-AP-EU en wordt geïntroduceerd in DCAT3. Hierover was in de werkgroep wel discussie, omdat het niet wordt gebruikt. Zie https://github.com/SEMICeu/DCAT-AP/issues/24 op SEMICeu/DCAT-AP.
Opmerking 2 De spdx:Checksum klasse bevat naast de berekende checksum-waarde ook een property die het gebruikte algoritme aangeeft. Op dit moment ondersteunt DCAT-AP-EU alleen SHA1 (spdx:checksumAlgorithm_sha1).
Vraag Zie Issue #10.

Property: documentation

Deze eigenschap verwijst naar een informatiepagina waar aanvullende informatie over deze distributie te vinden is.

RDF Property: foaf:page
Bereik xsd:anyURI
Cardinaliteit 0..n, Optioneel
Opmerking Deze property is specifiek voor DCAT-AP-EU.
Opmerking Merk dat er ook een Description eigenschap is, waarin de inhoud van de Distributie wordt beschreven in dit profiel. Op de Documentation pagina of pagina's wordt met name informatie vastgelegd, die niet op de Description pagina thuis hoort. Denk aan hoe de gegevens geïnterpreteerd moeten worden, een beschrijving van het formaat van de gegevens of hoe de gegevens verkregen kunnen worden.

Property: language

Deze eigenschap beschrijft de natuurlijke taal van gegevens in de distributie. Als er meerdere talen voorkomen in de Distributie wordt deze eigenschap herhaald zodat alle talen genoemd worden.

RDF Property: dct:language
Bereik Waardelijst
Opmerking Deze property is specifiek voor DCAT-AP-EU en komt niet voor bij Distribution in de W3C specificatie. Zie Issue #11. Toegestane waardes zijn URI's met een tweeletterige code afkomstig uit http://id.loc.gov/vocabulary/iso639-1/ of indien de code daarin niet bestaat, een drie-letterige code uit http://id.loc.gov/vocabulary/iso639-2/
Opmerking Als in de Distributie meerdere talen zijn opgenomen, komt deze waarde meerdere keren voor totdat alle talen zijn opgesomd.

Property: status

Deze eigenschap beschrijft de toestand van de gegevens in de distributie. Deze moet een van de volgende waarden bevatten: afgerond, verouderd, in ontwikkeling of ingetrokken.

RDF Property: adms:status
Bereik Waardelijst adms:DistributieStatus, zie https://waardelijsten.dcat-ap-donl.nl/adms_distributiestatus.json
Opmerking Deze property is specifiek voor DCAT-AP-EU.

Property: distribution type

Deze eigenschap is specifiek voor data.overheid.nl. Het is bedoelt om verschillende soorten distributies te onderscheiden, aan de hand van mogelijke typen in een waardelijst. Voorbeelden hiervan zijn: Data schema, Documentatie, Downloadbaar bestand, Visualisatie, of Webservice.

RDF Property: donl:distributionType
Bereik Waardelijst donl:DistributionType, zie https://waardelijsten.dcat-ap-donl.nl/donl_distributiontype.json
Cardinaliteit 1..1, Verplicht, default waarde is Downloadbaar bestand.
Opmerking De waarde Webservice kan vervallen, omdat DCAT 2 hiervoor de nieuwe klasse DataService heeft geïntroduceerd.
Vraag Is dit een eigenschap die partijen willen uitwisselen? M.a.w. moet deze worden opgenomen in het toepassingsprofiel? Zie Issue #12
DONL Deze eigenschap is speciaal voor data.overheid.nl toegevoegd.