Skip to content

Latest commit

 

History

History
790 lines (591 loc) · 49.4 KB

integrerende-gemeentes.md

File metadata and controls

790 lines (591 loc) · 49.4 KB

Inhoudsopgave

Inleiding

Dit document beschrijft hoe lokale besturen die een eigen oplossing hebben om producten en diensten te beheren, hun gepubliceerde productinformatie kunnen synchroniseren met de LPDC-module (Lokale Producten- en Dienstencatalogus) van de Vlaamse overheid. We noemen dat soort lokale overheden hieronder "integrerende gemeenten" (maar het kan evengoed een OCMW of nog een ander type bestuur zijn). De producten worden zichtbaar voor de gemeente in LPDC-module, maar zullen daar niet beheerd/aangepast kunnen worden (read-only). LPDC synchroniseert de producten automatisch naar IPDC (Interbestuurlijke Producten- en Dienstencatalogus).

Stroomdiagramma

Beschrijft op een hoog niveau de relevante datastromen tussen integrerende gemeente, LPDC en IPDC.

integrerende-gemeentes-stroomdiagramma.png

  1. IPDCv3: De interbestuurlijke producten en dienstencatalogus (IPDC) bevat producten en diensten van overheden in Vlaanderen. Dit zijn producten van zowel bovenlokale als lokale besturen (gevoed vanuit de Lokale Producten en DienstenCatalogus (LPDC)). IPDC tracht zo de centrale bron te zijn voor alle producten en diensten binnen Vlaanderen. Om dit te faciliteren is hij verdeeld in twee delen: concepten en instanties.
  2. Ophalen concepten: de toepassingen van integrerende gemeentes kunnen concepten ophalen bij IPDC. Via LDES (Linked Data Event Stream) gebeurt dit via conceptsnapshots. Hoe hierbij aan te sluiten, vind je hier.
  3. Toepassing van lokaal bestuur: toepassing van integrerende gemeente waar instanties beheerd worden, idealiter op basis van beschikbare concepten uit IPDC, aangevuld met instanties voor producten waarvoor geen concept beschikbaar is. Deze toepassing levert te publiceren instanties en eventuele wijzigingen in de vorm van een stroom van instantiesnapshots als een LDES.
  4. Ophalen te publiceren instanties: LPDC-module synchroniseert de instanties van de integrerende gemeente door de aangeboden instantiesnapshots uit te lezen met behulp van een LDES.
  5. LPDC: neemt elke instantie vanuit de laatste snapshot van de LDES over en synchroniseert deze vervolgens met IPDC. De meest recent bijgewerkte versie van elke instantie is zichtbaar voor de integrerende gemeente op LPDC, maar alleen in een leesmodus. (Besturen zonder eigen oplossing, kunnen in de LPDC-module wel hun producten en diensten beheren).
  6. LPDC-module publiceert instanties naar IPDC. Vanaf dat moment is het product beschikbaar in de API en LDES van IPDC voor hergebruik door anderen (of door het bestuur in andere toepassingen van het bestuur, mocht dat handiger zijn).

Technologie beschrijving

Samenvatting van de gebruikte technologieën voor gegevensoverdracht. Niet bedoeld om allesomvattend te zijn. Verdere technische details zijn te vinden in de referenties.

Linked Data

Linked Data (LD) verwijst naar een methode om gestructureerde gegevens te publiceren zodat ze onderling verbonden en doorzoekbaar zijn op het internet. Deze aanpak maakt gebruik van standaarden zoals de Resource Description Framework (RDF), SPARQL (een RDF-querytaal), en URI's (Uniform Resource Identifiers) om gegevens te beschrijven en te linken. Het doel is om data uit verschillende bronnen gemakkelijk toegankelijk en integreerbaar te maken, zodat gebruikers en computersystemen deze kunnen vinden en gebruiken voor diverse doeleinden.

LOD (Linked Open Data) is een uitbreiding van het Linked Data-concept, waarbij de nadruk ligt op het openbaar en vrij beschikbaar maken van verbonden datasets. LOD maakt het mogelijk om gegevenssets van verschillende domeinen (zoals overheid, cultuur, wetenschap) aan elkaar te koppelen, waardoor een rijk en onderling verbonden gegevensweb ontstaat dat voor iedereen toegankelijk is.

RDF (Resource Description Framework)

Inleiding

(uit:rdf primer)

RDF is een framework om informatie uit te drukken over bronnen. Bronnen kunnen van alles zijn, inclusief documenten, mensen, fysieke objecten en abstracte concepten.

RDF is bedoeld voor situaties waarin informatie op het web verwerkt moet worden door applicaties, in plaats van alleen weergegeven te worden aan mensen.

RDF biedt een gemeenschappelijk kader voor het uitdrukken van deze informatie zodat het tussen applicaties uitgewisseld kan worden zonder verlies van betekenis. Aangezien het een gemeenschappelijk kader is, kunnen applicatieontwerpers gebruikmaken van de beschikbaarheid van gemeenschappelijke RDF-parsers en verwerkingstools.

Het vermogen om informatie uit te wisselen tussen verschillende applicaties betekent dat de informatie beschikbaar kan worden gemaakt voor applicaties anders dan waarvoor het oorspronkelijk was gecreëerd. In het bijzonder kan RDF gebruikt worden om gegevens te publiceren en aan elkaar te koppelen op het web.

RDF stelt ons in staat uitspraken te doen over bronnen. Het formaat van deze uitspraken (statements) is eenvoudig.

Een uitspraak (Engels: statement) heeft altijd de volgende structuur:

<subject> <predicate> <object>

Een RDF-statement drukt een relatie uit tussen twee bronnen. Het subject (onderwerp) en het object vertegenwoordigen de twee aan elkaar gerelateerde bronnen; het predicaat (predicate) representeert de aard van hun relatie. De relatie wordt op een directionele wijze geformuleerd (van onderwerp naar object) en wordt in RDF-terminologie een property (eigenschap) genoemd. Omdat RDF-statements altijd uit drie elementen bestaan, worden ze triples genoemd.

Voorbeelden:

<Bob> <is een> <persoon>.
<Bob> <is een vriend van> <Alice>.
<Bob> <is geboren op> <4 juli 1990>.
<Bob> <is geïnteresseerd in> <de Mona Lisa>.
<Alice> <is een> <persoon>.
<de Mona Lisa> <heeft als titel> <Mona Lisa>.
<de Mona Lisa> <was gecreëerd door> <Leonardo da Vinci>.
<de Mona Lisa> <is een> <schilderij>.
<de video 'La Joconde à Washington'> <gaat over> <de Mona Lisa>.
<Leonardo da Vinci> <is een> <persoon>.

Dezelfde bron wordt vaak in meerdere triples van een dataset genoemd. In het bovenstaande voorbeeld is Bob het subject (onderwerp) van vier triples, en de Mona Lisa is het subject (onderwerp) en het object van elk twee triples. Het vermogen om dezelfde bron in de positie van subject (onderwerp) van de ene triple en in de positie van object van een andere triple te hebben, maakt het mogelijk om verbindingen tussen triples te vinden, wat een belangrijk onderdeel is van de kracht van RDF.

We kunnen triples visualiseren als een geconnecteerde graaf. Een graaf is een representatie van een objectenset waar sommige paren van de objecten met elkaar verbonden zijn door links.

RDF is een graaf in de zin dat het een verzameling van triples is die een netwerk van verbindingen tussen verschillende bronnen vormt.

Elke triple in een RDF-graaf bestaat uit een subject (onderwerp), een predicaat (predicate) en een object. Deze triples beschrijven de relaties tussen de bronnen.

rdf-triple-graaf.png

Merk op dat we rdf relaties unidirectioneel voorstellen in de graaf, in de richting van de triple beschrijving. Echter, semantisch dien je de relatie in beide richting te begrijpen. Je kan bv. vragen via SPARQL: Wat is <Bob>? maar ook Wie <is een> <persoon>?

IRIs

Een IRI is een International Resource Identifier. Een IRI definieert een bron (resource).

De URL's (Uniform Resource Locators) die mensen gebruiken als webadressen zijn één vorm van IRI (Internationalized Resource Identifiers).

Andere vormen van IRI bieden een identificatie voor een bron zonder de locatie of hoe deze te benaderen te impliceren.

Het concept van IRI is een generalisatie van URI (Uniform Resource Identifier), waardoor niet-ASCII tekens gebruikt kunnen worden in de IRI-tekenreeks. IRI's zijn gespecificeerd in RFC3987.

IRI's kunnen verschijnen in alle drie de posities van een triple.

Zoals vermeld, worden IRI's gebruikt om bronnen te identificeren zoals documenten, personen, fysieke objecten en abstracte concepten.

Bijvoorbeeld, de IRI voor Leonardo da Vinci in DBpedia is (subject en object <Leonardo da Vinci>):

http://dbpedia.org/resource/Leonardo_da_Vinci

De IRI voor een video over de Mona Lisa getiteld 'La Joconde à Washington' in Europeana is: (subject: <de video 'La Joconde à Washington'>)

http://data.europeana.eu/item/04802/243FA8618938F4117025F17A8B813C5F9AA4D619

IRI's zijn wereldwijde identificatoren, dus andere mensen kunnen deze IRI hergebruiken om hetzelfde te identificeren. Bijvoorbeeld, de volgende IRI wordt door veel mensen gebruikt als een RDF-eigenschap om een kennissenrelatie tussen mensen aan te geven (in ons voorbeeld <is een vriend van>):

http://xmlns.com/foaf/0.1/knows

RDF is neutraal over wat de IRI vertegenwoordigt. Echter, IRI's kunnen betekenis krijgen door specifieke vocabulaires of conventies.

Bijvoorbeeld, DBpedia gebruikt IRI's in de vorm van http://dbpedia.org/resource/Naam om het ding aan te duiden dat beschreven wordt door het overeenkomstige Wikipedia-artikel.

Het RDF-datamodel biedt een manier om uitspraken te doen over bronnen. Zoals we hebben vermeld, maakt dit datamodel geen aannames over waarvoor bron-IRI's staan. In de praktijk wordt RDF doorgaans gebruikt in combinatie met vocabulaires of andere conventies die semantische informatie over deze bronnen verstrekken.

Veel gebruikte voorbeelden zijn: RDF Syntax, Dublin Core, schema.org, SKOS, FOAF.

The aanduiden van een type <is een> kan bv. met

http://www.w3.org/1999/02/22-rdf-syntax-ns#type

Literals

Literals zijn basiswaarden die geen IRI's zijn.

Voorbeelden van literals omvatten strings zoals "La Joconde", datums zoals "de 4e juli, 1990" en getallen zoals "3.14159".

Literals worden geassocieerd met een datatype waardoor dergelijke waarden correct geparsed en geïnterpreteerd kunnen worden. String literals kunnen optioneel geassocieerd worden met een language tag (taaltag).

Literals mogen alleen verschijnen in de objectpositie van een triple.

Triple-store

De set van triples worden bewaard in een triple-store. Dit is een database die RDF van nature kan opslaan.

Voorbeelden van triple stores zijn: Virtuoso, Apache Jena, GraphDB.

Serialisatie-formaten voor RDF-data

Er bestaan verschillende serialisatieformaten voor het noteren van RDF-grafen. Echter, verschillende manieren van het noteren van dezelfde graaf leiden tot precies dezelfde triples en zijn dus logisch equivalent.

Hieronder geven we voorbeelden van verscheidene serialisatieformaten die het pseudocode voorbeeld mapt met een aantal vocabulaires.

N-Triples

N-Triples biedt een simpele, regelgebaseerde, platte-tekst manier om RDF-grafen te serialiseren.

<http://example.org/bob#me> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
<http://example.org/bob#me> <http://xmlns.com/foaf/0.1/knows> <http://example.org/alice#me> .
<http://example.org/bob#me> <http://schema.org/birthDate> "1990-07-04"^^<http://www.w3.org/2001/XMLSchema#date> .
<http://example.org/bob#me> <http://xmlns.com/foaf/0.1/topic_interest> <http://www.wikidata.org/entity/Q12418> .
<http://example.org/alice#me> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
<http://www.wikidata.org/entity/Q12418> <http://purl.org/dc/terms/title> "Mona Lisa" .
<http://www.wikidata.org/entity/Q12418> <http://purl.org/dc/terms/creator> <http://dbpedia.org/resource/Leonardo_da_Vinci> .
<http://www.wikidata.org/entity/Q12418> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>  <http://schema.org/Painting>.
<http://data.europeana.eu/item/04802/243FA8618938F4117025F17A8B813C5F9AA4D619> <http://purl.org/dc/terms/subject> <http://www.wikidata.org/entity/Q12418> .
<http://dbpedia.org/resource/Leonardo_da_Vinci> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .

Elke regel vertegenwoordigt een triple. Volledige IRI's zijn omsloten in spitse haakjes (<>). De punt aan het einde van de regel geeft het einde van de triple aan. In regel 3 zien we een voorbeeld van een literal, in dit geval een datum. Het datatype wordt aan de literal toegevoegd via een ^^ scheidingsteken. De datum representatie volgt de conventies van het XML Schema datatype date.

Omdat string literals zo alomtegenwoordig zijn, staat N-Triples de gebruiker toe om het datatype weg te laten bij het schrijven van een string literal. Dus, "Mona Lisa" is equivalent aan "Mona Lisa"^^xsd:string. In het geval van taal-getagde strings verschijnt de tag direct na de string, gescheiden door een @ symbool, bijvoorbeeld "La Joconde"@fr (de Franse naam van de Mona Lisa).

Het aantal lijntjes N-Triples vertegenwoordigt het aantal links in de graaf.

Turtle

Turtle is een uitbreiding van N-Triples. Naast de basis N-Triples syntax, introduceert Turtle een aantal syntactische verkortingen, zoals ondersteuning voor namespace prefixes, lijsten en afkortingen voor datatyped literals. Turtle biedt een compromis tussen schrijfgemak, parsegemak en leesbaarheid.

Het werkvoorbeeld uitgedrukt in TURTLE:

BASE   <http://example.org/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX schema: <http://schema.org/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX wd: <http://www.wikidata.org/entity/>

<bob#me>
    a foaf:Person ;
    foaf:knows <alice#me> ;
    schema:birthDate "1990-07-04"^^xsd:date ;
    foaf:topic_interest wd:Q12418 .

<alice#me>
    a foaf:Person.

<http://dbpedia.org/resource/Leonardo_da_Vinci>
    a foaf:Person.

wd:Q12418
    dcterms:title "Mona Lisa" ;
    dcterms:creator <http://dbpedia.org/resource/Leonardo_da_Vinci> ;
    a schema:Painting .

<http://data.europeana.eu/item/04802/243FA8618938F4117025F17A8B813C5F9AA4D619>
    dcterms:subject wd:Q12418 .
  • de afkorting 'a' komt overeen met de menselijke intuïtie over rdf:type.
  • PREFIX voorziet een afgekorte vorm om IRI's te specifiëren, bv. foaf:Person is hetzelfde als <http://xmlns.com/foaf/0.1/Person>; xsd:date is hetzelfde als <http://www.w3.org/2001/XMLSchema#date>
  • het scheidingsteken ; wijst erop dat de lijst van predicaten en objecten horen bij het eerder vermelde subject.

JSON-LD

JSON-LD biedt een JSON-syntax voor RDF-grafen en datasets.

JSON-LD kan gebruikt worden om JSON-documenten met minimale wijzigingen naar RDF om te zetten en omgekeerd.

JSON-LD biedt universele identificatoren voor JSON-objecten, een mechanisme waarbij een JSON-document kan verwijzen naar een object dat in een ander JSON-document elders op het web wordt beschreven, evenals datatype- en taalafhandeling.

JSON Document van lopend voorbeeld:

{
  "@context": "example-context.json",
  "@id": "http://example.org/bob#me",
  "@type": "Person",
  "isEenVriendVan": {
    "@id": "http://example.org/alice#me",
    "@type": "Person"
  },
  "isGeborenOp": "1990-07-04",
  "isGeinteresseerdIn": {
    "@id": "http://www.wikidata.org/entity/Q12418",
    "titel": "Mona Lisa",
    "onderwerp_van": "http://data.europeana.eu/item/04802/243FA8618938F4117025F17A8B813C5F9AA4D619",
    "wasGecreerdDoor": {
      "@id": "http://dbpedia.org/resource/Leonardo_da_Vinci",
      "@type": "Person"
    }
  }
}

De key @context wijst naar een JSON-document dat beschrijft hoe het document naar een RDF-graaf kan worden gemapt (zie hieronder).

Elk JSON-object komt overeen met een RDF-bron. Deze worden aangeduid met het trefwoord @id . In het bovenstaande voorbeeld zijn er 4 JSON-objecten: "@id": "http://example.org/bob#me", "@id": "http://example.org/alice#me", "http://www.wikidata.org/entity/Q12418" en "@id": "http://dbpedia.org/resource/Leonardo_da_Vinci". Het trefwoord @id, wanneer gebruikt als een key in een JSON-LD document, wijst naar een IRI die de bron identificeert die overeenkomt met het huidige JSON-object.

Het trefwoord @type beschrijft het type.

Andere attributen beschrijven eigenschappen van een JSON-object. (bvb. isEenVriendVan, isGeborenOp, titel, enz).

Dit context-document beschrijft hoe een JSON-LD document naar een RDF-graaf kan worden gemapt (ofwel embedded binnen de @context tag, ofwel beschikbaar gesteld via een URL).

{
  "@context": {
    "foaf": "http://xmlns.com/foaf/0.1/",
    "Person": "foaf:Person",
    "isGeinteresseerdIn": "foaf:topic_interest",
    "isEenVriendVan": {
      "@id": "foaf:knows",
      "@type": "@id"
    },
    "isGeborenOp": {
      "@id": "http://schema.org/birthDate",
      "@type": "http://www.w3.org/2001/XMLSchema#date"
    },
    "dcterms": "http://purl.org/dc/terms/",
    "titel": "dcterms:title",
    "wasGecreerdDoor": {
      "@id": "dcterms:creator",
      "@type": "@id"
    },
    "onderwerp_van": {
      "@reverse": "dcterms:subject",
      "@type": "@id"
    }
  }
}

Merk op dat de combinatie van de twee documenten het semantisch model opbouwen. De keuze van de termen in de @context document en de json zijn op zich vrij te kiezen.

In bovenstaand voorbeeld werd in het context-document nederlands gebruikt (en de data die deze @context gebruikt ook). Dit is geen vereiste, andere talen of eigen termen werken evengoed.

Een interactieve omzetting van dit voorbeeld op json-ld playground vind je hier.

SPARQL (SPARQL Protocol and RDF Query Language)

Om gegevens te zoeken of te manipuleren in de graaf, kan je gebruik maken van SPARQL.

Met SPARQL kun je vragen stellen (queries) over diverse gegevensbronnen. Dit werkt zelfs als deze gegevens oorspronkelijk niet in het RDF-formaat zijn opgeslagen, maar wel zo kunnen worden geïnterpreteerd met behulp van middleware.

Met SPARQL kun je complexe vragen stellen die verschillende voorwaarden combineren (opvragen van vereiste en optionele graafpatronen samen met hun conjuncties en disjuncties). Je kunt ook informatie samenvoegen (aggregatie), gedetailleerde subvragen stellen (subqueries), bepaalde gegevens uitsluiten (negatie), nieuwe informatie berekenen uit bestaande gegevens, en de zoekopdrachten verfijnen door te bepalen uit welke gegevensbronnen je informatie wilt halen.

De resultaten van SPARQL-queries kunnen resultaatsets of RDF-grafen zijn.

Een voorbeeld query:

SELECT ?subject WHERE {
    GRAPH <test> {
          ?subject <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person>
    }
}

Geeft als resultaat:

subject
http://dbpedia.org/resource/Leonardo_da_Vinci
http://example.org/alice#me
http://example.org/bob#me

SHACL (Shapes Constraint Language)

SHACL is een taal voor het beschrijven en valideren van RDF-grafen.

SHACL beschrijft de structuur en de condities waaraan een dataset dient te voldoen.

SHACL voorziet metadata over de data met als doel de data te kunnen valideren.

Kan de definities en structuren die zijn vastgelegd in RDF-schema's en OWL-ontologieën aanvullen. Dit betekent dat SHACL gebruikt kan worden om extra regels en beperkingen toe te voegen aan de informatie die al gedefinieerd is in RDF-schema's (een manier om relaties en structuren in RDF-gegevens te beschrijven) en OWL-ontologieën (een taal voor het definiëren van complexe relaties tussen concepten). SHACL helpt bij het verfijnen en specificeren van de verwachtingen over de gegevensstructuur en integriteit, bovenop de bestaande definities in RDF en OWL.

SHACL's worden beschreven in RDF.

SHACL implementaties gaan uit van de zogenaamde 'Closed World Assumption'. Dit betekent dat alle data waarnaar wordt verwezen, dit zowel typeringen als de data waarden zelf, in de validatie context beschikbaar moeten zijn. Indien je bijvoorbeeld verwijst naar een element van het type Concept, dan dient ook de data van het concept waarnaar verwezen aanwezig te zijn in de validatie context.

LDES (Linked Data Event Stream)

Inleiding

Een Linked Data Event Stream (LDES) (ldes:EventStream) is een verzameling (rdfs:subClassOf tree:Collection) van onveranderlijke objecten, waarbij elk object wordt beschreven met behulp van een set RDF-triples.

De focus van een LDES is om clients in staat te stellen de geschiedenis van een dataset te repliceren en efficiënt te synchroniseren met de nieuwste wijzigingen.

LDES maakt gebruik van de TREE specificatie om verzamelingen, fragmentering en/of paginering eigenschappen te beschrijven.

Noot: Wanneer een client eenmaal een member heeft verwerkt, zou deze het nooit meer opnieuw moeten hoeven te verwerken. Een Linked Data Event Stream-client kan dus een lijst van (of cache voor) reeds verwerkte lid-IRI's bijhouden.

Verdere LDES-voorbeelden in dit hoofdstuk illustreren concepten van een LDES, met RDF-data in serialisatievorm Turtle. De data kan uiteraard ook geserialiseerd worden als JSON-LD. Op het einde van deze sectie is een voorbeeld ook gepresenteerd in json-ld formaat.

Volgend voorbeeld duidt een 'observatie' aan aangeboden in een LDES stream:

@prefix ex: <http://example.com/ns#> .
@prefix ldes: <https://w3id.org/ldes#> .
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix tree: <https://w3id.org/tree#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:C1 a ldes:EventStream ;
      ldes:timestampPath sosa:resultTime ;
      tree:member ex:Observation1 .

ex:Observation1 a sosa:Observation ;
                sosa:resultTime "2021-01-01T00:00:00Z"^^xsd:dateTime ;
                sosa:hasSimpleResult "..." .
  • tree:member duidt op een member in de verzameling.
  • ldes:timestampPath verwijst naar de predicate in een member waar de timestamp van de data te vinden is.
  • ex:Observation1 wordt beschreven als RDF-data.

Fragmentering en paginering

Linked Data Event Streams mogen gefragmenteerd worden wanneer hun grootte te groot wordt voor één HTTP-antwoord.

Fragmenten moeten worden beschreven met behulp van de functies in de TREE-specificatie. Alle relatie-types uit de TREE-specificatie mogen worden gebruikt.

Voorbeeld:

@prefix ex: <http://example.com/ns#> .
@prefix ldes: <https://w3id.org/ldes#> .
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix tree: <https://w3id.org/tree#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:C1 a ldes:EventStream ;
      ldes:timestampPath sosa:resultTime ;
      tree:member ex:Observation1, ex:Observation2;
      tree:view ex:page-1 .

ex:page-1 a tree:Node ;
          tree:relation [
              a tree:GreaterThanOrEqualToRelation ;
              tree:path sosa:resultTime ;
              tree:node ex:page-2 ;
              tree:value "2020-12-24T12:00:00Z"^^xsd:dateTime
          ] .

ex:Observation1 a sosa:Observation ;
                sosa:resultTime "2021-01-01T00:00:00Z"^^xsd:dateTime ;
                sosa:hasSimpleResult "..." .

ex:Observation2 a sosa:Observation ;
                sosa:resultTime "2021-01-01T01:00:00Z"^^xsd:dateTime ;
                sosa:hasSimpleResult "..." .
  • de ldes stream pagina bevat alle tree:members van deze pagina (ex:Observation1 en ex:Observation2)
  • tree:view specificeert welke subset van de tree:collection deze pagina toont, en via tree:relation kan je navigeren naar andere subsets. Typisch zijn de ex:page-1 en ex:page2 effectieve URL's die een gepagineerd endpoint aanduiden (zie verder).

Versionering

Beschrijft hoe je een object kan veranderen waarbij je de historiek van het rdf-document bijhoudt. Je stuurt met andere woorden een serie van snapshots van de data van het rdf-document op. Hierbij verwijs je telkens naar het origineel rdf-document en het tijdstip van de snapshot. Dit stelt de LDES-afnemer in staat de historiek te reconstrueren en de laatste versie te bewaren (en hierbij toch performant niet telkens de hele LDES te hoeven uitlezen).

Technisch, wordt een versiebeheerde-LDES gedefinieerd met twee eigenschappen: ldes:versionOfPath en ldes:timestampPath.

  • ldes:versionOfPath: verklaart de predicate die wordt gebruikt om te definiëren dat een tree:member van een ldes:EventStream een versie is van een rdf-document.
  • ldes:timestampPath: verklaart de predicate die wordt gebruikt om de DateTime van een tree:member te definiëren.

Volgend voorbeeldje illustreert versiebeheerde-LDES:

@prefix ex: <http://example.com/ns#> .
@prefix ldes: <https://w3id.org/ldes#> .
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix tree: <https://w3id.org/tree#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix adms: <http://www.w3.org/ns/adms#> .

ex:C2 a ldes:EventStream ;
      ldes:timestampPath dcterms:created ;
      ldes:versionOfPath dcterms:isVersionOf ;
      tree:member ex:AddressRecord1-version1, ex:AddressRecord1-version2.

ex:AddressRecord1-version1 dcterms:created "2021-01-01T00:00:00Z"^^xsd:dateTime ;
                           adms:versionNotes "First version of this address" ;
                           dcterms:isVersionOf ex:AddressRecord1 ;
                           dcterms:title "Streetname X, ZIP Municipality, Country" .

ex:AddressRecord1-version2 dcterms:created "2021-01-02T00:00:00Z"^^xsd:dateTime ;
                           adms:versionNotes "Second version of this address" ;
                           dcterms:isVersionOf ex:AddressRecord1 ;
                           dcterms:title "Streetname X + Y, ZIP Municipality, Country" .
  • Deze LDES bevat 2 elementen: zowel ex:AddressRecord1-version1 en ex:AddressRecord1-version2 worden verwezen door tree:member.
  • Net als in vorige voorbeeld wijst ldes:timestampPath naar de predicate in een member waar de timestamp te vinden is. Deze keer verwijst die naar dcterms:created.
  • ldes:versionOfPath verwijst naar de predicate binnen de member dat het nietversiebeheerde-document aanduidt: dcterms:isVersionOf. In beide gevallen in het voorbeeld wordt verwezen naar ex:AddressRecord1. Merk op dat ex:AddressRecord1 niet in de data zit. De data wordt enkel beschikbaar gesteld via versies.
  • Dit kan uiteraard gecombineerd worden met paginering en fragmentering.

Ter illustratie, het vorige voorbeeld in json-ld formaat (met context ingebed):

{
  "timestampPath": "created",
  "versionOfPath": "isVersionOf",
  "@id": "http://example.com/ns#C2",
  "@type": "EventStream",
  "@context": {
    "schema": "http://schema.org/",
    "xsd": "http://www.w3.org/2001/XMLSchema#",
    "ldes": "https://w3id.org/ldes#",
    "tree": "https://w3id.org/tree#",
    "dcterms": "http://purl.org/dc/terms/",
    "adms": "http://www.w3.org/ns/adms#",
    "id": {
      "@id": "schema:identifier"
    },
    "created": {
      "@id": "dcterms:created",
      "@type": "xsd:dateTime"
    },
    "isVersionOf": {
      "@id": "dcterms:isVersionOf",
      "@type": "@id"
    },
    "versionOfPath": {
      "@id": "ldes:versionOfPath",
      "@type": "@id"
    },
    "timestampPath": {
      "@id": "ldes:timestampPath",
      "@type": "@id"
    },
    "member": {
      "@id": "tree:member",
      "@container": "@set"
    },
    "versionNotes": {
      "@id": "adms:versionNotes",
      "@type": "xsd:string"
    },
    "title": {
      "@id": "dcterms:title",
      "@type": "xsd:string"
    }
  },
  "member": [
    {
      "@id": "http://example.com/ns#AddressRecord1-version1",
      "created": "2021-01-01T00:00:00Z",
      "versionNotes": "First version of this address",
      "isVersionOf": "http://example.com/ns#AddressRecord1",
      "title": "Streetname X, ZIP Municipality, Country"
    },
    {
      "@id": "http://example.com/ns#AddressRecord1-version2",
      "created": "2021-01-02T00:00:00Z",
      "versionNotes": "Second version of this address",
      "isVersionOf": "http://example.com/ns#AddressRecord1",
      "title": "Streetname X + Y, ZIP Municipality, Country"
    }
  ]
}

Contractspecificaties - semantisch model

De contractspecificaties (het semantisch model / het IPDC-LPDC implementatiemodel) beschrijft in detail de gewenste datastructuur, zoals kardinaliteiten, codelijsten, datatypes, ... . Het IPDC-LPDC implementatiemodel beschrijft de datastructuur voor ConceptSnapshots en InstantieSnapshots. Merk op dat deze gelijkaardig, maar niet identiek zijn. Het is dus belangrijk om voor de instantie die aangeboden worden aan de LPDC-module gebaseerd wordt op de informatie bij Instanties.

!!!!!!!!! Op datum van 2024-04-25 staat een versie van het IPDC-LPDC implementatiemodel van 2022-06-15 op de productiepagina's van data.vlaanderen.be. Deze krijgt normaal eerstdaags een update. Een preview van die update is hier te vinden (op de testpagina's van data.vlaanderen.be). Tot wanneer de versie op productie is updated, kun je best naar de previewversie/versie op de testpagina's kijken. Deze versie zal niet meer wijzigen en zo naar productie worden gebracht.

De info op productie: IPDC-LPDC implementatiemodel. Let op de datum "uitgegeven op" die moet later minstens 2024-04-25 of later zijn!

Voorbeelden + implementatie tips

Dit zijn voorbeelden die het IPDC-LPDC implementatiemodel illusteren met uitvoerbare voorbeelden.

Uitvoerbare instantiesnapshot-LDES-stub

Een uitvoerbare, voorbeeld-implementatie van een instantiesnapshot-LDES-stub is hier te vinden.

Dit is een Typescript project dat een vaste lijst van 3 pagina's teruggeeft.

Het bevat ook een endpoint voor de ipdc-lpdc-im.jsonld en ldes.jsonld.

Om het project effectief uit te voeren, is de recentste LTS-versie van Node JS vereist.

  npm ci
  npm run start

Je kan de pagina's uitlezen door http://localhost/doc/instancesnapshot?pageNumber=0 , 1, 2 uit te voeren. Dit geeft de data in json-ld formaat terug, daarbij verwijzend naar de ipdc-lpdc-im.jsonld en ldes.jsonld.

Pagina's 0, 1, 2 zijn ook hier, hier en hier te vinden.

In hoofdstuk Voorbeeld pagina in detail wordt verder ingegaan op elk element van de data.

integrerende-gemeente-LDES-reader

Dit project illustreert uitvoerbare commando's voor uitlezen en interpreteren van een LDES in json-ld en turtle formaat.

Het project maakt een connectie met de instantiesnapshot-LDES-stub.

Het project kan makkelijk aangepast worden om naar een andere URL te connecteren, en kan in die vorm dienen als test voor een LDES opgezet door de integrerende gemeente.

Je kan het project hier vinden.

Om het project effectief uit te voeren, is de recentste LTS-versie van Node JS vereist.

  npm ci

Uitlezen van volledige LDES en schrijven naar console-uitvoer als json-ld formaat.

  npm run start-export-as-json-ld

Uitlezen van volledige LDES, interpreteren en samenvoegen met verwezen ipdc-lpdc-im.jsonld en ldes.jsonld en resultaat schrijven naar console-uitvoer als turtle formaat.

  npm run start-export-as-turtle

JSON-LD en context samenvoegen opmerkingen

De LDES-reader leest json-ld en kan json-ld en turtle produceren.

Beide formaten (json-ld en turtle) zijn serialisatie-formaten voor dezelfde data.

Indien de json-ld data en de bijhorende ipdc-lpdc-im.jsonld en ldes.jsonld goed op elkaar afgestemd zijn, dan zal dit een correcte turtle genereren.

Met 'correct' bedoelen we, één waarin voor elk json-ld datum een overeenkomstig attribuut ter interpretatie gevonden wordt in de ipdc-lpdc-im.jsonld en ldes.jsonld.

Indien er in één van de twee een afwijking is, dan zal de turtle ofwel minder triples bevatten, niet goed gevormde IRIs hebben, of mogelijk andere problemen vertonen.

Het voorziene voorbeeld in instantiesnapshot-LDES-stub is conform en met verscheidene voorbeelden bedoeld exhaustief te zijn.

Nazicht van de gegenereerde Turtle door de integrerende gemeente is zeker aan te bevelen.

Voorbeeld pagina in detail

Hierin zullen we een aantal elementen van de data belichten.

Uit: page-0.

Merk op dat alle URL's die de LDES vermelden, (andere pagina's (http://hostname/doc/instancesnapshot?pageNumber=0), of identificatie van de pagina (http://hostname/doc/instancesnapshot?pageNumber=0)), verwijzen naar de 'hostname'.

Dit moet de publiek toegankelijke internet-host zijn die de LDES aanbiedt.

Merk op dat deze door de uitvoerbare instantiesnapshot-LDES-stub voorheen vervangen wordt door 'localhost'.

page-0.json.png

  1. "timestampPath": "generatedAtTime" , "versionOfPath": "isVersionOf": properties met values die aangeven welke properties in de members gebruikt worden voor de versionering van LDES. Zowel generatedAtTime en isVersionOf zal je terugvinden in elke member.
  2. Identificatie van deze pagina van de LDES.
  3. Relation wijst naar andere pagina's van LDES. In dit voorbeeld is er een volgende pagina met nummer 1. In page-1 vindt u navigatie terug naar page-0 en verder naar page-2. In page-2 vindt u navigatie terug naar page-1.
  4. Verwijst naar de gebruikte ipdc-lpdc-im.jsonld en ldes.jsonld. In dit voorbeeld wordt deze apart hosted. Kan eventueel ook ingesloten meegegeven worden.
  5. Identificatie van de LDES pagina, en aangeven dat het een LDES is.
  6. Onder member volgt een json array van alle members van deze pagina van de LDES.
  7. "@id": "http://data.lblod.info/id/public-service-snapshot/6e9334cb-272c-443d-8b0a-1b02149a5126" identificeert hierbij de instantiesnapshot. Deze IRI voldoet aan formaat 'http://data.lblod.info/id/public-service-snapshot/', en dient door de integrerende gemeente gegenereerd te worden.
  8. "isVersionOf": "http://data.lblod.info/id/public-service/c0d6bf9a-fcc4-4d46-beb6-3f4d80f03bf3", identificeert de instantie. Deze IRI voldoet aan formaat 'http://data.lblod.info/id/public-service/', en dient door de integrerende gemeente gegenereerd te worden.
  9. "aangemaaktDoor": "http://data.lblod.info/id/bestuurseenheden/353234a365664e581db5c2f7cc07add2534b47b8e1ab87c821fc6e6365e6bef5" : Iri van de integrerende gemeente. Wordt als absolute URL opgegeven.
  10. "creatie": "2024-02-14T13:42:12.357Z", "laatstGewijzigd": "2024-02-14T13:59:25.236Z",: geeft het moment dat de instantie aangemaakt en respectievelijk laatst bewerkt werd. Dit wordt door LPDC ad verbatim overgenomen.
  11. "generatedAtTime": "2024-02-18T06:32:10.377Z": geeft het moment dat de instantiesnapshot aangemaakt werd. Is een property die door LDES-verwerking wordt geïnterpreteerd.
  12. "naam:", "beschrijving:": een voorbeeld van 2 data velden die gelinked zijn vanuit instantie, beide string literals met een taal tag.
  13. "bevoegdeOverheden": ["http://data.lblod.info/id/bestuurseenheden/353234a365664e581db5c2f7cc07add2534b47b8e1ab87c821fc6e6365e6bef5"]: Iri's van de bevoegde overheid. Wordt als absolute URL opgegeven. Meerdere bevoegdeOverheden kunnen opgegeven worden, dus is dit json-type een array.
  14. "geografischToepassingsgebieden": ["BE23444021"]: de geografische toepassingsgebieden relevant voor deze instantie. Een code uit de nuts - lau codes wordt verwacht. Een basis url (http://data.europa.eu/nuts/code/) wordt automatisch vooraan toegevoegd indien u een relatieve opgeeft. Een absolute url kan ook opgegeven worden. Meerdere geografischToepassingsgebieden kunnen opgegeven worden, dus is dit json-type een array.
  15. "uitvoerendeOverheden": ["http://data.lblod.info/id/bestuurseenheden/353234a365664e581db5c2f7cc07add2534b47b8e1ab87c821fc6e6365e6bef5"]: Iri's van de uitvoerende overheid. Wordt als absolute URL opgegeven Meerdere uitvoerendeOverheden kunnen opgegeven worden, dus is dit json-type een array.
  16. Voorbeeld van een tweede, later gegenereerde ("generatedAtTime": "2024-02-20T07:32:10.377Z"), instantie snapshot("http://data.lblod.info/id/public-service-snapshot/84d1e739-d20c-4986-84d8-331bd58feb09") van dezelfde instantie ("isVersionOf": "http://data.lblod.info/id/public-service/c0d6bf9a-fcc4-4d46-beb6-3f4d80f03bf3"). Hier werd naam en beschrijving updatet. Merk op dat telkens de volledige data van de instantie dient te worden meegegeven bij elke nieuwe instantie snapshot. Een nieuwe instantie snapshot geeft m.a.w. niet enkel de verandering ten opzicht van vorige weer.

Ter illustratie de gegeneerde turtle voor dit deel van LDES, merk op dat hierin de informatie uit de LDES is verwijderd (behalve generatedAtTime en isVersionOf). Dit is de informatie die door LPDC zal verwerkt worden.

<http://data.lblod.info/id/public-service-snapshot/6e9334cb-272c-443d-8b0a-1b02149a5126> a <https://productencatalogus.data.vlaanderen.be/ns/ipdc-lpdc#InstancePublicServiceSnapshot>;
    <http://purl.org/dc/terms/isVersionOf> <http://data.lblod.info/id/public-service/c0d6bf9a-fcc4-4d46-beb6-3f4d80f03bf3>;
    <http://purl.org/pav/createdBy> <http://data.lblod.info/id/bestuurseenheden/353234a365664e581db5c2f7cc07add2534b47b8e1ab87c821fc6e6365e6bef5>;
    <http://schema.org/dateCreated> "2024-02-14T13:42:12.357Z"^^<http://www.w3.org/2001/XMLSchema#dateTime>;
    <http://schema.org/dateModified> "2024-02-14T13:59:25.236Z"^^<http://www.w3.org/2001/XMLSchema#dateTime>;
    <http://www.w3.org/ns/prov#generatedAtTime> "2024-02-18T06:32:10.377Z"^^<http://www.w3.org/2001/XMLSchema#dateTime>;
    <http://purl.org/dc/terms/title> "Minimalistische instantie"@nl-be-x-informal;
    <http://purl.org/dc/terms/description> "<p data-indentation-level=\"0\">Beschrijving van de minimalistische instantie</p>"@nl-be-x-informal;
    <http://purl.org/dc/terms/spatial> <http://data.europa.eu/nuts/code/BE23444021>.

<http://data.lblod.info/id/public-service-snapshot/84d1e739-d20c-4986-84d8-331bd58feb09> a <https://productencatalogus.data.vlaanderen.be/ns/ipdc-lpdc#InstancePublicServiceSnapshot>;
    <http://purl.org/dc/terms/isVersionOf> <http://data.lblod.info/id/public-service/c0d6bf9a-fcc4-4d46-beb6-3f4d80f03bf3>;
    <http://purl.org/pav/createdBy> <http://data.lblod.info/id/bestuurseenheden/353234a365664e581db5c2f7cc07add2534b47b8e1ab87c821fc6e6365e6bef5>;
    <http://schema.org/dateCreated> "2024-02-14T13:42:12.357Z"^^<http://www.w3.org/2001/XMLSchema#dateTime>;
    <http://schema.org/dateModified> "2024-02-15T14:59:30.236Z"^^<http://www.w3.org/2001/XMLSchema#dateTime>;
    <http://www.w3.org/ns/prov#generatedAtTime> "2024-02-20T07:32:10.377Z"^^<http://www.w3.org/2001/XMLSchema#dateTime>;
    <http://purl.org/dc/terms/title> "Minimalistische instantie updatet"@nl-be-x-informal;
    <http://purl.org/dc/terms/description> "<p data-indentation-level=\"0\">Beschrijving van de minimalistische instantie updatet</p>"@nl-be-x-informal;
    <http://purl.org/dc/terms/spatial> <http://data.europa.eu/nuts/code/BE23444021>.

De volledige test dataset voor LDES-instanties kan je hier in ttl formaat vinden.

Nota: Sommige turtle verwerking-programma's kunnen niet goed om met de shorthand syntax van turtle in de bestanden. (bvb https://github.com/Informatievlaanderen/VSDS-LDESServer4J). Indien u de bestanden probeert op te laden, krijg je een fout. Het volstaat om triples van de voorbeelden om te vormen tot zijn lexicografische vorm en bijhorend datatype. (bvb: true => "true"^^xsd:boolean).

SHACL voorbeeld validaties

SHACL voorbeeld programma's zijn hier te vinden.

Het implementatie model vermeldt correct dat er meerdere zoektermen mogen zijn per taal.

LPDC ondersteunt enkel @nl als taal voor zoektermen. Zoektermen in andere talen zijn toegestaan, maar worden niet verwerkt.

Verklarende woordenlijst

Hieronder beschrijven we een aantal termen die een leidraad vormen doorheen het verhaal. Deze termen zijn toepasbaar op LPDC, IPDC, eventueel ook voor de toepassingen van lokale besturen.

Concept

Concepten kunnen gezien worden als sjablonen die redacteurs van de Vlaamse overheid klaarzetten voor lokale besturen. Met die aanzet kunnen de lokale besturen vlot hun eigen dienstverlening (instantie) aanmaken. Een goed voorbeeld van een concept is het huwelijk. Hoewel de beschrijving en voorwaarden van een huwelijk grotendeels hetzelfde zijn voor de verschillende gemeentes zijn er mogelijk toch lokale verschillen, zoals de locatie en prijs.

ConceptSnapshot

Een gegeventsmomentopname van een concept. Dit wordt gebruikt om de staat van conceptgegevens op een specifiek tijdstip te beschrijven. Een serie van conceptsnapshots beschrijft verschillende versies doorheen de tijd van een concept. Het bevat een unieke id per opname, een tijdstip van opname, een verwijzing naar de id van het concept, een (kopie van) alle gegevens van het concept op moment van opname, en optioneel een archiveringsstatus (dit om aan te duiden of een concept nog actief is of niet).

Instantie

Zijn de werkelijke invulling van een product of dienst. De bevoegde overheid kan variëren: federaal, Vlaams, provinciaal,… en de dienstverlening kan uitgevoerd worden door nog een andere overheid zoals een lokaal bestuur. Bevat optioneel een link naar een concept waarop het oorspronkelijk was gebaseerd.

InstantieSnapshot

Een gegeventsmomentopname van een instantie. Dit wordt gebruikt om de staat van instantiegegevens op een specifiek tijdstip te beschrijven. Een serie van instantiesnapshots beschrijft verschillende versies doorheen de tijd van een instantie. Het bevat een unieke id per opname, een tijdstip van opname, een verwijzing naar de id van de instantie, een (kopie van) alle gegevens van de instantie op moment van opname, en optioneel een archiveringsstatus (dit om aan te duiden of de instantie nog actief is of niet).

Referenties

Algemeen

Gebruikte standaarden

Broncode (open source) / Ondersteunende technologieën