Redactie - 20 augustus 2024

Mastering your golden records

De wereld heeft enerzijds onvoldoende fysieke opslagmogelijkheden om alle digitale data die we tegenwoordig produceren, überhaupt nog vast te leggen. Anderzijds moeten we toch alle relevante en onmisbare data lange tijd ‘ergens’ – cloud of on premise – fysiek beschikbaar kunnen maken en houden. Denk aan de essentiële golden records binnen organisaties: geldige versies van unieke data-elementen, beschikbaar in enkelvoudige bronsystemen. Mede daarom wordt automatische bronarchivering voor zowel (grote) inhoudelijke content als (kleine) transactionele procesdata steeds belangrijker, zo schrijft Hans Timmerman in onderstaande blog.

Mastering your golden records image

Formeel vrijgegeven content – gecreëerd in document management of zaak systemen – direct archiveren en op die wijze als beheerde ‘single source’ fysiek toegankelijk maken én houden voor breed gebruik. Evenals kleine transactionele datasets – gebaseerd op ‘timestamped hashes’ – vastleggen in eindeloos registrerende blockchains. Naast de schaarste van fysieke storage, moeten we, als we voor iedereen een gelijke informatiepositie willen realiseren, deze bronsystemen tegelijkertijd veilig en vertrouwelijk kunnen openstellen om deze data verantwoord en gemeenschappelijk te kunnen gebruiken en delen.

Golden records

De meest nauwkeurige en actuele gegevens in een organisatie noemen we de ‘Golden Records’, geldige versies van unieke data-elementen, aanwezig in een enkelvoudig bronsysteem. Geldige versie wil zeggen dat ‘als u deze data wilt gebruiken’ deze data de meest betrouwbare, nauwkeurige en actuele data is die er is. Het totaal van alle binnen de organisatie bekende ‘golden data’ heet ook wel de ‘golden copy’ of wordt de Single Source of Truth (SSOT) of Master Data van een organisatie genoemd. Het realiseren en instandhouden van die ‘golden copy’ wat betreft zowel aanleverende als gebruikmakende processen, noemen we Master Data Management (MDM). De voortdurende groei en verbreding van digitale informatiestromen, creëert uitdagingen om dit efficiënt en effectief uit te blijven voeren. Daarom zien we de behoefte aan automatische bronarchivering van zowel transacties als content ontstaan.

Het samenstellen van een ‘Single Source of Truth’ vanuit de output van vele bestaande en ook vaak oude systemen, is een uitdaging. Niet zozeer het überhaupt kennen en/of kunnen traceren van die data, maar vooral het bezit van een genormeerde nomenclatuur voor al die data. Elk systeem en elke database die met de golden data werkt, moet de datadefinitie van die unieke dataset kennen en daarmee kunnen werken. Alleen een simpele naam, adres, woonplaats definitie van een persoon kan al tot verwarring leiden. Als je daar nog telefoonnummer, e-mailadres, IP-adres en chatkanalen aan toevoegt, wordt het adequaat managen van alleen al deze personele datasets over alle toepassingen heen een fikse uitdaging. Op die wijze moet elke golden record op basis van een stelsel, uniek gedefinieerd zijn en als enkele bron voor alle systemen gelden. Een groeiende uitdaging!

Mastering and sharing your Master Data

In de informatica is een golden record de geldige versie van een data-element (record) in een enkelvoudig bronsysteem van waarheid. Het kan verwijzen naar een database, specifieke tabel of dataveld, of een willekeurige gebruikte informatie-eenheid. De golden copy is het totaal van die goed beheerde en geconsolideerde datasets: de formeel gedefinieerde versie van alle data-entiteiten in een organisatorisch ecosysteem. Het vakgebied Master Data Management ontwikkelt zich momenteel snel, omdat zowel de hoeveelheid data, maar vooral ook de verbreding van alle kanalen waarlangs data de organisatie in en uitgaat, exponentieel aan het groeien is en (centrale) opslagmogelijkheden toch beperkt en zeker ook prijzig blijven. Ook nieuwe veiligheid, privacy en archiveringseisen leveren steeds vaker, extra uitdagingen wat betreft bewaartermijnen.

Pas al er een geaccepteerde ‘Single Source of Truth’ is, kan men iedereen tot die ‘waarheid’ uitnodigen en kan informatiegelijkheid tussen alle belanghebbenden worden gecreëerd. De trieste lering uit de toeslagen-affaire is dat zowel de overheid als de ouders beiden geen goed overzicht hadden van zowel hun eigen dossiers als van dossiers die mogelijk voor hen van belang waren. Organisatorische grenzen, privacy-beperkingen en het gegeven ‘dat je nooit precies weet wat je de ander weet’, maakte dat zowel ambtenaar als burger bij wijze van spreken in het duister tastten over wat het ‘werkelijke gemeenschappelijke’ dossier was. Er was geen gedeelde ‘bron van waarheid’ voor zowel ambtenaar als burger. Naast de behoefte aan die ‘Single Source of Truth’ dient die brondata in individuele dossiers en op verantwoorde wijze – dat wil zeggen met de juiste autorisatie van allen die deelnemen – kunnen worden gedeeld met alle rechthebbenden. De kern van Master Data Management.

Bronarchivering

Informatie kan of mag pas breder worden gedeeld, als het een ‘vrijgeven’ status heeft gekregen en daarnaast uniek identificeerbaar is geworden. Een vrijgifteproces waarbij een document van de status ‘in bewerking’ via ‘in verificatie’ uiteindelijk formeel is goedgekeurd en mag worden vrijgegeven voor rechtmatig gebruik. Omdat organisaties vaak vele document en zaak systemen gebruiken, betekent simpelweg ‘vrijgeven’ nog niet dat het bruikbaar is voor een ander systeem of een andere organisatie. Vrijgeven betekent ook ‘toegankelijk’ maken voor de gehele organisatie en iedereen daarbuiten, zonder dat men iedereen individueel toegang tot alle betreffende document of zaaksystemen geeft. Dit wordt pas mogelijk als op het moment van vrijgifte: het document is ‘formeel bevroren’ en kan vanuit het betreffende systeem worden gemigreerd naar een centraal en open archief. Via centraal beheerde metadata kan vanaf dat moment tevens elke noodzakelijke informatiegelijkheid tussen eigenaar en gebruikers van die content worden geborgd.

Een andere behoefte die we zien ontstaan, is het eenduidig vastleggen van transacties. Kleine procesgerelateerde datasets die als een boekhouding (ledger) alle transacties in dat proces vastleggen. Dit kan de actuele status betreffen over over bezit, betalingen, geldigheden of eigendom. Satoshi Nakamoto ontdekte in 2008 het principe van de blockchain. Hij zocht een manier om double spending bij peer-to-peer betalingen te voorkomen en ‘ontdekte’ dat het in een gedistribueerde ‘ketting’ vastleggen van ‘hash & timestamp’ van een dataset, een betrouwbare digitale boekhouding mogelijk maakt. De start voor cryptobetalingen, waarvan Bitcoin in 2009 de eerste was. Maar behalve cryptomunten kan een blockchain direct bij de bron alle soorten ‘tokens’ geverifieerd en persistent vastleggen. Een andere vorm van bronarchivering, maar nu voor transacties. Zie ook mijn blog ‘wie schonk de mensheid de blockchain?’.

Geverifieerd gebruik van gedistribueerde, open data

Bronarchivering, encryptie en actieve authenticatie zijn de ingrediënten voor veilig en open informatiegebruik binnen en tussen organisaties en personen. Deze digitale transformatie moet als een ‘deken’ over het huidige ‘gedigitaliseerde’ landschap worden gelegd, omdat onze wereld nog vol zit met oude systemen, die hiervoor nooit ontwikkeld zijn. Systemen die soms nog prima en jarenlang kunnen functioneren en waarvoor we de budgetten en mensen niet eens hebben die in korte tijde te vernieuwen, te vervangen en op te ruimen. Daarom is een eenduidige visie wat betreft toekomstig Master Data Managent voor elke organisatie essentieel. Vanuit het principe ‘denk groot maar start klein’, omdat het ten ene male onmogelijk is alles tegelijk te doen.

Hoe ziet in de (verre?) toekomst uw digitale landschap eruit en wat betekent het om vanuit de huidige situatie ooit in die toekomst te komen. Dit zijn geen processen van enkele jaren, maar nemen decennia in beslag. Denk hoe we veertig jaar geleden – na het centrale mainframe – de gedistribueerde digitale applicaties in onze organisaties mogelijk maakten. En na die client/server periode twintig jaar geleden de weg naar (weer) een centrale oplossing kozen – de cloud. En nu, met de komst van multi-clouds, edge-computing en web3 gebaseerde nodes, weer een decentrale route kiezen. Nieuwe uitdagingen voor vooral uw datamanagement, immers: applicaties verwelken, processen vergaan, maar al uw data, blijft eeuwig bestaan.

Door: Hans Timmerman

DIC Security Day BW tm 1 juli 2025
Jamf Cybersec 2025 3 BW + BN

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!