Lineage van bronbestand tot dashboard: herkomst op attribuutniveau

Hoe Latero Runtime data lineage registreert en hoe Latero Control die keten zichtbaar maakt. Van bronbestand via medallion-lagen naar het dashboard.

Als iemand vraagt waar een getal vandaan komt, is “uit de brondata” geen echt antwoord. Dat is hooguit een richting. Een bruikbaar antwoord zegt welke levering is gebruikt, via welke stappen die liep en welk bronattribuut uiteindelijk in de publicatie is terechtgekomen.

Dat is precies wat de lineageregistratie van Latero Runtime vastlegt en wat Latero Control vervolgens zichtbaar maakt.

De keten in een concreet voorbeeld

Voor bronsysteem A is de lijn concreet genoeg om uit te tekenen. Een bronbestand komt binnen, wordt gearchiveerd, daarna omgezet naar een bronze-tabel, vervolgens naar een silver-tabel en uiteindelijk naar een gold-publicatietabel.

Lineage is geen abstract schema, maar een concrete keten van bestand, stap en attribuut — zichtbaar in het dashboard.

Twee niveaus van lineage

Latero Runtime legt lineage op twee niveaus vast.

Bestandslineage beschrijft welke fysieke levering de basis vormt voor welke verwerkingsstap. Welk bestand is gebruikt, of de checksum klopte en wanneer de overdracht plaatsvond.

Attribuutlineage gaat verder. Daarbij is per veld vastgelegd welke bronattributen bijdragen aan een doelattribuut in silver of gold — zodat de herkomst van elke kolom in een publicatietabel traceerbaar is.

Die combinatie maakt het verschil. Alleen bestandslineage vertelt niet hoe een kolom is opgebouwd. Alleen attribuutlineage zonder bestandsspoor vertelt niet uit welke concrete levering een waarde komt. Samen vormen ze een controleerbaar verhaal.

Hoe lineage in Latero Control terechtkomt

Lineage wordt geregistreerd als onderdeel van de pipeline-uitvoering, niet als losse nabewerking.

In API-modus pusht de Latero-runtime na elke stap een lineage-event naar het ingest-eindpunt van Latero Control. Dat event beschrijft de bronentiteiten, de doelentiteiten en de attribuutkoppelingen die in die stap zijn gerealiseerd. Het product slaat dit op in de Insights-store en maakt het direct zichtbaar in het dashboard.

In Databricks-modus registreert de adapter dezelfde lineagestructuur en synchroniseert die naar de Insights-store via de sync-route. Het dashboard is in beide gevallen identiek.

Een lineage-event in de praktijk

Een event voor de stap van bronze naar silver ziet er zo uit:

{
  "run_id": "bronsysteem_a__bronze_to_silver__20260304T141500Z",
  "dataset_id": "bronsysteem_a",
  "step": "bronze_to_silver",
  "timestamp_utc": "2026-03-04T14:15:00Z",
  "hops": [
    {
      "source_entity": "bronsysteem_a_raw",
      "target_entity": "silver_kerntabel",
      "attribute_map": {
        "regio_code": ["RegioCode"],
        "metriek_a": ["MetriekA"],
        "metriek_b": ["MetriekB"]
      }
    }
  ]
}

Dat is het verschil tussen “we hebben een silver-model” en “we kunnen herleiden hoe de silver-kolommen zijn opgebouwd, voor welke run en op welk moment”.

Zichtbaar in het dashboard

Na registratie is de volledige lineageketen zichtbaar in het Latero Control-dashboard. Het lineage-overzicht toont de keten van bronbestand tot publicatietabel als interactief graaf: welke entiteiten zijn verbonden, via welke stappen, en in welke run.

Dat is niet alleen nuttig voor audit of toezicht. Ook bij operationele verstoringen helpt het direct. Als een gold-kolom ineens leegloopt of een onverwachte afwijking toont, is snel terug te vinden in welke stap de afwijking is geïntroduceerd.

Lineage als instrumentatie

Een architectuurplaatje beschrijft hoe een systeem hoort te werken. De lineageregistratie legt vast hoe het systeem in een concrete run heeft gewerkt. Dat onderscheid is wezenlijk.

Lineage is daarmee geen bijlage bij de pipeline. Het is onderdeel van de bestuurlijke en technische uitlegbaarheid ervan.

Heeft dit artikel vragen opgeroepen over uw eigen architectuurvraagstuk?

Neem contact op