Data Lineage goes Traceability

In wie weit kann das BI-Konzept Data Lineage als Vorlage für Traceability-Anforderungen beim Requirements Engineering dienen?

Data Lineage, oder auch Datenherkunft, steht für die Fragestellung, zu gegebenen aggregierten Datensätzen die ursprünglichen Datensätze zu bestimmen, aus denen Sie entstanden sind. Um die Verwendung und Verfolgung von Attributen über die verschiedenen Ebenen einer Data Warehouse Infrastruktur zu ermöglichen, ist Data Lineage als Konzept in Business Intelligence Systemen somit unabdingbar. Ausgehend von den Attributen des fachlichen Datenmodells über die Spalten des physischen Datenbankmodells der operativen Systeme werden die Informationen von der Ladeschicht über die Data Warehouse Schicht bis zur Data Mart Schicht per Data Lineage verfolgt. Diese Konzepte und Mechanismen sowie geeignete Werkzeugunterstützung lassen sich nahezu 1:1 auf die Traceability-Anforderungen eines Requirements Engineering & Management anwenden.

Data Lineage als Grundprinzip

Zur Verfolgung von Datensätzen über die verschiedenen Ebenen einer Data Warehouse-Architektur werden die jeweiligen Attribute auf den unterschiedlichen Ebenen mit Abhängigkeiten verbunden. Zusätzlich kann die Abhängigkeit noch mit einer Transformationsregel erweitert werden. Mit einem einfachen Abhängigkeitsgraphen kann so die Datenherkunft jedes einzelnen Attributs eines Datensatzes bestimmt werden.

MID Data-Linage

Abbildung 1: Data Lineage für die Basis-Kennzahl "Betrag Geleistete Stunden", Quelle: MID GmbH

Dieses Grundprinzip lässt sich auch in der Softwareentwicklung anwenden, nur dass hier die Art der Elemente vielfältiger ist. Hierbei handelt es sich nicht nur um Attribute von Entitäten, Spalten von Tabellen oder Würfeln, sondern um unterschiedlichste Instanzen der verschiedenen Metamodelle, unter anderem UML 2, BPMN 2. Meist sogar noch ergänzt um textuelle Artefakte wie funktionale Anforderungen, Abnahmekriterien, Risiken und Testfälle. Dadurch ergeben sich eine Reihe von möglichen Beziehungen und Abhängigkeiten, die entweder von Hand im Rahmen der Modellierung explizit erzeugt oder implizit durch die Metamodell-Beziehungen hergestellt werden.

Fazit

Traceability ist in einer modellbasierten Vorgehensweise beim Einsatz von modernen Modellierungswerkzeugen mit unterschiedlichen Darstellungs- und Auswertungsfunktionalitäten effizient und effektiv einsetzbar.

Ein ausführlicherer Vergleich beider Konzepte anhand kleiner Praxisbeispiele finden Sie unter http://blog.mid.de/data-lineage-goes-traceability-oder-was-requirements-engineering-von-business-intelligence-lernen-kann/.

Kontakt: Ilka Plail, Marketing Manager, MID GmbH, marketing@mid.de
www.mid.de