Landkarte

Serie Datenintegrität Schritt 2: Festlegen der Legende – Definieren der Begriffe zur Datenintegrität

von

Im ersten Artikel (Schritt 1) dieser Serie bin ich auf die allgemeinen rechtlichen Grundlagen der Datenintegrität eingegangen und habe dargelegt, dass die Basis recht klar definiert ist, viele Begriffe und Definitionen jedoch unklar sind. Das macht uns das Leben nicht unbedingt leichter. 

In diesem Artikel werde ich noch einmal vertiefend auf dieses Thema eingehen. Ich werde Ihnen die Quellen zu diversen Definitionen nennen, sowie Ihnen Ansätze liefern, aus denen Sie Ihre eigene Definition erstellen und festlegen können. Außerdem werde ich Ihnen die wichtigsten Rollen und Begriffe auflisten. 

30.000 Fuß – Zoom Out: Wo stehen wir in Bezug auf den Gesamtprozess?

Wir befinden uns im ersten von drei Blöcken auf unserem Weg zur klaren Struktur in der Datenintegrität. Im ersten Block kümmern wir uns dabei um das Festlegen der Legende, also die rechtlichen Grundlagen, sowie das Definieren von Begriffen für den weiteren Prozess. Damit legen wir das Fundament für alle weiteren Schritte.  

Im zweiten Block führen wir dann die Bestandsaufnahmen durch und bringen unsere Definitionen aus Block 1 in Relation dazu. Im dritten Block entwickeln wir schließlich geeignete Maßnahmen, welche zu unserer Umgebung passen und legen die Prioritäten fest. 

 

Alle Artikel der Serie finden Sie hier:

übersicht serie

Schritt 2: Festlegen der Begriffe

Ein großer Teil der Verwirrung in datenintegritäts- und anderen abteilungsübergreifenden Projekten kommt aus unklaren Definitionen. Deswegen ist es extrem wichtig, Begriffe sauber festzuschreiben. 

  • Was sind unsere Rollen? 
  • Was bezeichnen wir als Rohdaten? 
  • Wie definieren wir ein System, Gerät? 
  • …. 

Als sehr hilfreich hat sich hier ein Firmenglossar erwiesen, auf den aus allen Teilbereichen heraus referenziert wird. 

Die Legende: Unsere Definitionen für die Datenintegrität

Rohdaten

Die FDA sagt hier:

Zitat

Das bedeutet für uns, dass wir alle Daten, die zu einer Qualitätsentscheidung führen, als Rohdaten definieren und auch so behandeln müssen. Wir müssen also das Original oder eine True Copy über den Zeitraum, über den wir zur Aufbewahrung verpflichtet sind, aufheben. 

Weiterführende Unterlagen sprechen bei den Rohdaten auch von der ersten festen Speicherung und genau das ist unsere Stellschraube. Legen Sie für Ihre Unternehmen den Punkt fest, wo Rohdaten erstmalig fest gespeichert werden. Dadurch haben Sie die Möglichkeit den Aufwand deutlich zu reduzieren. Wichtig ist dabei, dass die Daten auf dem Weg zu diesem ersten festen Speicherort nicht verändert werden und der Weg validiert ist. 

Metadaten

Im eigentlichen Sinne sind die Rohdaten nur das reine Datenfeld. Nehmen wir beispielsweise die Zahl 5. Es ist offensichtlich, dass dieser Wert alleine keinen Wert hat – Brüller [Symbol]…. Der musste sein! Erst durch den Kontext, die Metadaten, erhält ein Wert eine Bedeutung. Metadaten sind zum Beispiel die Einheiten wie ml, l oder kg und andere beschreibende Informationen, wie das Datum der Erstellung, der Erfasser aber auch der Audit Trail. 

Da Daten ihren Wert und ihre Bedeutung nur im Kontext der Metadaten erhalten, sind wir verpflichtet, auch die Metadaten über den gesamten vorgeschriebenen Zeitraum aufzubewahren. 

Prozessdaten

Im Gegensatz zu den Rohdaten sind Prozessdaten reproduzierbar. Wenn wir also aus unterschiedlichen Einwaage-Mengen (Rohdaten) eine Summe bilden, gehört diese Summe zu den Prozessdaten. Denn wir würden mit denselben Eingabewerten wieder exakt dasselbe Ergebnis erhalten. Wichtig ist hierbei immer, dass der Weg validiert sein muss. 

In dem wir also mit Roh- und Prozessdaten verschieden umgehen, haben wir die Möglichkeit, unsere Abläufe zu verbessern. Wenn wir also einen Messwert auf einem Gerät erfassen und ihn dann unverändert über ein weiteres Gerät zu einem Zielspeicher bewegen und der Weg selbst validiert ist, können wir das erste Speichern im Zielspeicher als erste feste Speicherung definieren. 

cGMP

cGMP ist ein neuerer Begriff aus den Büchern der FDA. Er steht für current GMP und definiert den Stand der Technik. Über diesen Kunstgriff kann die FDA Anforderungen, die in z.B. geeigneten ISO Normen definiert sind, auch dann referenzieren, wenn die Anforderungen nicht ausdrücklich in FDA Texten gelistet sind. Dadurch wird der Weg geebnet, schneller auf sich verändernde Situationen reagieren zu können. 

Statische und dynamische Daten

Das Begriffspaar statische und dynamische Daten sorgt aktuell für die größte Verwirrung. Auch wenn beide Begriffe in Papieren von der FDA, MHRA, PIC/s und WHO definiert werden, werden sie mit unterschiedlicher Bedeutung und Anforderungen verwendet. Während wir im Bereich der FDA dynamische Daten für den Produktlebenszyklus reprozessierbar aufbewahren müssen, sehen andere Behörden es als ausreichend an, die Daten reproduzierbar abzulegen. 

Dynamische Daten sind solche, die erst durch ihre subjektive Bewertung einen Wert erhalten. Während statische Daten, wie z.B. ein einzelner Messwert (5 Grad Celsius) alleine bewertet werden können, müssen dynamische Daten wie z.B. Chromatographie- daten ausgewertet, integriert und bewertet werden. 

Reproduzierbar vs. reprozessierbar

Auch wenn sich die Begriffe nicht sehr unterschiedlich anhören, ist der Unterschied enorm. Reproduzierbar bedeutet, dass wir den Weg zu unserem Ergebnis reproduzieren, also beweisen können. Reprozessierbarkeit dagegen bedeutet, dass wir die Berechnung selbst erneut durchführen können. 

Praxisbeispiel: Bewertung von Temperaturverläufen 

Definition in Tabelle

Die Vor- und Nachteile liegen auf der Hand. Während wir auf der einen Seite viel mehr Daten aufbewahren müssen, können wir auf der anderen Seite wesentlich mehr mit den Daten anfangen. Im umgedrehten Fall müssen wir zwar weniger Daten aufheben, können dafür später allerdings auch keine weiteren Auswertungen mehr durchführen. 

Data Governance

Sowohl der PIC/s Guide der Inspectors Working Group als auch die WHO fordern in ihren Dokumenten Data Governance. Dazu gehören alle Prozesse, die die Datenitegrität unterstützen, also SOPs, Anweisungen etc., und Daten, die zu diesem Thema beitragen, wie z.B. Schulungsanweisungen, etc.

Audit Trail

Der Audit Trail ist die vollständige Protokollierung der Erstellung, Änderung und Löschung von GPM Daten und Metadaten. Auch das Aktivieren und Deaktivieren des Audit Trails gehört in den Audit Trail! Über ihn können wir beweisen, dass unsere Daten unverändert sind. Der Audit Trail ist einem periodischen Review zu unterziehen. 

Audit Trail Review

Der periodische Review ist eine der größeren Aufgaben, die hinzugekommen sind. Wir müssen den Audit Trail risikobasiert regelmäßig überprüfen. In der Praxis hat sich dazu ein kombinierter Review im Kontext der Chargenfreigabe für die reinen GMP Daten und quartalsmäßig für andere relevante Parameter etabliert. 

Das wichtigste Steuerrad ist dabei der Begriff „relevant“. Wir müssen die relevanten Daten überprüfen. Also die Daten, die wiederum in Qualitätsentscheidungen einfließen. Für die FDA müssen dabei Erstellung, Änderung und Löschung Bestandteil des Reviews sein. Im europäischen Raum sind Änderung und Löschung als Grundbestandteile Audit Trails ausreichend. 

Die größte Herausforderung dabei ist dabei, dass Systeme entweder keine Audit Trails liefern oder diese zu viel oder zu wenig Information beinhalten. Daher ist es hilfreich, wenn der Audit Trail auf relevante Daten begrenzt werden kann. Aus diesem Grund empfiehlt es sich, die Anforderungen an den Audit Trail bereits in der Planungsphase noch vor der Bestellung zu berücksichtigen und in das Lastenheft zu integrieren. 

Vorhaltezeit und Löschung

Extrem wichtig für uns ist die Vorhaltezeit von Daten. Dabei geht es darum, wie lange wir Daten aufbewahren müssen und wann / wie wir diese löschen.  

Richtig, wann werden Daten gelöscht? In der Praxis ist es heute oft so, dass Daten überhaupt nicht gelöscht werden, was allerdings wieder zu einem Compliance Issue in Bezug auf andere Rechtsvorgaben, wie zum Beispiel den Datenschutz, führen kann. Der Datenschutz untersagt uns im Allgemeinen Daten zu speichern, so lange wir keine ausreichenden Gründe dafür haben. Einen ausreichenden Grund zur Datenspeicherung, sowie den Zeitraum liefern uns jedoch die GxP-Vorgaben. Nach Ablauf der darin definierten Frist, entfallen diese Gründe allerdings und wir befinden uns bzgl. des Datenschutzes im Strafbereich (ab Mai 2018 bis zu 3% des Konzernumsatzes). 

Die Vorhaltezeiten sind je nach Produkten unterschiedlich und reichen von 3 bis 30 Jahren bei bspw. klinischen Studien oder Blutprodukten. 

Eine Falle kann dabei zum Beispiel sein, dass Daten, die während der Produktion anfallen, normalerweise im Kontext der jeweils produzierten Charge betrachtet werden müssen. Während Daten, die das Produkt gesamt (bspw. die Methodenvalidierung) betreffen, auf die gesamte Lebensdauer des Produktes am Markt bezogen werden müssen. Die Vorgaben über Vorhaltezeiten und Löschung werden vom Dateneigner festgelegt.  

Archivierung, Backup, Langzeitspeicherung

Die Archivierung ist ein oft falsch verwendeter Begriff. Archivierung bedeutet, dass Daten aus dem normalen Zugriff herausgenommen werden. Überträgt man das auf Daten, welche schriftlich auf Papier gespeichert sind, bedeutet dies, sie werden in einen separaten Schrank abgelegt. Jetzt haben nicht mehr alle Personen Zugriff auf diese Daten. Die Einlagerung sowie der Zugriff wird dokumentiert. 

Damit wird deutlich, dass ein Backup kein Archiv ist und dies auch nicht leisten kann. Die gute Nachricht daran ist, dass die langfristige Aufbewahrung von Backups (länger als ein Jahr) keinen Sinn macht und daher entfallen kann. 

Der Dritte hier im Bunde ist die Langzeitspeicherung. Dabei werden in einem Dokumentenmanagement-System (DMS) oder auf Festplatten in einem WORM (Write once read many) Daten so gespeichert, dass sie für eine definierbare Dauer nicht verändert werden können. 

Data Owner / Dateneigner

Als Ergänzung zum System- und Prozesseigner wurde der Begriff Dateneigner neu eingeführt. Dieser ist für alle Entscheidungen, die die Daten betreffen, verantwortlich. Dazu gehört das Festlegen, wie lange Daten gespeichert werden und wann sie gelöscht werden können/sollen. In vielen Fällen der GMP-Produktion entspricht der Dateneigner dem Prozesseigner. Im Bereich der klinischen Forschung sind diese beiden jedoch oft getrennt. 

Datenlebenszyklus

Der Datenlebenszyklus beschreibt die unterschiedlichen Phasen von Daten. In jeder Phase ergeben sich unterschiedliche Anforderungen. Daher kann man den Datenlebenszyklus verwenden, um die eigenen Handlungen zu definieren. Wenn bspw. auf einem Gerät keine Datenänderung mehr erfolgt, muss es dafür auch keine Kontrollen mehr geben. 

Vom Prinzip her unterscheide ich zwei unterschiedliche Zyklen für lebende Dokumente. Diese sind zum einen bspw. SOPs, die versioniert werden und zum anderen Berichte und ähnliche Daten, die nur einmal erfasst werden. Typische Phasen des Zyklus sind:

Systemkategorien

Es ist essentiell, dass jedes Unternehmen die eigenen Systemkategorien identifiziert und definiert. Diese Definitionen werden wir auch in den kommenden Schritten zur Datenintegrität noch benötigen.

Fazit

Eine saubere Definition der unterschiedlichen Begriffe ist die Basis für alle weiteren Arbeiten. Daher habe ich hier für Sie die wichtigsten Begriffe zusammenfassend aufgezeigt und Abgrenzungen sowie einige Risiken dargestellt. Meine Empfehlung für Sie: Ergänzen Sie fehlende Begriffe sofort in Ihrem Firmenglossar und achten Sie in Zukunft auf abteilungs- und projektübergreifend einheitliche Nutzung der Begriffe. 

Ausblick

Nachdem wir uns nun eine einheitliche Basis bei Begriffen und Definitionen, die für unsere Arbeit notwendig sind, erarbeitet haben, werde ich im nächsten Artikel der Serie die Schnittstellen genauer betrachten.

Welche Herausforderungen hatten Sie schon bei der mit Begriffsdefinitionen? Habe ich einen wichtigen Begriff nicht erläutert? Haben Sie ein Beispiel oder eine Frage? Kommentieren Sie hier oder kontaktieren sich mich direkt. 

Mit chaotischen Grüßen,
Christof Layher
Der Chaos Experte 

 

Dies könnte ihnen auch gefallen

2 Kommentar
  1. […] der ersten Phase haben wir uns mit Begrifflichkeiten und Hintergrundfragen auseinandergesetzt. In der zweiten Phase, in der wir uns gerade befinden, […]

  2. […] zur klaren Struktur in der Datenintegrität.  Im ersten Block kümmern wir uns dabei um das Festlegen der Legende, also die rechtlichen Grundlagen, sowie das Definieren von Begriffen für den weiteren Prozess. […]

Kommentare sind deaktiviert.

Datenschutz
Ich, Christof Layher (Wohnort: Deutschland), verarbeite zum Betrieb dieser Website personenbezogene Daten nur im technisch unbedingt notwendigen Umfang. Alle Details dazu in meiner Datenschutzerklärung.
Datenschutz
Ich, Christof Layher (Wohnort: Deutschland), verarbeite zum Betrieb dieser Website personenbezogene Daten nur im technisch unbedingt notwendigen Umfang. Alle Details dazu in meiner Datenschutzerklärung.