„Daten haben in den Ministerien nicht die notwendige Priorität“

Lesedauer beträgt 4 Minuten
Autor: Josef Ruhaltinger

Das Austrian Micro Data Center hat das Zeug, zum Mekka der heimischen Datenforscher zu werden. Großes Manko bleibt aber die Datenlage: Fast alle Bundesministerien weigern sich, ihre anonymisierten Mikrodaten zur Verfügung zu stellen.

Die Forschungsfrage führt zu den großen ideologischen Reibepunkten dieser Welt: Wie stark bestimmt das Elternhaus den Lebensweg seiner Kinder? Welche Eigenschaften werden vererbt, welche erworben? Der frisch gebackene WU-Professor für Volkswirtschaft Martin Halla – er wechselte im Sommer von der JKU Linz in die Bundeshauptstadt – setzt im Herbst ein Forschungsprojekt zur „intergenerationalen Vererbung“ auf. Die konkreten Fragen: Welche Verbindungen gibt es zwischen dem Einkommen des Elternhauses und der sozioökonomischen Bettung ihrer Nachfahren. Wie viel haben die Krankheiten der Eltern mit der gesundheitlichen Disposition der Kinder zu tun? „Wir wollen belegbare Antworten, wie stark die Vorgängergeneration ihre Nachfahren prägt“, so Halla. Um die Fragen zu beantworten, will er verschiedene Daten aus dem Steuerbereich mit Daten des Geburten-, Sterbe- und Krebsregisters verknüpfen.

Verknüpfen statt spekulieren. Das AMDC erlaubt den heimischen Wissenschaftlern den Einstieg in zeitgemäße Datenforschung. Im Bild: Tobias Thomas (Statistik Austria), Martin Polaschek (Wissenschaftsminister) und Heinz Faßmann (ÖAW).

Bis 1. Juli des Vorjahres war ein Projekt mit dieser Fragestellung nicht durchführbar: Erst das neu gegründete Austrian Micro Data Center (AMDC) der Statistik Austria erlaubt Forschern, mit den pseudonymisierten Mikrodaten von Personen und Unternehmen zu arbeiten, die in staatlichen Behörden und Institutionen schlummern. Seither können Martin Halla und Kollegen nach einem (strengen) Akkreditierungs- und Zugangsverfahren tief in den Mikrodaten der Statistik Austria und den Registerdaten der österreichischen Bundesregierung wühlen. Der große Fortschritt zu früheren Verhältnissen: Die Mikrodaten können beim AMDC Datensätze der Statistik Austria, aus Verwaltungsregistern und von den Forschern selbst eingebrachte Mikrodaten miteinander verknüpfen. Vorher war die Verbindung derartiger Daten mit Argumenten des Datenschutzes rechtlich unmöglich – für den heimischen Wissenschaftsstandort ein untragbarer Zustand. Um dies zu ändern, bedurfte es im November 2021 einer Novellierung des Bundesstatistikgesetzes und des Forschungsorganisationsgesetzes.

Martin Halla ist sicher, dass „wir ohne Leidensdruck der Pandemie von einer derartigen Einrichtung nur reden würden“. Der Proponent der Plattform Registerforschung – ein „informelles Netzwerk“ heimischer Datenforscher – empfindet die Einrichtung des Austrian Micro Data Centers daher als „echten Fortschritt“. Er spricht sogar von „Durchbruch“ – mit der großen Einschränkung: „Wir haben im AMDC zu wenig Daten.“

Sitzt auf Nadeln. Registerforscher Martin Halla will endlich Zugang zu den Daten im Umfeld der heimischen Ministerien. Er verspricht: Mit den Daten von Gesundheitsministerium und Kassen könnte „die Lücke zu den skandinavischen eHealth-Systemen in wenigen Jahren“ geschlossen werden.

Ministerien geben Daten nicht her

Datenforschung ist ein komplexes Handwerk. Um Informationen miteinander in Beziehung setzen zu können, braucht es neben den rechtlichen Voraussetzungen auch gemeinsame technische Standards. Bei der Standardisierung sind heimische Datenpools im internationalen Vergleich gut aufgestellt. Vor allem bei den Gesundheitsdaten hat die Einführung von ELGA seit 2015 wichtige Vorarbeit geleistet. Blöd nur, dass mit ELGA-Daten nicht geforscht werden kann. Der Hauptgrund: Das Gesundheitsministerium gibt die Daten seines Einflussbereiches nicht frei – so wie alle anderen Bundesministerien mit Ausnahme des Wissenschaftsministeriums.

Aber der Reihe nach: Hauptamtlicher Datenspender ist derzeit die AMDC-Mutter Statistik Austria selbst. Von den aktuell zur Verfügung stehenden 94 Mikrodatensätzen – darunter Geburtenregister, Sterbetafel, Krebsregister, aber auch zentrales Melderegister, Körperschafts-, Einkommens- und Mehrwertsteuerdaten – sind 92 aus dem Verfügungsbereich der Statistik Austria. Laut Plan sollten weitere wichtige Datenquellen aus den Bundesministerien kommen. Dazu braucht es neben einer formalen Zustimmung des Wissenschaftsministeriums eine Minister- Verordnung des jeweiligen Ressorts. Bisher hat allein das Wissenschaftsministerium – zu dem Standard Austria gehört – zwei (in Ziffern: 2) Mikrodatenregister zur Verfügung gestellt. Bei allen anderen Bundesministerien ist der Leistungsbericht schnell geschrieben: Zero!

Regina Fuchs ist Leiterin der Direktion Bevölkerung und des Center Wissenschaft, zu der das AM-Datencenter ressortiert. „Sagen wir so: Die Bereitstellung von Daten für das AMDC genießt in den Ministerien nicht oberste Priorität“, bleibt die Zahlen-Managerin zurückhaltend. Das Bemühen ihres Hauses um eine breitere Datengrundlage sei „intensiv und zeitraubend“. Eine Anfrage an das Epidemiologische Meldesystem dauere drei Monate, an die Impfdatenbank sechs Monate, bei Projekten mit den Gesundheitskassen könne schon mal ein Jahr vergehen, bis reagiert werde. Kurz: Die Bereitschaft von Ministerien und anderen öffentlichen Institutionen, ihre Daten für Forschungszwecke zur Verfügung zu stellen, ist äußerst gering. Simulationsforscher Niki Popper begründet die ministerielle Zurückhaltung in einem früheren ÖKZ-Interview mit einem einfachen Reflex: „Daten bedeuten Macht.“ Es gebe eine „natürliche Scheu der Institutionen“, über ihre Daten vergleichbar zu werden (siehe dazu Titelgeschichte „Datenneid“, ÖKZ 8-9/23). Forscherkollege Martin Halla ist speziell von der mangelnden Durchsetzungskraft von Gesundheitsminister Johannes Rauch enttäuscht: „Er kann nicht in jedem Interview jammern, dass die Nutzung der Gesundheitsdaten vorangetrieben werden muss und dann die Daten des eigenen Hauses zurückhalten.“ Und er verspricht: „Sobald uns die Datensätze des Gesundheitsministeriums zur Verfügung stehen, können wir die Lücke zu den skandinavischen eHealth-Systemen in wenigen Jahren schließen“. Auch bleibt ihm die Rolle der Gesundheitskassen unverständlich: „Dort gibt es ein Gebirge an Leistungs- und Gesundheitsdaten. Und wir dürfen sie nicht nutzen.“

Datenschätze sind teuer

Im Namen der Forschung führt Martin Halla noch eine wesentliche Klage zum AMDC: „Es ist sauteuer.“ Ein kleineres Projekt kostet beim AMDC mit maximal zwei Zugangsberechtigungen und einem überschaubaren Warenkorb an Datensätzen um die 10.000 Euro. Damit ist bei vielen Projekten an den akkreditierten Instituten schnell Ruhe im Labor. Statistik Austria-Direktorin Regina Fuchs versteht die Geldnöte der Wissenschaftler. Es bleibe aber angesichts des knappen AMDC-Budgets von 505.000 Euro keine Wahl: „Der Rest der Kosten muss von den Kunden kommen.“ 

Der Zugang zum AMDC ist streng definiert

– Eine Akkreditierung bei Statistik Austria ist Voraussetzung, um mit dem AMDC zu arbeiten. Die Zulassung gibt es ausschließlich für wissenschaftliche Einrichtungen, gültig für fünf Jahre. Aktuell sind 50 Forschungsinstitutionen akkreditiert, davon sechs aus dem Ausland.
– Fest angestellte Mitarbeiter der akkreditierten Unis und Institute können über eine Applikation einen Antrag auf Online-Datenzugang im Rahmen eines konkreten Forschungsvorhabens stellen. Darin muss begründet werden, warum man für das Projekt auf Daten des AMDC zugreifen will.
– Im Antrag muss definiert sein, auf welche Datensätze von wie vielen Projektmitarbeitern zugegriffen werden soll.
– Die Forschenden verpflichten sich zur Einhaltung der technischen und organisatorischen Maßnahmen iSd DSGVO und zur Geheimhaltung.
– Wird das Forschungsprojekt von der Statistik Austria ange­nommen, erstellt diese ein Angebot.
– Sofern die antragstellende Forschungsinstitution den Kostenvoranschlag finanzieren kann und akzeptiert, wird ein Vertrag erstellt.
– Jeder Projektmitarbeiter erhält einen (kostenpflichtigen) Zugang über eine virtuelle Desktop-Infrastruktur (VDI) mit der Software VMware Horizon Client. Zusätzlich ist der Zugang durch eine Zwei-Faktor-Authentifizierung gesichert.
– Die Daten verbleiben immer auf den Servern von Statistik Austria.
– Am Ende jedes Projektes kommt es zu einer Output-Kontrolle durch Statistik Austria.

Diese Artikel könnten Sie auch interessieren: