Datenlabore: Daten. Schnell. Nutzen.

| Artikel

Die öffentliche Hand hat Zugriff auf eine enorme Menge an Daten. Die effektive Nutzung dieser Daten zur Entscheidungsfindung kann Regierung und Verwaltung unter anderem dabei helfen, schneller auf Krisen zu reagieren, deren Auswirkungen präziser zu bewerten, gezielte Maßnahmen zu entwickeln und das Vertrauen der Öffentlichkeit in ihr Handeln zu stärken. Neue Technologien wie generative KI können dazu beitragen, große Datenmengen effektiv zu nutzen.

Dennoch stehen Behörden bei der Datenverwendung häufig vor Herausforderungen: Die Qualität der Daten variiert, sie sind oftmals verstreut oder nicht digital verfügbar und ihre Interoperabilität ist eingeschränkt. Weitere Faktoren wie die Größe und Komplexität staatlicher Institutionen sowie fragmentierte, veraltete Technologien erschweren eine rasche Skalierung von Datenarbeiten und
führen zu sogenannten technischen Schulden, die Innovation und Fortschritt behindern. Darüber hinaus haben öffentliche Einrichtungen Schwierigkeiten bei der Gewinnung qualifizierter IT-Fachkräfte. Sie müssen einerseits eine große Anzahl Mitarbeitender weiterbilden und andererseits mit der Privatwirtschaft um hochqualifizierte IT-Expert:innen konkurrieren.

Trotz dieser Herausforderungen haben einige öffentliche Stellen Fortschritte bei der Nutzung von Daten erzielt, indem sie spezialisierte Datenlabore eingerichtet haben und Daten wie ein Produkt behandeln. Unternehmen in der Privatwirtschaft, die Daten als Produkt betrachten, konnten die Umsetzungszeit datenbezogener Anwendungsfälle um bis zu 90% reduzieren. Im Folgenden stellen wir Anwendungsfälle vor, die zeigen, dass auch im öffentlichen Sektor ein ähnliches Potenzial besteht, und erläutern, wie Datenlabore genutzt werden können, um das volle Potenzial der Daten auszuschöpfen.

Behandlung von Daten als Produkt

Daten als Produkt zu behandeln bedeutet, mit Fokus auf Nutzende einen klar abgegrenzten Informationsbedarf festzulegen und durch die Erschließung spezifischer Daten zu bedienen. Beispiele dafür umfassen unter anderem Ad-hoc-Analysen, Analysemodelle (z.B. sogenannte digitale Zwillinge, KI- oder ML-Modelle) sowie interaktive Datenvisualisierungen und Dashboards. Um den Anforderungen verschiedener Kundengruppen gerecht zu werden, entwickeln Unternehmen oft zunächst ein Basisprodukt, das dann durch spezifische Anpassungen an die Bedürfnisse unterschiedlicher Kundengruppen angepasst wird. Datenprodukte können ähnlich behandelt werden. Ein Datenprodukt sollte nutzerorientiert, modular und wiederverwendbar aufgebaut sein. Die folgenden Beispiele verdeutlichen, wie Datenprodukte eine effizientere Nutzung von Daten ermöglichen und Mehrwert schaffen können:

Digitale Zwillinge für die Verkehrswende in europäischen Großstädten. Stadtverwaltungen haben anonymisierte Daten von Millionen von Pendler:innen und anderen Quellen
wie Bevölkerungsdaten und Beschäftigungszahlen genutzt, um digitale Zwillinge der Verkehrssysteme zu erstellen. Diese datenbasierten Simulationsmodelle unterstützen die Umstellung der lokalen Verkehrssektoren. Ein Datenlabor konnte innerhalb von acht Wochen ein Modell entwickeln, das eine Stadt bei der Erarbeitung einer kohlenstoffneutralen Mobilitätsstrategie unterstützte. Das Modell bietet Entscheidungsträger:innen ein Instrument, um die Auswirkungen von Verkehrsinitiativen wie CO2-Reduzierung und Pendelzeiten abzuschätzen.

Nowcasting zur Bereitstellung von Erkenntnissen in Echtzeit. Nowcasting-Modelle liefern Echtzeitschätzungen, sind im öffentlichen Sektor jedoch noch nicht weit verbreitet. Dabei können diese Modelle Verzögerungen bei der Veröffentlichung von Informationen verringern. Ein europäisches nationales statistisches Amt hat ein regressionsbasiertes Nowcasting-Modell entwickelt, das wichtige Wachstumsindikatoren mit einer Veröffentlichungsverzögerung von höchstens zwei bis drei Wochen liefert. Das Modell stützt sich sowohl auf konventionelle Variablen wie Arbeitslosenstatistiken und Ölpreise als auch auf experimentelle Variablen wie Mautgebühren und Google-Trends. Im Vergleich zu gängigen statistischen Methoden erzielt es qualitativ vergleichbare Ergebnisse.

Datenmodell und Dashboard für Krisenmanagement. In zahlreichen Regionen, darunter Europa, werden zuverlässige und zeitnahe Daten benötigt, um auf Migrationsströme gezielt reagieren zu können. Zur Unterstützung des Migrationsmanagements auf Bundes-, Landes- und kommunaler Ebene hat eine europäische Bundesbehörde ein nutzerfreundliches digitales Migrations-Dashboard entwickelt. Dieses Dashboard dient als primäre Informationsquelle, aggregiert relevante Daten und ermöglicht eine transparente und faktenbasierte Entscheidungsfindung in nahezu Echtzeit. Es unterstützt unter anderem die Kapazitätsplanung von Unterkünften und Schulen angesichts wachsender Bevölkerungszahlen und sprachlicher Vielfalt. Durch die Behandlung der Lösung als Datenprodukt konnte ein Datenlabor innerhalb von drei Monaten ein Dashboard entwickeln und bereitstellen – und das trotz fragmentierter Datenquellen und unterschiedlicher Anforderungen sehr diverser Nutzergruppen.
 
Einrichtung von Datenlaboren zur Erschließung des Datenpotenzials

In den genannten Beispielen spielte die Arbeit von Datenlaboren eine entscheidende Rolle bei der Beschleunigung von Anwendungsfällen und Optimierung der Entscheidungsfindung. Ein Datenlabor ist eine Data-Science-Einheit innerhalb einer staatlichen Einrichtung, die mit einem anwendungsorientierten Ansatz Datenprodukte wie KI-Modelle oder Dashboards entwickelt. Im Gegensatz zum traditionellen Transformationsansatz, der sich oft auf langfristige Technologie- und Datentransformationen konzentriert, bündelt ein Datenlabor analytische Fähigkeiten innerhalb der Organisation und baut Ressourcen auf, um die Entwicklung von Datenprodukten für andere Abteilungen zu beschleunigen. Nach Abschluss eines Datenprodukts übergibt das Datenlabor das Produkt an die jeweilige Abteilung und widmet sich dann wieder der Entwicklung neuer Datenprodukte sowie dem Experimentieren mit neuen Methoden und Technologien. Der Austausch von Erkenntnissen mit anderen Datenlaboren ist entscheidend, um die Verwaltung insgesamt in puncto Technologie und Innovation voranzubringen.

Unserer Erfahrung nach sind öffentliche Institutionen in der Lage, Datenlabore innerhalb von zwei bis vier Monaten aufzubauen sowie die erforderlichen Organisationsstrukturen, Prozesse und Arbeitsweisen zu etablieren. Dazu werden auch Portfoliomanagement- und Innovationsansätze, Stakeholdermanagement- und Kommunikationsformate sowie technologische Grundlagen und Talentmanagement implementiert.

Der Aufbau einer leistungsstarken Datenanalyseabteilung ist dabei nicht einfach. Typische Fallstricke können den Aufbau und die Wirkung der Arbeit eines Datenlabors erschweren: Ohne eine klare Vision und Ausrichtung laufen neue Analyseeinheiten Gefahr, sich in einer Vielzahl von Anfragen zu verzetteln, wenn sie zu viele Anwendungsfälle gleichzeitig zu bearbeiten versuchen. Eine zu geringe Aufmerksamkeit auf Seiten der obersten Leitungsebenen verstärkt dieses Risiko oft und kann dazu führen, dass sich die Einheit in der Lösung von „Datenproblemen“ verliert, anstatt die Lösung relevanter fachlicher Herausforderungen und die Bedürfnisse der Nutzenden in den Mittelpunkt zu stellen. Darüber hinaus kann die Innovationskraft des Datenlabors gehemmt werden, wenn wichtige Ressourcen für den Betrieb und die Pflege bereits entwickelter Datenprodukte eingesetzt werden, statt an der Entwicklung neuer Datenprodukte zu arbeiten. Eine weitere häufige Herausforderung besteht in vorhandenen (Alt-)Technologien, die den Lösungsraum und die Innovationskraft eines Datenlabors einschränken können. Verstärkt wird dies, wenn versucht wird, neue Infrastrukturen ganzheitlich neu aufzubauen, was meist zu langen Implementierungszeiten und Verzögerungen führt. Schließlich stellt die Gewinnung der notwendigen Talente (z.B. IT-Fachkräfte und Rollen im Kontext von Data Science, Engineering, Architecture) und deren Integration in die Arbeitsweisen und Laufbahnen von öffentlichen Organisationen eine bekannte Herausforderung dar.

Die folgenden sechs Maßnahmen können Datenlaboren helfen, die Herausforderungen zu bewältigen und Datenprodukte schnell, nutzer- und wirkungszentriert zu entwickeln.

1. Auf wirkungsvolle Anwendungsfälle fokussieren
Datenlabore können aktiv zur Bewältigung aktueller und drängender Herausforderungen beitragen. Durch die frühzeitige Etablierung einer Pipeline (gesamtgesellschaftlich) relevanter Anwendungsfälle kann ein klarer Fokus auf Relevanz und Wirkung sichergestellt, die Bedeutung der Arbeit der Datenlabore sichtbar gemacht und auch die notwendige Unterstützung der Leitungsebenen gewonnen werden. Eine solche Ausrichtung trägt auch dazu bei, Fachkräfte aus der Technologiebranche anzuziehen. Gleichzeitig kann dadurch vermieden werden, dass sich Datenlabore in einer Flut von Anfragen verzetteln oder in der Lösung von Expertenfragen verlieren.

2. Nutzerorientierte Arbeitsweisen einführen 
Bei der Entwicklung von Datenprodukten spielen Nutzerorientierung und -erlebnis eine entscheidende Rolle. Datenlabore profitieren davon, Nutzeranforderungen frühzeitig genau zu verstehen, um die Produktentwicklung von vornherein auf die Nutzenden auszurichten. Die Einrichtung iterativer Entwicklungszyklen in enger Zusammenarbeit mit den Nutzenden fördert die Passgenauigkeit und Akzeptanz und damit die Wirksamkeit von Datenprodukten. Die kontinuierliche Erfassung von Nutzerfeedback über verschiedene Kanäle und Formate ermöglicht es einem Datenlabor, Datenprodukte nach und nach auf die nächste Entwicklungsstufe zu bringen.

3. Ein hohes Bereitstellungstempo beibehalten
Ein Datenlabor sollte eine Fabrik für Datenprodukte sein – keine Lagerhalle. Es besteht die Gefahr, in der Verwaltung einer stetig wachsenden Sammlung bereits gelieferter Datenprodukte wichtige Ressourcen zu binden. Durch die Festlegung klarer Zeitpläne für die Übergabe und technische Portierung der entwickelten Datenprodukte an die Linienorganisation können Datenlabore ein hohes Innovationstempo beibehalten.

4. In einen hochmodernen Technologie-Stack investieren und Infrastrukturen schrittweise aufbauen
Um Data Engineering und Data Science gemäß den neuesten technischen Standards bereitzustellen, benötigen Datenlabore einen Technologie-Stack, der zukunftsweisende Methoden wie maschinelles Lernen und (generative) KI unterstützt sowie veraltete Infrastrukturen ersetzt. Mit kommerziellen Standardkomponenten, einem Multi-Vendor-Ansatz sowie einem agilen Governance- und Betriebsmodell sind Datenlabore in der Lage, schnell auf technologische Fortschritte zu reagieren, ohne bestehende Infrastrukturen neu aufbauen zu müssen. Durch eine schrittweise Implementierung skalierbarer Cloud-Infrastrukturen und -Technologien basierend auf den Infrastrukturanforderungen des jeweils nächsten Datenprodukts können Datenlabore fragmentierte Legacy-Technologien ablösen und modulare Architekturen aufbauen.

5. Ein funktionsübergreifendes Team mit Top-IT-Talenten aufbauen
Neue Profile an IT-Fachkräften – Data Scientists, Cloud, Data und KI-Architects/-Engineers sowie Data Analysts – werden benötigt, damit innovative Datenprodukte zügig implementiert werden und Datenlabore mit den technologischen Neuerungen Schritt halten können. Datenlabore sollten frühzeitig in den Aufbau und die Bündelung von Fachwissen im Bereich (generative) KI investieren und mit dem Potenzial von KI-Anwendungen experimentieren, um sich zukunftsfähig aufzustellen. IT-Fachkräfte werden oft von Organisationen angezogen, die ein flexibles Arbeitsumfeld bieten, ausreichend Ressourcen zur Verfügung stellen und kreative Freiheit für eine explorative Arbeitsweise gewähren. Darüber hinaus ermöglichen sie es den Fachkräften, ihre Fähigkeiten mit einem modernen Technologie-Stack auszubauen. Die Unternehmenskultur ist dabei ein maßgeblicher Treiber für Attraktivität und Innovationskraft.

6. Eine für den öffentlichen Sektor geeignete Daten-Governance anwenden
Die gewählte Daten-Governance sollte den Datenschutz, die IT-Sicherheit, Transparenz sowie die gesetzlichen Bestimmungen des öffentlichen Sektors und für spezifische Anwendungsfälle berücksichtigen, um eine zügige und modulare Entwicklung von Datenprodukten zu ermöglichen. Gute Governance-Modelle helfen Datenlaboren, dynamisch zu bleiben und flexibel auf sich ändernde Vorschriften und Anforderungen, wie z.B. die Nutzung generativer KI, zu reagieren.

Mit einem klaren Fokus, talentierten Fachkräften, der richtigen Unternehmenskultur und der geeigneten Technologie können Datenlabore als Inkubatoren und Beschleuniger für die Nutzung von Daten dienen. Dadurch werden öffentliche Institutionen nutzerorientierter, effektiver und effizienter, während die Datenkompetenz gefördert wird. Der aktive Aufbau starker Netzwerke von Datenstrateg:innen und -praktiker:innen innerhalb der Verwaltung kann die Innovationsfähigkeit von Datenlaboren erheblich steigern.

Unsere Erfahrungen zeigen, dass eine frühe Identifizierung und erfolgreiche Umsetzung eines ersten relevanten Datenprodukts bestehende Hindernisse beseitigt und das Interesse an weiteren Produkten weckt. Angesichts der Tatsache, dass Daten den Kern der Entscheidungsfindung von morgen bilden, sollten öffentliche Stellen proaktiv in die notwendige Infrastruktur und die erforderlichen Kompetenzen investieren – und das Potenzial von Daten schon heute durch Datenlabore erschließen. 

Autor:innen: Luca Flora ist Associate Partner im Münchner Büro von McKinsey, Julia Klier ist Senior Partnerin im Münchner Büro, Björn Münstermann ist Senior Partner im Münchner Büro, und Thomas Weber ist Partner im Frankfurter Büro.