accessibility.skipToMainContent
Zurück zum Blog
Forschung

Federated Learning im Gesundheitswesen: Krebs heilen, ohne Daten zu teilen

Krankenhäuser besitzen die Daten zur Heilung von Krankheiten, doch Datenschutzgesetze verhindern deren Weitergabe. Federated Learning löst dieses Dilemma. Hier erfahren Sie, wie es funktioniert.

von Marc Filipan
21. November 2025
25 Min. Lesezeit
1 Aufrufe
0

Die Tragödie der Datensilos

Stellen Sie sich fünf große Forschungskrankenhäuser in Europa vor: in Berlin, Paris, Amsterdam, Mailand und Madrid. Jedes Krankenhaus behandelt 1.000 Patienten mit einer spezifischen, seltenen Form von Leukämie bei Kindern. Eine Stichprobengröße von 1.000 ist zu klein, um ein zuverlässiges Deep-Learning-Modell für die Früherkennung zu trainieren. Das Modell würde „Overfitting“ betreiben; es lernt die spezifischen Eigenheiten des Scanners in Berlin statt der Pathologie des Krebses.

Könnte man jedoch die Datensätze kombinieren, hätte man 5.000 Patienten: Ein Datensatz, der groß genug wäre, um eine bahnbrechende diagnostische KI zu trainieren, die Tausende von Leben retten könnte.

In der alten Welt war dies unmöglich. Die DSGVO in Europa, HIPAA in den USA und strenge Regeln zur ärztlichen Schweigepflicht verbieten strikt das Senden von rohen Patientenakten von Krankenhaus A nach Krankenhaus B oder das Hochladen auf einen zentralen Cloud-Server eines Technologiegiganten.

Die Daten bleiben also in Silos liegen. Die KI wird nie trainiert. Das Muster bleibt unentdeckt. Patienten sterben.

Dies ist der Konflikt zwischen Datenschutz und medizinischem Fortschritt. Es ist eine Sackgasse. Aber es ist eine Sackgasse, aus der wir uns mit Mathematik befreien können.

Traditionelles KI-Training vs. Federated LearningTraditionell (Zentralisiert)Krankenhaus AKrankenhaus BKrankenhaus CZentrale CloudPatientendaten hochgeladen ✗Federated LearningKrankenhaus AKrankenhaus BKrankenhaus CKoordinatorNur Modell-Updates gesendet ✓Federated Learning Prozess1. VerteilenModell → Krankenhäuser2. Lokal trainierenDaten bleiben vor Ort3. Updates sendenNur Mathe, keine Daten4. AggregierenDurchschnitt → GlobalPatientendaten verlassen NIEMALS das Krankenhaus. Nur mathematische Updates werden geteilt.

Federated Learning: Die Umkehrung des Trainings

Federated Learning (FL) kehrt das Standardparadigma des KI-Trainings vollständig um.

Der Standardansatz (Zentralisiert): Alle Daten aus allen Quellen in einem riesigen zentralen Data Lake sammeln. Das Modell auf diesem Data Lake trainieren.

Der föderierte Ansatz (Dezentralisiert): Die Daten dort lassen, wo sie sind. Das Modell zu den Daten senden.

Und so funktioniert es in der Praxis, Schritt für Schritt:

  1. Initialisierung: Ein zentraler Server (der Koordinator) erstellt ein „leeres“ oder vortrainiertes globales Modell.
  2. Verteilung: Der Server sendet eine Kopie dieses Modells an jedes der 5 Krankenhäuser.
  3. Lokales Training: Jedes Krankenhaus trainiert das Modell lokal mit seinen eigenen privaten Patientendaten. Dieses Training findet auf den eigenen sicheren Servern des Krankenhauses statt, hinter deren Firewall. Die rohen Patientendaten verlassen niemals den Keller.
  4. Update-Generierung: Der lokale Trainingsprozess erzeugt ein „Modell-Update“: ein Satz mathematischer Anpassungen an den Gewichten (Synapsen) des neuronalen Netzes. Es besagt im Wesentlichen: „Um Krebs besser zu erkennen, schiebe Neuron #45 um 0,1 nach oben und Neuron #92 um 0,05 nach unten.“
  5. Übermittlung: Das Krankenhaus sendet nur dieses Modell-Update (die Mathematik) zurück an den zentralen Server. Keine Patientennamen, keine Röntgenbilder, keine Bluttestergebnisse. Nur eine Datei mit Gleitkommazahlen.
  6. Mittelwertbildung: Der zentrale Server sammelt die Updates aller 5 Krankenhäuser. Er bildet den Durchschnitt (unter Verwendung eines Algorithmus wie Federated Averaging), um ein neues, intelligenteres globales Modell zu erstellen.
  7. Wiederholung: Das neue globale Modell wird zurück an die Krankenhäuser gesendet, und der Zyklus wiederholt sich.

Die mathematische Magie

Die Magie dieses Prozesses besteht darin, dass das globale Modell intelligenter wird, als ob es mit allen 5.000 Patienten trainiert worden wäre, obwohl es keinen von ihnen jemals direkt „gesehen“ hat. Es lernt die Muster der Krankheit (die in allen Krankenhäusern gleich sind), ohne die Identitäten der Patienten zu lernen (die für jedes Krankenhaus einzigartig sind).

Es entkoppelt die Fähigkeit zu lernen von der Notwendigkeit zu sehen.

Dweves Defense-in-Depth: Datenschutz-EbenenEbene 1: Federated LearningDaten verlassen nie das Krankenhaus. Nur Modell-Updates werden übertragen.Löst: Datentransfer-Beschränkungen, DSGVO-Compliance, institutionelle SouveränitätEbene 2: Secure Multi-Party Computation (SMPC)Server berechnet das Aggregat, ohne individuelle Krankenhaus-Updates zu sehen.Löst: Böswillige Koordinator-Angriffe, Inferenz-Angriffe auf UpdatesEbene 3: Differential Privacy (DP)Statistisches Rauschen wird Updates hinzugefügt, begrenzt mathematisch den Datenschutzverlust.Löst: Re-Identifizierung aus Mustern, Membership-Inference-AngriffeErgebnis: Mathematisch bewiesene Datenschutzgarantien (ε-Differential Privacy)

Defense in Depth: SMPC und Differential Privacy

Paranoide Sicherheitsingenieure (wie wir bei Dweve) werden fragen: „Aber kann man die Patientendaten nicht aus dem Modell-Update zurückrechnen?“

Das ist eine berechtigte Sorge. Theoretisch könnte ein böswilliger zentraler Server bei einem sehr spezifischen Modell-Update darauf schließen, dass „Patient X im Krankenhaus Berlin Bedingung Y gehabt haben muss.“

Um dies zu verhindern, schichtet Dweve zwei zusätzliche kryptographische Technologien über das Federated Learning:

1. Secure Multi-Party Computation (SMPC)

Dies ist ein kryptographisches Protokoll, das es dem zentralen Server ermöglicht, die Summe der Updates zu berechnen, ohne jemals die individuellen Updates zu sehen.

Stellen Sie sich vor, drei Personen möchten ihr Durchschnittsgehalt berechnen, aber niemand möchte sein Gehalt den anderen offenbaren. SMPC ermöglicht genau das. Der Server sieht das Gesamtergebnis, kann es aber mathematisch nicht wieder in die einzelnen Eingaben zerlegen. Der Server weiß buchstäblich nicht, welches Krankenhaus welches Update gesendet hat.

2. Differential Privacy (DP)

Wie in unserem Datenschutzartikel besprochen, fügen wir den lokalen Updates statistisches Rauschen hinzu, bevor sie das Krankenhaus verlassen. Dies „verwischt“ den Beitrag jedes einzelnen Patienten, was mathematisch bewiesene Anonymität ermöglicht.

Auswirkung in der realen Welt

Wir setzen diese Technologie derzeit mit einem Konsortium europäischer Onkologiezentren ein. Sie trainieren ein Tumorerkennungsmodell grenzüberschreitend (Deutschland, Frankreich, Niederlande), ohne eine einzige Datenschutzvorschrift zu verletzen. Sie lösen das „Schrems II“-Datentransferproblem, indem sie einfach keine Daten transferieren.

Dies ist die Zukunft der medizinischen Forschung. Es erschließt den riesigen, gefangenen Wert der weltweiten Gesundheitsdaten. Es erlaubt uns, Krankheiten als globales Kollektiv zu bekämpfen, während wir die Privatsphäre des Einzelnen respektieren.

Wir müssen uns nicht zwischen Datenschutz und Gesundheit entscheiden. Wir müssen uns nicht zwischen dem Individuum und dem Kollektiv entscheiden. Mit Federated Learning können wir beides haben.

Sind Sie bereit, die Kraft Ihrer Gesundheitsdaten freizusetzen, ohne die Privatsphäre der Patienten zu gefährden? Dweves Federated-Learning-Infrastruktur ermöglicht bahnbrechende medizinische KI über Institutionsgrenzen hinweg bei voller Einhaltung von DSGVO und HIPAA. Kontaktieren Sie uns, um zu erfahren, wie kollaborative KI Ihre Forschungskapazitäten transformieren kann.

Markiert mit

#Federated Learning#Gesundheitswesen#Datenschutz#Medizinische KI#Forschung#Kryptographie#Kollaboration

Über den Autor

Marc Filipan

CTO & Mitgründer

Gestaltet die Zukunft der KI mit binären Netzen und Constraint-Reasoning. Leidenschaftlich für effiziente, zugängliche und transparente KI.

Updates von Dweve

Abonniere Updates zu binären Netzen, Produktreleases und Branchentrends

✓ Kein Spam ✓ Jederzeit abbestellbar ✓ Relevanter Inhalt ✓ Ehrliche Updates