Leseprobe »Mathematik der Pandemie«: Kontaktnetzwerke und Superspreader
Bisher haben wir das SIR-Modell als Basismodell einer Epidemie kennengelernt und es anschließend erweitert, um die Auswirkungen bestimmter Maßnahmen zur Eindämmung der Epidemie zu untersuchen. Alle diese Modelle haben eine homogene, gut durchmischte Bevölkerung angenommen, d. h. eine Bevölkerung, in der jeder Mensch ungefähr gleich viele Kontakte hat und alle miteinander in Kontakt kommen können. In diesem Kapitel wollen wir – motiviert durch sogenannte Superspreader-Ereignisse (zu deutsch: explosive Übertragungsereignisse) – ein agentenbasiertes Modell vorstellen, mit dem man die Pandemiedynamik in heterogenen Bevölkerungen analysieren kann. Dazu definieren wir ein Kontaktnetzwerk der Bevölkerung. Das ist ein Netzwerk, in dem explizit berücksichtigt wird, wer mit wem in Kontakt kommen kann. Wir vergleichen anschließend die Epidemiedynamik auf zwei verschiedenen Netzwerktypen, nämlich solchen mit und ohne Superspreader, mit der Dynamik des SIR-Modells. Außerdem geben wir einen kurzen Überblick über andere agentenbasierte Modelle und offene Forschungsfragen.
5.1 Superspreading
Vor allem zu Beginn der Pandemie wurde das Infektionsgeschehen stark von einzelnen sogenannten superspreading events (SSE, deutsch: Superverbreitungsereignisse oder explosive Übertragungsereignisse) getrieben, bei denen eine infektiöse Person eine überdurchschnittliche Anzahl an Menschen ansteckt, d. h. deutlich mehr als R0, siehe Abb. 5.1 (in dieser Leseprobe nicht enthalten). Exemplarisch seien hier die Après-Ski-Partys in Ischgl in Österreich und die Karnevalsfeier in Gangelt im Kreis Heinsberg im März 2020 genannt.
Für das Auftreten eines SSE sind die folgenden drei Aspekte von Bedeutung:
- Erste Voraussetzung ist die Anwesenheit einer hochansteckenden Person, des Superspreaders, z. B. ein infizierter Barkeeper. Dabei ist bei Ansteckung mit COVID-19 wichtig, dass die Phase höchster Infektiosität an den Tagen besteht, an denen noch keine Symptome vorhanden sind oder gerade erst einsetzen. Deswegen kommt es oft vor, dass infizierte Personen die Krankheit erst bemerken, wenn sie schon andere angesteckt haben (vgl. Kap. 1). Außerdem schwankt die Infektiosität auch von Person zu Person. Menschen mit asymptomatischem Verlauf haben beispielsweise häufiger eine geringe Viruslast und Geimpfte, die sich unwahrscheinlicherweise trotzdem angesteckt haben, sind über eine kürzere Zeitspanne ansteckend.
- Zweitens braucht es für ein SSE eine große Zahl anfälliger Menschen, die mit dem Superspreader in Kontakt kommen, z. B. Partygäste in Après-Ski-Laune.
- Drittens können lokale Begebenheiten die Krankheitsübertragung begünstigen, z. B. eine schlecht belüftete, überfüllte Bar. Besonders gefährlich wird es, wenn sich Aerosole – kleine feuchte Schwebeteilchen, die das Virus übertragen – anreichern können. Dazu tragen kleine Räume, keine oder geringe Frischluftzufuhr, längerer Aufenthalt sowie die vermehrte Freisetzung kleiner Partikel durch Aktivitäten mit gesteigerter Atemtätigkeit wie Schreien, Singen, Sport oder schwere körperliche Aktivität bei. Der vermehrte Aufenthalt in geschlossenen Räumen in der kalten Jahreszeit fördert daher die Virusausbreitung.
Zu größeren COVID-19-Ausbrüchen kam es daher neben den bereits genannten Anlässen z. B. in Chören, in Pflegeheimen, in Fitnessstudios, bei religiösen Veranstaltungen und in fleischverarbeitenden Betrieben, z. B. Tönnies im Sommer 2020.
Wir haben explosive Übertragungsereignisse, die diese ganze Epidemie eigentlich treiben.
Christian Drosten
Unser Basismodell für die Ausbreitung von Epidemien und seine Erweiterungen bauen auf der Annahme einer »zufällig gemischten« und homogenen Population auf, d. h. dass der Kontakt jedes Individuums mit jedem anderen gleich wahrscheinlich ist (vgl. Kap. 3 und 4). In der Wirklichkeit hat jedoch jedes Individuum einen festen Bekannten- und Kollegenkreis, d. h. nur eine Reihe von Kontakten, über die eine Infektion übertragen werden kann. Außerdem haben manche Menschen viel mehr Kontakte als der Durchschnitt, z. B. aufgrund ihres Berufs, so wie der oben erwähnte Barkeeper.
Die Menge aller Kontakte in einer Population bildet ein Kontaktnetzwerk. Die Kenntnis der genauen Netzwerkstruktur erlaubt es, die Epidemiedynamik auf der Populationsebene aus der individuellen Infektionsdynamik auf dem Kontaktnetzwerk zu berechnen. Wir stellen im Folgenden beispielhaft zwei wichtige Netzwerktypen vor: eines, das im Wesentlichen der durchmischten Situation des SIR-Modells entspricht, und ein anderes, welches Personen mit deutlich mehr Kontakten als der Durchschnitt (Superspreader) berücksichtigt. Anschließend charakterisieren wir die Ausbreitung von Epidemien mit SIR-Dynamik auf diesen Netzwerken und beleuchten die Auswirkung von Superspreadern auf das Epidemiegeschehen.
5.2 Kontaktnetzwerke
Ein Netzwerk, Mathematiker sprechen auch von Graph, ist eine Struktur, die eine Menge von Objekten, auch Knoten genannt, und deren Verbindungen (Kanten) repräsentiert. Ein alltägliches Beispiel für ein Netzwerk ist ein städtisches U-Bahnnetz: Dort entsprechen die Knoten den U-Bahnstationen und die Kanten den direkten Zugverbindungen dazwischen. Netzwerke finden in sehr unterschiedlichen Bereichen Anwendung, wobei Knoten und Kanten jeweils ganz unterschiedliche Dinge sein können. Man denke zum Beispiel an die sozialen Netzwerke, das Stromnetzwerk, Telekommunikationsnetzwerke, die schon genannten Transportnetzwerke, die Verbindungen von Neuronen im Gehirn, Genregulationsnetzwerke oder Nahrungsnetze.
Im Folgenden betrachten wir »Infektionsnetzwerke«, bei denen die Knoten die Personen repräsentieren, die am Infektionsgeschehen teilnehmen. Wenn Personen in Kontakt kommen, so wird dies durch eine Kante des Netzwerks dargestellt. Die Anzahl der Kontakte einer Person beziehungsweise die Anzahl an Kanten, die an einem Knoten beginnen oder enden, nennt man den Grad k eines Knotens.
Es gibt sehr viele Möglichkeiten ein Netzwerk aus n Knoten zu bilden, denn in einem solchen Netzwerk gibt es n(n−1)/2 Knotenpaare. Jedes davon kann entweder verbunden sein oder getrennt, deshalb gibt es 2n(n−1)/2 mögliche Netzwerke. Bei n=20 Personen sind das schon 220·19/2=2190≈1,6·1057 verschiedene Möglichkeiten! Zum Vergleich: Das ist mehr als zehn Millionen mal mehr als die Zahl an Atomen auf der Erde! Doch wie soll man aus dieser unvorstellbar großen Zahl an Möglichkeiten das »richtige« Kontaktnetzwerk finden? Eine Option ist, Netzwerke aus der Kontaktnachverfolgung zu rekonstruieren. Allerdings ist das unheimlich aufwändig und auch aus Datenschutzgründen problematisch. Deshalb greifen Modellierer oft zu »synthetischen« Netzwerken. Das sind Netzwerke, die mittels eines Algorithmus am Computer erzeugt wurden. Die Algorithmen wählen dabei aus allen möglichen Netzwerken solche mit vom Modellierer gewünschten Eigenschaften aus.
Netzwerk mit homogener Kontaktstruktur
Zum Beispiel kann man die Zahl der Knoten n vorgeben und dann jedes Knotenpaar mit einer festen, vorgegebenen Wahrscheinlichkeit p verbinden. Dieses Modell zur Erzeugung von Netzwerken nennt man auch Erdős-Rényi-Gilbert-Graph, benannt nach seinen Erfindern, den ungarischen Mathematikern Paul Erdős und Alfréd Rényi und dem Amerikaner Edgar Nelson Gilbert [17].
Hier entspricht die Situation in etwa der »gut durchmischten« Situation des SIR-Modells: Alle Personen können mit der gleichen Wahrscheinlichkeit p in Kontakt kommen und alle haben im Mittel (n−1)⋅p Kontakte.
Eine wichtige Größe zur Charakterisierung von Netzwerken ist die Knotengradverteilung P(k). Das ist eine diskrete Wahrscheinlichkeitsverteilung, die angibt, mit welcher Wahrscheinlichkeit man auf Knoten mit einem Grad von null, eins, zwei und so weiter trifft. Man kann deswegen von der Knotengradverteilung auf die Kontaktstruktur in der Bevölkerung schließen. Für den Erdős-Rényi-Gilbert-Graph lässt sich zeigen, dass die Knotengradverteilung für eine große Knotenzahl n eine Poissonverteilung ist. Konkret bedeutet dies, dass die Wahrscheinlichkeit, deutlich mehr Kontakte als der Durchschnitt zu haben, exponentiell mit der Zahl der Kontakte abnimmt – P(k) ist proportional zu e−k, wenn k sehr viel größer als n·p ist. In diesem Fall ist es also sehr unwahrscheinlich, dass es Superspreader gibt. Der mittlere Knotengrad λ=(n−1)⋅p bestimmt die Skala der Knotengradverteilung. Im Gegensatz dazu stehen die skalenfreien Netzwerke, die eben keine solche Skala besitzen, siehe unten.
Wie wir schon besprochen haben, ist für die Analyse des Epidemiegeschehens die Einbeziehung von Superspreadern, also von Individuen mit besonders vielen Kontakten, wichtig. Dies ist mit skalenfreien Netzwerken (engl. scalefree networks) möglich. Diese heißen so, weil ihre topologischen Eigenschaften, insbesondere die Knotengradverteilung, keine inhärente Skala haben, siehe Abb. 5.2 (in dieser Leseprobe nicht enthalten). Dadurch sieht sie, salopp gesprochen, immer gleich aus, egal welchen Wertebereich der x-Achse man beim Zeichnen der Funktion benutzt. Dass menschliche Kontaktnetzwerke eine skalenfreie Knotengradverteilung haben können, ist schon länger bekannt, z. B. im Kontext von Sexualpartnern [18].
Netzwerk mit heterogener Kontaktstruktur
Das wichtigste Modell zur Erzeugung von skalenfreien Netzwerken ist das sogenannte Barabási-Albert-Modell, benannt nach Albert-László Barabási und Réka Albert [19]. Die Idee hinter dem Modell ist die bevorzugte Verbindung (engl. preferential attachment): Das Netzwerk wird ausgehend von m vollständig verbundenen Knoten vergrößert. Dabei knüpft jeder neue Knoten m Verbindungen bevorzugt zu jenen Knoten, die bereits selbst viele Verbindungen haben. Dadurch bilden sich einige Knoten (engl. hubs), die viel mehr Verbindungen, d. h. einen deutlich höheren Knotengrad haben als der Durchschnitt. Das sind unsere Superspreader! Das zugehörige Netzwerk hat eine skalenfreie Knotengradverteilung der Form P(k)~1/k3. Abb. 5.2a (in dieser Leseprobe nicht enthalten) zeigt die Knotengradverteilungen von Erdős-Rényi-Gilbert – und Barabási-Albert-Graphen. Die extreme Heterogenität der Kontaktstruktur, die sich in der skalenfreien Knotengradverteilung widerspiegelt, ist für menschliche Populationen typisch und von großem Interesse für Epidemiologen. Auf der einen Seite gibt es Superspreader mit einer Vielzahl von Kontakten, auf der anderen mehr oder weniger geschlossene Gruppen. Im Folgenden wollen wir Epidemiesimulationen unseres agentenbasierten Modells auf den zwei besprochenen Netzwerktypen vergleichen.
5.3 Der Effekt von Superspreadern
Basierend auf einem gegebenen Kontaktnetzwerk können wir ein agentenbasiertes Modell für die Infektionsdynamik auf diesem Netzwerk definieren. In dem zeit-diskreten Modell hat jeder Agent zu jedem Zeitpunkt einen der drei schon bekannten Zustände (S, I, R). An jedem Tag werden Anfällige mit einer gewissen Wahrscheinlichkeit von infektiösen Agenten, mit denen sie im Kontaktnetzwerk verbunden sind, angesteckt. Infektiöse Agenten werden jeden Tag mit einer gewissen Wahrscheinlichkeit entfernt, was Quarantäne, Genesung oder Tod entspricht.
In unserem Modell gibt es n Agenten, die wir mit den Knoten V eines Netzwerks G=(V,E) mit Kanten E identifizieren. Jeder Agent i hat einen zeitabhängigen Zustand zi(t)=S,I,R, wobei die Zustände wie zuvor für anfällig (susceptible), ansteckend (infectious) und entfernt (removed) stehen.
In jedem Zeitschritt t=0,1,2,… ändert sich der Zustand aller Agenten gleichzeitig: Anfällige Agenten werden von ansteckenden Agenten, mit denen sie verbunden sind, mit einer Wahrscheinlichkeit pI infiziert (S->I). Die ansteckenden Agenten werden in jedem Zeitschritt mit einer festen Wahrscheinlichkeit pR entfernt (I->R). Die mittlere Dauer der Infektiosität ist daher TI=1/pR Zeitschritte.
Dieses Modell können wir nun auf verschiedenen Netzwerkarchitekturen simulieren und mit unserem Basismodell vergleichen, siehe Abb. 5.3 (in dieser Leseprobe nicht enthalten). Dabei lassen wir die mittlere Zahl an Kontakten, die Infektionswahrscheinlichkeit und die Dauer der Infektiosität gleich, sodass wir allein den Effekt der Kontaktstruktur beobachten. Im Netzwerkmodell mit Superspreadern steigt die Zahl der Infektiösen deutlich schneller an als im SIR-Modell (wenn wir hier von SIR-Modell sprechen, meinen wir immer das Kompartmentmodell aus Kap. 3) oder im Netzwerkmodell ohne Superspreader. Dies liegt daran, dass die Superspreader, also Knoten mit sehr vielen Kontakten, sich sehr früh im Epidemieverlauf infizieren und die Krankheit an viele Anfällige verbreiten. Nachdem die Superspreader entfernt wurden (d. h. in Quarantäne, genesen oder verstorben sind), infizieren sich jedoch insgesamt weniger Personen als in den anderen Modellen, weil die restlichen Knoten im Schnitt weniger Kanten haben als im Netzwerk ohne Superspreader.
Das Netzwerkmodell ohne Superspreader und das SIR-Modell ähneln sich. Allerdings sind im SIR-Modell sowohl der exponentielleAnstieg der Infizierten und deren Höchstwert als auch die Gesamtzahl an Infizierten nach der Epidemie im Vergleich zum Netzwerkmodell erhöht. Das liegt daran, dass die Kontakte, beziehungsweise Kanten in unseren Netzwerkmodellen, fest stehen, sodass ein Ansteckender nur maximal seine direkten Kontakte infizieren kann. Außerdem wurde er selbst ja schon von einem seiner Kontakte infiziert, sodass die Zahl der anfälligen Kontakte immer um eins reduziert ist. Im SIR-Modell wird dagegen angenommen, dass die Kontakte in jedem Moment wieder neu zufällig verteilt werden, sodass die Zahl an anfälligen Kontakten im Vergleich zum Netzwerkmodell erhöht ist.
5.4 Resümee
In diesem Kapitel haben wir ein agentenbasiertes Modell kennengelernt, um den Effekt von Superspreadern zu studieren. Dabei haben wir gezeigt, dass diese dazu führen, dass sich die Krankheit deutlich schneller verbreitet und sie deshalb ein besonders wichtiges Ziel von Maßnahmen sein sollten. Solche Maßnahmen beinhalten zum Beispiel eine priorisierte Impfung von Pflegekräften, die viele Kontakte mit hohem Übertragungsrisiko haben und Teilnehmerobergrenzen für Veranstaltungen in Kombination mit 3G- (Zutritt nur für Geimpfte, Genesene oder Getestete) oder 2G- (Zutritt nur für Geimpfte oder Genesene) Regelungen.
Eine skalenfreie Knotengradverteilung, die Netzwerke mit Superspreadern charakterisiert, ist allerdings nur ein wichtiger Aspekt von realen Kontaktnetzwerken, der die Dynamik einer Epidemie beeinflussen kann. Wir wollen hier ein paar weitere Aspekte kurz erwähnen und einen kleinen Ausblick auf die Komplexität der Thematik geben.
Dazu gehört zum Beispiel die Cliquenbildung. In der Sprache der Netzwerke bezeichnet eine Clique eine Gruppe von Knoten, welche alle miteinander verbunden sind. Dadurch wird es sehr wahrscheinlich, dass eine ansteckende Person in der Clique einen Großteil der anderen ansteckt. Das vielleicht wichtigste Beispiel dafür sind Personen in einem Haushalt. Diese sehen sich täglich und teilen sich Räumlichkeiten, wodurch sie sich leicht anstecken können. In Netzwerken, die aus vielen kleinen Cliquen bestehen, zwischen denen es wenige Kontakte gibt, breitet sich eine Krankheit deutlich langsamer aus als in zufällig gemischten Netzwerken oder gar in solchen mit Superspreadern. Das liegt daran, dass die Zahl der anfälligen Kontakte innerhalb einer kleinen Clique kleiner ist, weil es sehr wahrscheinlich ist, dass sich Personen aus der gleichen Clique ebenfalls bereits angesteckt haben. Den gleichen Effekt haben wir in schwächerer Form bereits beim Vergleich der Epidemie auf einem Netzwerk mit zufälligen Kontakten und dem SIR-Modell gesehen, vgl. Abb. 5.3. Im Netzwerkmodell breitet sich die Krankheit etwas langsamer aus, weil ja zumindest ein Kontakt einer frisch infizierten Person bereits infiziert sein muss, um die Person überhaupt anzustecken. Im Frühjahr 2020 gab es in Deutschland durch politische Maßnahmen eine Situation, in der die Menschen ihre Kontakte auf ihren engsten Familien- und Freundeskreis, also auf kleine Cliquen, reduzierten und so die Ausbreitung des Virus stark verlangsamten [21].
Neben der Cliquenbildung spielen auch räumliche Aspekte eine Rolle. Orte, die eine sehr hohe Inzidenz aufweisen, insbesondere wegen Veranstaltungen mit vielen Personen und Superspreadern, bezeichnet man auch als Hotspot. Ein bekannter Hotspot war Ischgl in Österreich im Frühjahr 2020. Dort haben sich auf Partys in kurzer Zeit sehr viele Menschen infiziert. Das Virus konnte sich anschließend aufgrund von fehlenden Reisebeschränkungen in ganz Europa verbreiten.
In der Praxis spielen alle diese Aspekte gleichzeitig eine Rolle. Sie müssen in einem geeigneten Netzwerkmodell berücksichtigt werden und können sich zeitlich auch noch ändern, z. B. durch politische Maßnahmen oder durch erhöhte Mobilität im Sommer, insbesondere durch Reisen. Welches das »richtige« Netzwerk zur Modellierung der COVID-19-Pandemie ist, ist daher eine offene Forschungsfrage. Im nächsten Kapitel widmen wir uns den Unsicherheiten bei der Vorhersage des Epidemiegeschehens.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.