Phantastische Reisen durch den menschlichen Körper
Ein Film von einer Wanderung durch ein Blutgefäß oder entlang des Sehnervs ist nur eine von vielen möglichen Ausdrucksformen einer neuartigen Datenstruktur: Das Modell VOXEL-MAN wird bildliches und abstraktes Wissen über Anatomie und Funktion des menschlichen Körpers eng vernetzt und vielfältig zugänglich vereinigen.
Anders als noch zu Zeiten Goethes ist unser Wissen über Aufbau und Funktion des menschlichen Körpers nicht mehr von einer Einzelperson erfaßbar. Dieses Jahrhundert hat für die Medizin – wie für die anderen Wissenschaften auch – eine Lawine von erweiterten und verfeinerten Methoden und Modellen gebracht, die unsere Kenntnisse explosionsartig erweitert und bislang getrennte Zweige wie Physiologie und Biochemie zusammengeführt haben. Unser heutiges Wissen über den menschlichen Körper liegt in einer nach Art und Menge unübersehbaren Fülle vor:
• bildhafte Informationen wie Photographien, anatomische Zeichnungen, mikroskopische und Röntgenbilder sowie Computertomogramme aus verschiedenen Quellen;
• beschreibende Information in Myriaden von Buch- und Zeitschriftentexten.
Diese Informationen sind in einer großen Zahl von Teilgebieten organisiert und nehmen oft kaum Bezug aufeinander.
Derartige Bezüge herzustellen ist das Ziel neuerer Entwicklungen in der Informatik, insbesondere moderner Multimedia-Techniken. Diese bieten die Möglichkeit, Texte, Bilder und Filme zu neuen Einheiten ("Dokumenten") zusammenzufassen, die schnell und in beliebiger Reihenfolge durchsucht werden können. Viele heutige Multimedia-Dokumente sind bislang jedoch wenig mehr als computerlesbare Bücher: Ein üblicher Text ist durch mehr oder weniger reichliche Verweise mit sich selbst und mit üblichen Bildern verknüpft.
In der Medizin gibt es für multimediale Dokumente bislang im wesentlichen zwei Anwendungen:
• als Archive, in denen Forscher selbst ihre Ergebnisse ablegen und mit Querverweisen versehen wie etwa die Datenbank BRAINMAP für Ergebnisse der Hirnforschung, und
• als Lehr- und Lernprogramme. Wie bei klassischen Medien geben solche Dokumente im allgemeinen die Sicht eines oder mehrerer Experten wieder, die für eine spezielle Leserschaft aufbereitet ist.
Inzwischen stellt die Informatik allerdings – unabhängig von den Multimedia-Techniken – eine Reihe neuer Verfahren zur Abstraktion von Wissen zur Verfügung und eröffnet damit auch neue Möglichkeiten. Insbesondere die "Methode der semantischen Netzwerke" erlaubt es, mehrere Sichten verschiedener Experten zu einem sinnvollen Ganzen zu vereinigen (Kasten Seite 58). Damit tut sich eine faszinierende Perspektive auf: ein generelles, hochabstraktes Modell des menschlichen Körpers, aus dem man all die speziellen Sichten ableiten kann.
Beschreibendes Wissen wäre in diesem Modell nicht wie bisher als Text, sondern als ein Netz von Beziehungen zwischen Objekten enthalten. Für bildhaftes Wissen erlaubt die Computergraphik statt vorgefertigter Bilder abstraktere Repräsentationen, die erst am Bildschirm die vom Betrachter gewünschte Erscheinungsform annehmen. Körperfunktionen wie Blutfluß, Herzschlag oder Fortpflanzung von Nervenimpulsen könnten über mathematische Modelle, die bereits im Ansatz existieren, in die Beschreibung integriert werden. Aus einem solchen allumfassenden multimedialen Modell des menschlichen Körpers könnte man alle klassischen Medien wie Text, Bilder oder Filme als jeweils spezielle Sichten herleiten.
Die Erzeugung eines solchen Modells ist zweifellos eine ungeheuer große Aufgabe und wird vielleicht auch nicht in der wünschenswerten Vollständigkeit gelingen. Aber das Unterfangen ist nicht aussichtslos. Im Rahmen unserer Forschungen, welche die Möglichkeiten ausloten sollen, haben wir erste Grundlagen geschaffen. Im Projekt VOXEL-MAN entwickeln wir ein makroskopisches, dreidimensionales Modell des menschlichen Körpers. Eine erste Version für den Kopf ist bereits fertiggestellt.
Derzeit arbeiten wir an der Modellierung der inneren Organe. Es werden jedoch noch Jahre vergehen, bis wir die Vollständigkeit klassischer Atlanten und Lehrbücher erreichen. Schon der bisherige Erfolg unserer Arbeit wäre unmöglich gewesen ohne die Kooperation mit Partnern unseres Universitätskrankenhauses (besonders der Neuroradiologie und der Neuroanatomie), den Anatomischen Instituten der Universitäten Oxford und Gießen sowie den Einsatz unserer studentischen Mitarbeiter.
Die Schlüsselidee des Projekts besteht darin, ein detailliertes räumliches Modell, das die bildliche Komponente enthält, mit einem symbolischen Modell, welches das beschreibende Wissen enthält, unter einem Dach zu verbinden.
Die räumliche Komponente des Modells ist die dreidimensionale Verallgemeinerung eines Fernseh- oder Computer-Bildschirmbildes: Der menschliche Körper wird in Gedanken in Scheiben geschnitten und von jeder Scheibe ein aus Rasterpunkten (Pixeln) bestehendes Bild angefertigt. Dieses Bild ist ein Computertomogramm, ein Kernspintomogramm oder neuerdings ein photographisches Bild von einer tatsächlich in Scheiben geschnittenen Leiche (der Visible Human, Spektrum der Wissenschaft, September 1997, Seite 98). Diese Bildscheiben im Computer richtig aufeinandergestapelt ergeben einen Quader aus lauter Volumenelementen (Voxeln).
Jedem dieser Voxel wird nun eine Kennung zugewiesen, die seine Zugehörigkeit zu einem Objekt (Körperteil, Organ oder ähnliches) ausweist. Bei dieser Segmentierung kann der Computer Hilfestellung leisten; menschliche Experten sind jedoch immer noch unentbehrlich (Kasten Seite 56). Wir segmentieren sehr detailliert; zum Beispiel versuchen wir, Blutgefäße von ihrer Umgebung zu unterscheiden, soweit das bei der verfügbaren Auflösung überhaupt möglich ist.
Je nach dem Gesichtspunkt, der im Vordergrund steht, kann die Zuordnung zu Objekten verschieden ausfallen. Geht es um den Aufbau des Körpers, dann könnte ein Voxel zum Objekt "Hinterhauptswindungen" gehören; hat man aber die Funktion der Hirnrinde im Sinn, würde man dasselbe Voxel als zum Objekt "Sehrinde" gehörig klassifizieren. Die beiden Objekte "Hinterhauptswindungen" und "Sehrinde" haben eine Teilmenge gemeinsam, sind jedoch nicht identisch. Für verschiedene Sichtweisen (hier Aufbau und Funktion) muß unser Modell also verschiedene voneinander unabhängige Objektkennungen vorsehen sowie neben dem Bildvolumen selbst mehrere Markierungsvolumina, in de-nen diese Objektkennungen abgespeichert sind.
Räumliche Modelle, die aus der Computer- oder Kernspintomographie gewonnen werden, haben den Vorteil, daß sie die Anatomie eines lebenden Menschen darstellen. Unsere Arbeitsgruppe hat 1987 aus solchen Daten das erste dreidimensionale Modell vom Gehirn eines lebenden Menschen erzeugt (Bild oben). In den letzten Jahren haben wir und andere diese Entwicklungen bis zu klinischen Verfahren wie der 3D-Operationsplanung weitergetrieben.
Allem Fortschritt zum Trotz ist jedoch die räumliche Auflösung der Tomographieverfahren auf ungefähr 1 Millimeter beschränkt. Für generelle Anatomiemodelle geeigneter sind deshalb die photographischen Schnittbilddaten, die beim Projekt Visible Human der Universität von Colorado mit einer Auflösung von 1/3 Millimeter von einer Leiche erzeugt wurden. Diese geben obendrein auch die natürlichen Farben wieder. Mit unseren Verfahren können wir aus diesen Daten Darstellungen erzeugen, deren Realitätstreue noch von keinem anderen Verfahren übertroffen wurde (Bild unten). Nachteile sind hier die postmortalen Veränderungen zum Beispiel der Blutgefäße und die großen Datenmengen. Der Datensatz des weiblichen Visible Human besteht aus 40 Giga-Voxeln (4×1010 Voxeln)!
Semantische Netzwerke
Mit unserem Modell, soweit es bis jetzt dargestellt ist, können wir also die räumliche Anordnung von Organen zeigen, jedoch noch nicht ihre Funktion und ihre Beziehungen untereinander. Dieses beschreibende Wissen ist mit dem bildlichen geeignet zu verknüpfen. Für das Projekt VOXEL-MAN haben wir aus den Möglichkeiten, die die Informatik anbietet, das Konzept der semantischen Netzwerke gewählt. Dieses erlaubt die Beschreibung verschiedenartiger Beziehungen zwischen Objekten, wie im Kasten auf Seite 58 exemplarisch gezeigt wird. Die bei der Segmentierung gewonnenen Objektkennungen dienen dabei als Zeiger auf eine Objektbeschreibung. Diese besteht aus Attributen, die das jeweilige Objekt identifizieren (zum Beispiel durch Namen oder Synonyme), näher beschreiben (zum Beispiel durch Verweis auf Texte) oder auch seine optische Erscheinungsform (wie Farbe und Oberflächeneigenschaften) im räumlichen Modell bestimmen.
Dieser Ansatz erscheint auf den ersten Blick sehr elegant, stößt aber in der Praxis auf große Hindernisse. Das heutige medizinische Wissen liegt nicht so wohlstrukturiert vor, daß man eine allseits anerkannte Beschreibung daraus machen könnte. Selbst wo dies der Fall ist, gelingt es nicht immer in der strengen Form eines semantischen Netzwerks, obwohl wir als Menschen daraus durchaus richtige und sinnvolle Schlüsse ziehen können.
So kann zunächst nur ein geringer Anteil des verfügbaren Wissens in dieser hochstrukturierten Form repräsentiert werden. Für den großen Rest muß man sich nach wie vor mit klassischen Tex-ten und Bildern begnügen. Allerdings ist es möglich, diese Elemente mit den Objekten des semantischen Netzwerkes geeignet zu verknüpfen. Die so entstehende hybride Struktur bezieht also unstrukturierte Informationen mit ein. Darüber hinaus hat man die Freiheit, schrittweise und unter Nutzung bereits gemachter Erfahrungen klassischen Text in die strukturiertere Form umzuwandeln und dadurch das Modell kontinuierlich zu verbessern.
Mit den beschriebenen Hilfsmitteln haben wir ein erstes unvollständiges Modell des menschlichen Körpers erstellt. Seine symbolische Komponente enthält ungefähr 1000 Objekte mit Relationen für die Sichtweisen Aufbau, Funktion und Blutversorgung. Für die Erstellung eines kompletten Modells ist das räumliche Modell der entsprechenden Körperregion mit den entsprechenden Objekten aus dem symbolischen Modell zu verbinden. Das resultierende Datenobjekt nennen wir "intelligentes Volumen". Für die Kopfregion haben wir diese Verbindungsarbeit bereits weit vorangetrieben.
Im einzelnen ist für ein intelligentes Volumen folgendes zu tun: Wenn durch Segmentierung ein Objekt im Bildvolumen abgegrenzt ist, bekommt es einen Namen und dadurch automatisch eine Verbindung zum symbolischen Modell mitsamt den dort für es niedergelegten Relationen und Attributen. Insbesondere erhält das Objekt damit automatisch die Visualisierungsparameter wie Farbe und Reflexionseigenschaften, mit denen es bei einer bildlichen Darstellung erscheinen soll. Auch mit ausgeklügelten Hilfsprogrammen ist das Segmentieren und Editieren allerdings eine langwierige und schwierige Arbeit. Der Atlas des Schädels und Gehirns hat etwa ein Mannjahr erfordert. Der Aufwand für den ganzen Menschen ist aufgrund der Komplexität der Aufgabe noch nicht abzuschätzen.
Wenn diese Arbeit aber einmal geleistet ist, hat man ein Modell, in dessen räumlicher oder beschreibender Repräsentation man beliebig "navigieren" kann. So kann ein Betrachter aus dem bildlichen Modellteil beliebige perspektivische Ansichten erzeugen – bei freier Wahl des Standpunktes, der Brennweite oder des Lichteinfalls. Das Visualisierungsprogramm von VOXEL-MAN setzt nach den Gesetzen der projektiven Geometrie und der Optik die dreidimensionale interne Repräsentation in die zweidimensionale Bildschirmdarstellung um. An dieser Stelle gehen umfangreiche mathematische Vorarbeiten ein, durch die sich das Ergebnis weit von dem Output eines Standardprogramms abhebt.
Um das Modell zu untersuchen, kann ein Benutzer die anatomischen Objekte, an denen er interessiert ist, anwählen, indem er mit der Maus auf ein Bild klickt, und dann auf verschiedene Weise auf die Darstellung des Objekts einwirken: ausblenden (und damit die dahinterliegenden Objekte sichtbar machen), einblenden, durch besondere Färbung hervorheben, einen ebenen Schnitt hindurchlegen, ein zugehöriges mikroskopisches Schnittbild zeigen lassen oder weitere Informationen über das Objekt anfordern (Bild Seite 60 links unten).
Das im symbolischen Modell beschriebene Wissen ist auch über seine graphische oder textliche Darstellung erschließbar. So können wir statt auf ein Objekt in der bildlichen Darstellung auf dessen Namen in der abstrakten Darstellung des semantischen Netzwerks deuten und dieselben Fragen stellen wie zuvor.
Aus diesem noch unspezifischen Sortiment an Möglichkeiten ergeben sich zahlreiche Einzelanwendungen:
• Anatomie und Funktionsweise des menschlichen Körpers erlernen: Zu dem erwähnten 3D-Atlas des menschlichen Schädels und Gehirns haben wir eine Benutzeroberfläche entwickelt. Ein Student könnte damit zum Beispiel einen Schnitt durch den Kopf legen und so innere Strukturen offenlegen. Dem anatomischen Präparieren näher kommt allerdings die Vorgehensweise, Gewebe Schicht für Schicht abzutragen, indem man ein Objekt nach dem anderen durch Mausklick ausblendet. Dabei kann die Wirkung dieses Befehls durch Schnittebenen auf gewisse Regionen begrenzt werden. Einer echten Präparation noch ähnlicher ist der Eindruck, wenn das Modell aus den Visible-Human-Daten erzeugt ist (Bild Seite 57 unten). Der entscheidende Vorteil des computerbasierten Modells ist jedoch die Möglichkeit, für jedes sichtbare Voxel die mit ihm verknüpften Informationen abzufragen.
Es ist technisch nicht weiter schwierig, die beschreibende Information in verschiedenen Sprachen vorzuhalten. In der neuesten Version unseres Gehirnatlas kann der Benutzer zwischen den Sprachen Deutsch, Latein, Englisch, Französisch, Japanisch und Chinesisch wählen (Bild Seite 57 oben). Man kann auf einfache Art erreichen, daß sich die Sprache sogar an die Sprache des benutzten Computer-Betriebssystems anpaßt, also zum Beispiel in China automatisch die chinesische Version erscheint.
Die symbolische Komponente des Modells liefert zum Bild eines Objekts dessen Relationen gleich mit. So kann man durch Deuten auf ein Objekt dessen Stellung in der Hierarchie der Objekte erfragen, zum Beispiel zu welchen Hirnlappen eine bestimmte Hirnwindung gehört, aber auch Beziehungen zwischen Objekten in den verschiedenen Sichtweisen erschließen. Wenn wir wissen möchten, welche Regionen der Hirnrinde durch eine Stenose (Verengung) in der mittleren Hirnarterie betroffen wären, würden wir zunächst deren Versor-gungsgebiet (ein Objekt der Sichtweise "Blutversorgung") farbmarkieren lassen. Durch Umschalten auf die Sichtweise "Funktion" und Deuten in das gefärbte Gebiet kann man dann die Namen der Regionen erfragen, die beeinträchtigt würden.
• Radiologische Bilder anatomisch interpretieren lernen: Da unser Atlas aus Computertomogrammen hergeleitet ist, lassen sich aus dem Datenmaterial auch fiktive klassische Röntgenbilder herstellen, und zwar aus jeder beliebigen Richtung und mit beliebigem Abstand der Strahlenquelle. Da die Wissensbasis die Objekte kennt, die das Projektionsbild erzeugen, kann man den Beitrag der verschiedenen Objekte zur Helligkeit im Röntgenbild feststellen und interaktiv abfragen (Bild links). Dadurch kann der Lernende sich vergewissern, ob er ein Element des Röntgenbilds mit dem richtigen Objekt identifiziert hat.
• Klassisch-chirurgische und endoskopische Eingriffe simulieren: Bei der Planung einer Operation kann der Chirurg im Modell einen Zugangsweg festlegen und über die Wissensbasis in Erfahrung bringen, welche Gefahren für den Patienten am Wege des Skalpells oder des nadelartigen endoskopischen Instruments drohen (Bild unten). Den Blick von innen in ein Organ, in der Realität extrem schwierig, erhält man, indem man einfach den Betrachterstandpunkt mit der Maus an eine bestimmte Stelle des Körpers bewegt (Bild Seite 60 links oben). Ein Stereobildpaar verbessert das räumliche Verständnis erheblich; es benötigt zusätzliche Ausrüstung, ist aber programmtechnisch kein Problem.
• Inhalte für andere Medien extrahieren: Klassische visuelle Repräsentationen wie herkömmliche Multimediasysteme oder Bilder für gedruckte Atlanten lassen sich ohne weiteres aus dem allgemeinen Modell gewinnen. Sogar klassische Kunststoffmodelle können mit Hilfe der Stereolithographie maschinell erzeugt werden. Man kann auch "Drehbücher" für VOXEL-MAN schreiben, die dann automatisch Filme erzeugen, wie zum Beispiel über den Ablauf einer Sektion.
Eine besondere Art von Filmen sind die "intelligenten Filme". Bei diesen wird die Wissensbasis mit dem Film abgespeichert, so daß zu jedem Bild des Films die mit den darauf zu sehenden Objekten verbundenen Informationen am Bildschirm abfragbar sind. Besonders nützlich ist diese Möglichkeit im Zusammenhang mit den sogenannten Quicktime-VR-Filmen. Das sind interaktive Filme mit zwei Freiheitsgraden, mit denen man durch die Mausbewegung auf/ab oder rechts/links verschiedene Abläufe abrufen kann. Mit dieser Technik haben wir eine einfachere Version von VOXEL-MAN erzeugt, die nur aus solchen Filmen besteht ("VOXEL-MAN junior", siehe auch Anzeige Seite 113). Die Einschränkung der Interaktionsmöglichkeiten ist für Lehrzwecke gelegentlich sogar ein Vorteil, weil der Lernende zur Konzentration auf das spezielle Lernziel gezwungen wird.
Eine verbesserte Neuauflage eines intelligenten Films herzustellen ist nicht schwer: Wenn das zugrundeliegende Modell sich ändert, erzeugt das unveränderte Drehbuch automatisch einen Inhalt, der auf dem neuesten Stand ist.
• Andere Anwendungen: Das Modell setzt dank seiner Universalität der Phantasie nur wenig Grenzen. Denkbar sind mehrsprachige Bildlexika. Oder man könnte mit dem System erzeugte Bilder als räumlichen Index für die Literatursuche benutzen.
• Nebeneffekte: Ein weiterer Aspekt, an den wir gar nicht gedacht hatten, ist die ästhetische Dimension der computergraphischen Visualisierungen. Die frühen anatomischen Zeichnungen stammen von Künstlern wie Leonardo da Vinci (1452 bis 1519) oder Andreas Vesalius (1514 bis 1564). Daß die mit VOXEL-MAN erstellten Graphiken wegen ihrer Ästhetik 1994 mit der Ausstellung "Le corps virtuel" im Centre Georges Pompidou in Paris gewürdigt wurden, war für uns schon überraschend. Dabei ist unklar, wem der künstlerische Ruhm gebührt: dem Autor des Modells, des Visualisierungsverfahrens oder demjenigen, der die Szene auf deren Basis komponiert hat?
Die beschriebenen Verfahren lassen sich im übrigen auch für nichtmedizinische Zwecke anwenden. Das aus Computertomogrammen am Bildschirm erstellte, interaktiv untersuchbare Modell vom Kopf einer 2300 Jahre alten ägyptischen Mumie war ein beliebtes Exponat bei der Ausstellung "Das Geheimnis der Mumien – Ewiges Leben am Nil", die Anfang 1997 in Hamburg und danach in Hildesheim und Berlin gezeigt wurde.
Potentiell übertrifft die beschriebene Wissensrepräsentation alle bisherigen anderen Formen an Allgemeinheit und Flexibilität. Wir konnten auch die Machbarkeit des generellen Konzepts und den praktischen Nutzen für eine Anzahl von Anwendungen zeigen. Gleichwohl ist man noch immer sehr weit entfernt von einer vollständigen Repräsentation des menschlichen Körpers.
Beispielsweise müßte die räumliche Auflösung verfeinert werden. Die Daten sind in Form hochaufgelöster mikroskopischer Schnittbildern sogar verfügbar. Nur übersteigt ihre schiere Menge die Speicher- und Rechenkapazität heutiger Rechner bei weitem. Darüber hinaus beschreibt das Modell nur einen starren Körper. Für Anwendungen wie die Simulation chirurgischer Eingriffe müßte man dringend auch Deformationen modellieren können. Dieses Problem wird an verschiedenen Stellen, auch an unserem Institut, in Angriff genommen (Bild unten). Dabei haben wir nicht nur mit der mangelnden Leistung heutiger Rechner zu kämpfen, sondern auch damit, daß viele elastomechanische Eigenschaften menschlichen Körpergewebes noch gar nicht exakt bekannt sind.
Eine noch viel größere Herausforderung ist es, den Modellen "Leben einzuhauchen", also dynamische Abläufe des lebenden Körpers zu simulieren. Ansätze für Bewegungssimulationen gibt es in der Biomechanik. Eine photorealistische Visualisierung von mechanisch korrekten Bewegungen ist jedoch noch im Anfangsstadium. Als einen ersten Versuch der Simulation einer Körperfunktion modellieren wir die Erregungsausbreitung im Herzen anhand eines Volumenmodells, das aus den Daten des Visible Human gewonnen wurde (Bild oben). Den verschiedenen Regionen des Herzens wurden elektrophysiologische Eigenschaften als Attribute zugeordnet und damit die Ausbreitung der Nervenimpulse im gesamten Herzen berechnet. Das Modell gibt die Abläufe im gesunden Herzen korrekt wieder. Es tut sich nun die spannende Frage auf, inwieweit bei krankhaften Zuständen (zum Beispiel lokalem Sauerstoffmangel) das daraus folgende Verhalten des Modells neue Einblicke in die Verhältnisse im Vorbild geben kann.
Trotz der schon realisierten erregenden Möglichkeiten stehen wir noch am Anfang des Weges zu einem umfassenden Modell der Anatomie und Funktion des menschlichen Körpers. Unsere Idealvorstellung ist ein "virtueller Mensch", der durch vom Computer simulierte Funktionen nahezu lebend erscheint. Die Realisierbarkeit dieses Fernziels ist aber noch nicht abzusehen
Aus: Spektrum der Wissenschaft 4 / 1999, Seite 54
© Spektrum der Wissenschaft Verlagsgesellschaft mbH
Schreiben Sie uns!
Beitrag schreiben