Dreidimensionale Bildrekonstruktion aus Ultraschall-Daten
Im Vergleich zu einer Röntgen- oder NMR-Computertomographie ist eine Ultraschalluntersuchung recht unaufwendig. Ein Ultraschall-Meßkopf samt Auswertungsgerät zur Untersuchung des ungeborenen Kindes gehört schon fast zur Standardausstattung einer gynäkologischen Praxis; bei Internisten, Urologen, Kardiologen und Radiologen wird die Methode immer gebräuchlicher. Sie ist unter anderem deswegen so beliebt, weil sie preisgünstig ist und den Untersuchten die Strahlenbelastung erspart.
Am Fraunhofer-Institut für Graphische Datenverarbeitung in Darmstadt haben wir ein Softwarepaket namens InViVo entwickelt, das Ultraschalldaten in dieselbe Form – den Datenquader aus Voxeln – bringt, wie sie bei den großen Tomographiegeräten üblich ist, und sie damit vielen der dafür entwickelten Techniken zugänglich macht. Außerdem helfen die Programme, etliche für diese Form der Datengewinnung typischen Probleme zu bewältigen.
Damit können wir im Prinzip jedes konventionelle Ultraschallgerät zu einem vollwertigen dreidimensionalen Tomographiegerät aufrüsten, ohne in die Maschine selbst einzugreifen. Untersucher mit speziellen Anforderungen wie etwa Radiologen können also ihr gewohntes Gerät mit der vertrauten Handhabung und Bildqualität behalten. Durch Betätigung eines Fußschalters kann der Arzt während der Untersuchung beliebig zwischen der üblichen und der dreidimensionalen Datenauswertung hin- und herschalten. Durch die Verwendung von marktüblichen Komponenten anstelle von Spezialanfertigungen bleiben die Kosten überschaubar.
Zu jedem Zeitpunkt liefert ein Schallkopf ein Bild aus einem ebenen Bereich, der vor ihm liegt. Bewegt man den Schallkopf, bekommt man ein Sortiment von Bildern aus verschiedenen Positionen. Allerdings liegen deren Ebenen nicht mehr so regelmäßig parallel geschichtet wie bei den Tomographie-Verfahren. Es gibt zwar Ultraschallaufnahmegeräte, die mit Hilfe einer speziellen mechanischen Führung den Schallkopf präzise auf einer Art Schienen am Körper entlang führen oder um eine Achse drehen; aber sie haben sich am Markt nicht recht durchsetzen können, wohl weil ihre Handhabung ungewohnt und das Preis-Leistungs-Verhältnis manchmal unbefriedigend ist. Schließlich liefert ein Schallkopf wesentlich bessere Bilder, wenn man ihn direkt auf die Haut aufsetzt; das aber schließt oft eine starre mechanische Führung aus.
Beim Freihand-Scanning kann der Untersucher seine Hand im Prinzip beliebig im Raum bewegen, so wie er sich es in langjähriger Erfahrung angeeignet hat. Jedes Bild wird von unserem System am Videoausgang des Gerätes abgegriffen, digitalisiert und gespeichert. Für ein Tomogramm müssen wir diese Bilder in ein reguläres Gitter überführen.
Es gilt also erstens, mehrere hundert irgendwie gelagerte Bildebenen an der jeweils richtigen Stelle in den Datenquader zu setzen. Dazu müssen Ort und Orientierung des Schallkopfs zum Zeitpunkt der Aufnahme bekannt sein. Ein mechanischer Arm, dessen Gelenkwinkel elektronisch gemessen werden, ortsfeste Infrarot-Entfernungsmesser oder elektromagnetische Sensoren (das in den Datenhelmen der Virtual Reality verwendete tracking system) erreichen eine Ortsbestimmung mit der – ausreichenden -Genauigkeit von etwa einem Millimeter. Wir verwenden das elektromagnetische System, weil es so klein wie ein Zuckerwürfel und so leicht ist, daß es den Mediziner bei der Bewegung nicht beeinträchtigt. Allerdings können große Metallobjekte in der Nähe die Präzision stören.
Zweitens sind die Informationen von den Pixeln der Bildebene auf die Voxel des Datenquaders zu übertragen. Beide Sorten Rasterpunkte passen im allgemeinen nicht zusammen. Wenn man also einfach den Grauwert jedes Pixels dem nächstgelegenen Voxel zuweist, führt man eine leichte Positionsverfälschung in das System ein; außerdem bleibt von allen Daten, die ein Voxel treffen, immer nur das jüngste erhalten. Besser ist es, wenn alle Grauwerte, die in der Nähe eines Voxels anfallen, zu einem gemeinsamen Mittelwert beitragen, und zwar mit um so größerem Gewicht, je näher ihre Position dem Mittelpunkt des Voxels liegt. Für Würfelchen, denen nie eine Bildebene hinreichend nahe gekommen ist (vielleicht weil der Schallkopf zu schnell bewegt wurde), muß man einen Grauwert aus denen der Nachbarn interpolieren. Wir haben ein Interpolationsschema entwickelt, das innerhalb weniger Sekunden gute Ergebnisse liefert: Im Praxisbetrieb ist Geschwindigkeit bisweilen wichtiger als Bildqualität.
Bei einer üblichen Rate von 25 Bildern pro Sekunde liefert das Meßsystem in acht Sekunden 200 Einzelbilder; das reicht aus, um einen Datenquader hinreichend dicht mit Information zu füllen. Damit liegen die Daten in derselben Form vor wie bei den tomographischen Verfahren und könnten theoretisch auch genauso weiterverarbeitet werden.
Allerdings sind Ultraschall-Daten aus physikalischen Gründen schlechter als die mit den anderen Verfahren gewonnenen: Die Konturen sind unscharf, an Kontrast ist nur ein Zehntel bis ein Hundertstel des sonst üblichen zu erreichen, und durch Störsignale sehen Oberflächen aus, als seien sie mit Sprenkeln (speck-les) übersät. Hinten liegende Strukturen werden durch das Gewebe im Vordergrund abgeschattet und verlieren so an Intensität und Klarheit. Zum Beispiel machen in der Pränataldiagnostik die Gesichtspartien des Kindes die Rückseite des Köpfchens gänzlich unsichtbar. Ferner hängt die Stärke eines Ultraschall-Signals nicht nur von der Entfernung, sondern auch von der Orientierung der Reflexionsgrenze zum Schallkopf ab. So ergibt typischerweise das Köpfchen des Fötus unterschiedlich starke Reflexionen, je nachdem, ob der Ultraschall frontal oder schräg auftrifft (Bild 1).
Filterung
Man muß also das Rohbild auf verschiedene Weise nachbessern. Ein Tiefpaßfilter verringert alle kleinräumigen Schwankungen und läßt dadurch die großen Strukturen besser hervortreten, weicht allerdings auch scharfe Kanten auf, vergleichbar einem Weichzeichner in der Photographie. Realisiert werden dieses und andere Filter durch Algorithmen, die an die Stelle eines rohen Grauwerts einen anderen setzen, der mit Hilfe von Daten aus seiner Umgebung berechnet wird. Beispielsweise bildet ein Tiefpaßfilter einen gewichteten Mittelwert über den Datenpunkt und seine Nachbarn (Bild 2 oben).
Ein Medianfilter gleicht einzelne Punkte mit abweichendem Grauwert ihrer Umgebung an und entfernt so störende Signale, ohne die Konturen des Originalbildes zerfließen zu lassen (Bild 2 unten). Ein speckle removal filter entfernt Sprenkel nach unterschiedlichen Methoden. Konturfindungsverfahren identifizieren und verstärken die – wichtigen – Bildkonturen, allerdings auch sämtliche Bildfehler, so daß stets eine Glättung vorausgehen muß. Mit Verfahren aus der mathematischen Topologie (vergleiche den nachstehenden Beitrag) kann man einerseits den Kontrast erhöhen, andererseits kleine Lücken entlang der Konturen schließen. Weitere Verfahren dienen zur Identifikation und Segmentierung homogener, zusammenhängender Regionen.
In den letzten Jahren haben wir einige dieser Verfahren untersucht. Alle diese Verbesserungen wurden ursprünglich für zweidimensionale Bilder entwickelt; um störende Artefakte zu vermeiden, mußten wir sie erst auf die Bearbeitung von Volumendaten erweitern (Bild 3).
Die Fülle von Verfahren ist für den Anwender zunächst eher lästig als hilfreich. Nicht alle Filterungsmethoden und deren Kombinationen sind sinnvoll; erst nach vielen zeitraubenden Versuchen wird klar, wie sich Einstellungen mancher Parameter auf das Bild auswirken, und bei gewissen Methoden rechtfertigt der Qualitätsgewinn nicht den Aufwand an Rechen- (und Warte-)zeit. Wir haben deshalb eine Auswahl von einigen wenigen sinnvollen, effektiven und schnell arbeitenden Verfahren und deren Kombinationen getroffen und deren Parameter auf geeignete Werte voreingestellt.
Dem Benutzer werden lediglich verschiedene Aktionen wie Glättung, speckle removal und Kantenverstärkung angeboten, die er nacheinander auf das Rohbild wirken lassen kann – wie stark, läßt sich für jede Aktion auf einem Drehknopf einstellen. Über die zugrundeliegenden Algorithmen muß der Anwender nichts wissen. Bis sich die veränderte Einstellung eines Drehknopfs auf dem Bild bemerkbar macht, vergeht eine Sekunde bis allenfalls eine halbe Minute, je nach Filter, Datenmenge und Rechnerqualität.
Alle Zwischenergebnisse der Bearbeitung einschließlich des Rohbildes bleiben gespeichert und stehen für Vergleiche zur Verfügung. Im Regelfall zeigt der Bildschirm dem Bearbeiter vier Bilder zugleich. Das hilft vor allem die entscheidende Frage zu beantworten, ob der Bearbeitungsprozeß nicht nur Bildfehler, sondern auch medizinisch wesentliche Details unterdrückt hat. Auch unbegründete Befürchtungen lassen sich auf diesem Wege ausräumen: Wenn das Ultraschall-Verfahren ohnehin nur eine Auflösung von zwei Millimetern hat und sich die Filterung auf das Entfernen von Strukturen beschränkt, die kleiner als ein Millimeter sind, kann das neue Bild gar nicht schlechter sein als das alte; gleichwohl sieht es für manchen Praktiker, der sich in langer Erfahrung an die alten Bilder gewöhnt hat, ungewohnt glatt und zu schön aus, um wahr zu sein. Diesen Anwendern wird der Vergleich mit dem Rohbild die Umgewöhnung sicherlich erleichtern.
Zwei- und dreidimensionale Darstellung können auf vielfältige Weise verknüpft werden. Wenn der Benutzer mit der Maus eine Stelle in einem der vier Fenster anklickt, liefert das System die entsprechende Position in den restlichen Fenstern. Gibt man in der dreidimensionalen Darstellung eine Ebene an, so erhält man das Bild eines Schnitts entlang dieser Ebene.
Weitere Hilfsmittel ermöglichen die präzise Messung von Strecken und Volumina, die Erzeugung von Kurzfilmen und Stereo-Bildpaaren, die Wahl zwischen perspektivischer und orthogonaler Projektion, das Abspeichern einzelner Bilder, das Festlegen und Verfolgen von Operationspfaden und anderes.
Nach einer Filterung – vor allem nach einer zurückhaltenden – zeigt sich immer noch kein sonderlich klares Bild. Die gefundenen Strukturen sind unscharf und mehrdeutig; sie weisen vielerorts Unterbrechungen und Lücken auf. Ferner sind größere Häufungen von Störeffekten wie Reflexionen aus dem Nahfeld oder dem Fruchtwasser von den medizinisch interessanten Oberflächen oft nicht unterscheidbar; sie können die gesuchte Struktur fast vollständig verdecken (Bild 4 links Mitte). Man sieht gewissermaßen vor lauter Blättern den Baum nicht – vom Wald ganz zu schweigen.
Visualisierung unscharfer Konturen und Oberflächen
Mangels klarer Unterscheidungskriterien haben wir zu Mitteln der unscharfen Logik gegriffen (fuzzy logic, vergleiche Spektrum der Wissenschaft, März 1993, Seite 90). Der Algorithmus trifft keine Ja-Nein-Aussage darüber, ob ein Voxel zu einer Kontur gehört oder nicht, sondern berechnet eine Wahrscheinlichkeit dafür zwischen 0 (sicher nein) und 1 (sicher ja); und zwar ist diese Wahrscheinlichkeit um so größer, je besser eines der folgenden Kriterien erfüllt ist:
- Konturen erscheinen heller, das heißt, sie reflektieren den Ultraschall stärker als ihre Umgebung;
- sie sind zusammenhängend, das heißt, in der Nachbarschaft eines Konturenvoxels finden sich weitere gleichartige, wenn auch möglicherweise untermischt mit anderen,
- sie zeigen einen deutlichen Kontrast gegenüber ihrer Umgebung und
- sie sind nicht klein, das heißt, ihre Grobform bleibt wiedererkennbar, wenn man die Bildschärfe künstlich verringert.
Anstelle der Rohdaten zeigt das Programm auf dem Bildschirm eine fiktive Substanz, die an jeder Stelle um so undurchsichtiger ist, je höher dort die nach obigen Kriterien errechnete Konturwahrscheinlichkeit ist. Was mit einiger Sicherheit eine Kontur ist, wird also stärker und deutlicher dargestellt, während die weniger plausiblen Stellen milchig, verschwommen und weniger bis kaum sichtbar werden. Sie bilden eine Art Wolke um die klaren Konturen herum und werden vom Beobachter kaum wahrgenommen. Wir lassen also Blätter und kleine Äste verblassen, damit man den Baum besser sehen kann (Bild 4 links).
Interaktive Segmentierung
Selbst bei gelungener Filterung und Konturenerkennung ist beispielsweise das Gesicht des Fötus nicht sichtbar, wenn er zufällig seine Hand davorhält. Um ein Vordergrundobjekt unsichtbar zu machen, kann man das Datenvolumen interaktiv verkleinern.
In der einfachsten Variante verschiebt man dazu mit der Computermaus eine oder mehrere Ecken des Datenquaders, der dadurch zu einem allgemeinen Hexaeder (Sechsflächner) wird. Zur feineren Abgrenzung dient ein etwas genaueres Verfahren. Wenn es etwa um eine Frontalansicht vom Kopf eines Ungeborenen geht, umfährt man in der Seitenansicht alle Bereiche, die man nicht sehen will, mit der Computermaus. Indem diese Kurve von links nach rechts geradlinig fortgesetzt wird, entsteht eine Art Schlauch; alles, was darin liegt, wird im nächsten Durchgang des Verfahrens nicht mehr dargestellt (Bild 5 Mitte).
Möglicherweise bleiben dann immer noch kleine Klumpen – Reste bereits entfernter Strukturen, außergewöhnlich große Störsignale oder ähnliches – übrig, die vor dem Gesicht des Fötus zu schweben scheinen. Für die Entfernung mit der Schlauchmethode sind sie zu klein oder ungünstig gelegen. In diesem Falle identifiziert man interaktiv die störende Struktur, indem man sie mit der Maus anklickt. Daraufhin wendet das Programm das Analog eines Radiergummis an: Eine Löschfront breitet sich aus, folgt der identifizierten Oberfläche und zerstört sie, bis sie gänzlich entfernt ist oder der Benutzer Einhalt gebietet, um zum Beispiel ein Übergreifen auf benachbarte interessante Strukturen zu verhindern (Bild 5 rechts).
Bedienungskomfort
Eine wesentliche Stärke unseres Systems sehen wir darin, daß es dem Benutzer zahlreiche Bildbetrachtungsweisen zugleich anbietet. So kann er sich jede (achsenparallel oder beliebig orientierte) Schicht des originalen Datensatzes ansehen, unter freier Wahl von Bildparametern wie Helligkeit und Kontrast.
Für die räumliche Darstellung bietet das System mehrere Möglichkeiten: Im (oben ausführlich beschriebenen) Oberflächenmodus werden Konturen und Oberflächen extrahiert, im Absorptionsmodus wird eine Art Röntgenbild präsentiert, und im Maximum or Minimum Intensity Projection Mode (MIP) wird das jeweilige Maximum beziehungsweise Minimum entlang eines Sehstrahls auf die Bildebene projiziert. Das bringt Strukturen extremer Reflexivität (im wesentlichen Knochen und Gefäße oder Zysten, Bild 4 rechts) besonders deutlich heraus. Alle diese Modi werden simultan angeboten, so daß der Benutzer die Anteile der jeweiligen Methode in ein einziges Bild verschmolzen betrachten kann. Das System bietet auch allmähliche Überblendungen zwischen verschiedenen Bildtypen (Bild 6).
Das System ist inzwischen fertig implementiert und läuft sowohl auf Workstations unter dem Betriebssystem Unix als auch auf PCs unter Windows NT oder Windows 95. Die klinische Erprobung ist bereits angelaufen. Wir rechnen damit, das System noch in diesem Jahr medizinischen Anwendern anbieten zu können.
Literaturhinweise
– Foetal Visualization Using 3D Ultrasonic Data. Von G. Sakas, S. Walter, W. Hiltmann und A. Wischnik in: Proceedings in Computer Assisted Radiology Berlin 21-24 June 1995. Springer, Berlin 1996.
– Pre-Processing, Segmenting and Volume Rendering 3D Ultrasonic Data. Von G. Sakas, L. Schreyer und M. Grimm in: IEEE Computer Graphics and Applications, Band 15, Heft 4, Seiten 47 bis 54, Juli 1995.
– Extracting Surfaces from Fuzzy 3D Ultrasonic Data. Von G. Sakas und S. Walter in: ACM Computer Graphics, Proceedings SIGGRAPH-95. Addison-Wesley 1996, Seiten 465 bis 474.
– Web-Seite der Abteilung: http://www. igd.fhg.de/www/igd-a7.
Aus: Spektrum der Wissenschaft 6 / 1997, Seite 103
© Spektrum der Wissenschaft Verlagsgesellschaft mbH
Schreiben Sie uns!
Beitrag schreiben