Direkt zum Inhalt

Hemmer und Meßner erzählen: Kleine Geschichte vom Vocoder und einem streng geheimen Robotersound

»Wir sind die Roboter«, müssen sich Churchill und Roosevelt gedacht haben. Von der erstaunlichen Karriere eines Spracherzeugers erzählen unsere Geschichtskolumnisten Richard Hemmer und Daniel Meßner.
Ein SIGSALY-Terminal
Ein SIGSALY-Terminal im National Cryptologic Museum der USA. Die auf Vocodern basierende Technologie erwies sich als unknackbar für Nazi-Deutschland, war allerdings extrem komplex.
Die beiden Historiker Richard Hemmer und Daniel Meßner bringen jede Woche »Geschichten aus der Geschichte« in ihrem gleichnamigen Podcast. Auch auf »Spektrum.de« blicken sie mit ihrer Kolumne in die Vergangenheit und erhellen, warum die Dinge heute so sind, wie sie sind.
Alle bisherigen Artikel der Kolumne »Hemmer und Meßner erzählen« gibt es hier.

Als der US-amerikanische Akustik- und Elektronikingenieur Homer Dudley im Oktober des Jahres 1928 in einem Krankenhausbett liegt – eine Kolik plagt ihn –, kommt ihm ein folgenreicher Gedanke. Auf dem Rücken liegend, Mund geöffnet, philosophiert er über seinen Kopf als Klangerzeugungsgerät. Wie sein Kehlkopf einen Klang erzeugt, wie die Muskeln im Mund diesen Klang umformen und wie das Endergebnis aus seinem Mund strömt.

Lässt sich das nicht technisch nachbilden? Wieder genesen, macht er sich an die Arbeit an einem Gerät, das in den darauf folgenden Jahrzehnten nicht nur die Kommunikation, sondern vor allem auch die Musikwelt revolutionieren sollte.

Etwas mehr als zehn Jahre später steht Dudley auf der New Yorker Weltausstellung von 1939 vor Publikum. Das Ergebnis seiner Arbeit ist der »Voice Operation Demonstrator«. Nichts weniger ist dem Ingenieur gelungen, als eine Maschine zu konstruieren, die künstliche Sprache erzeugt! Der »Voder« ist ungefähr so groß wie ein Schreibtisch und würde in kaum einem Büro der Zeit auffallen. Durch präzises Drücken der richtigen Tasten und Hebel kann der Bediener dem Voder jeden Laut der englischen Sprache entlocken und damit im Grunde jedes Wort.

Bei der Vorführung sitzt Dudleys Assistentin am Apparat und entlockt ihm ganze Sätze – inklusive Betonung an der gewünschten Stelle.

Für seinen Voder hatte Dudley das biologische Vorbild technisch nachgeahmt. Wenn ein Mensch spricht, erzeugt er im Kehlkopf einen schrillen Klang aus zahlreichen Frequenzen, dem Quäken einer Kindertröte nicht unähnlich. Erst wenn dieser Ton durch Mund und Nase läuft, erhält er den typischen Sprachklang, weil je nach Position von Zunge, Lippen und Gaumensegel bestimmte Frequenzen verstärkt werden. Bewegt sich die Zunge oder öffnet und schließt sich der Mund, ändern sich auch die hervorstechenden Frequenzen: Was eben noch wie ein »a« klang, hört sich nun wie ein »u« an.

Der Voder wird vorgestellt

Dudleys Voder hatte in Analogie zum Kehlkopf eine Einheit, die ein elektrisches Signal aus zahlreichen Frequenzen erzeugte. Aus einem Lautsprecher würde es wie ein Brummen klingen. Diesen Rohklang leitete er anschließend parallel durch mehrere Verstärker, die auf Knopfdruck ihre jeweiligen Frequenzbereiche verstärkten und dadurch den Ausgangsklang modulierten – wie im Original Zunge oder Lippen. Für andere Sprachlaute brauchte es zwar noch weitere Tricks und Komponenten, doch die eigentliche Ausgabe besorgten die Verstärker. Jetzt war die Geschicklichkeit des Bedieners gefragt, im richtigen Moment die richtigen Knöpfe zu drücken.

Das Gerät erfreute sich großer Beliebtheit, die eigentliche bahnbrechende Sensation aber sollte dem Amerikaner mit einer Weiterentwicklung gelingen. Der Nachfolger des Voders produzierte nämlich nicht nur synthetische Sprache, sondern zerlegte menschliche Sprache zuerst in ihre Einzelteile – um sie danach an anderer Stelle wieder zusammenzusetzen. Der »Vocoder« war geboren.

Das Militär will nicht abgehört werden

Wer jetzt sofort an Kraftwerk denkt, an die deutschen Pioniere der Elektronikmusik, liegt natürlich völlig richtig. Von den wilden 1970er Jahren trennen uns allerdings noch einige Jahrzehnte, in denen der Vocoder eine ganz andere Karriere durchlief.

Wäre es nach Dudley gegangen, wäre der Vocoder bald schon wieder abgetaucht: Er sah in seiner Erfindung die Möglichkeit, Sprache unter Wasser über lange Distanzen zu transportieren, zum Beispiel über das Transatlantikkabel. Inspiration holte er sich dabei auch von einem deutschen Techniker. Karl Willy Wagner hatte im Jahr 1936 bereits einen Vokalsynthetisierer entwickelt. Einer potenziellen Zusammenarbeit machte der Zweite Weltkrieg zwar einen Strich durch die Rechnung, dem Vocoder verhalf er aber zu seinem ersten Einsatz.

Der Voder bei der Weltausstellung 1939 | Der Voder verlangte nach einem geübten Bediener, der Tasten und Pedal im richtigen Moment zu drücken wusste.

Als der Krieg ausbrach, suchte das US-Militär dringend nach einer Möglichkeit, abhörsicher Sprache zu übertragen, nicht zuletzt damit zum Beispiel US-Präsident Franklin D. Roosevelt und Premierminister Winston Churchill ohne Mithörer miteinander telefonieren konnten. Und so wurde bei den Bell Labs, Dudleys Arbeitgeber, ab Ende 1942 an einem System gearbeitet, das intern als »Project X« bezeichnet wurde und vom Militär den Namen SIGSALY erhielt – übrigens kein Akronym, wie man annehmen würde, sondern einfach ein frei erfundener Name.

Geheime Robotergespräche

Herzstück dieses neuen Systems war ein Zwölfkanal-Vocoder-System, mit dessen Hilfe am einen Ende Sprache verschlüsselt und am anderen Ende entschlüsselt wurde: Aus dem Lautsprecher dröhnte dann nicht Roosevelts Stimme wie beim Telefon, sondern eine künstlich erzeugte Nachbildung dessen, was dieser in ein Mikrofon gesprochen hatte. Das klang roboterhaft, war jedoch durchaus verständlich.

Damit der künstliche Sprachklang entstand, brauchte es wieder Verstärker, die einen Rohklang zu Sprachlauten formten. Wo ursprünglich noch Dudleys Assistentin die Tasten gedrückt hatte, ging es nun vollautomatisch zu: Der Vocoder ermittelte bereits bei der Aufnahme mit Hilfe von Filtern, welche Frequenzen prominent vorhanden waren und dementsprechend bei der Ausgabe verstärkt werden mussten. Und nur diese Information lief dann über das Kabel zum Empfänger.

Der Vorteil dieses Verfahrens gegenüber dem Telefon war, dass die Menge der zu übertragenden Informationen drastisch verringert wurde. Denn es sollte ja der Geheimkommunikation dienen, und so ließ es sich leichter verschlüsseln und schwerer knacken. Beim SIGSALY-Verfahren lief dazu eine Schallplatte mit, auf die die Muzak Corporation (die später für ihre Fahrstuhlmusik bekannt wurde) ein Zufallsrauschen gepresst hatte. Dieses Rauschen wurde mit dem zu übertragenden Signal gemischt. Auf der anderen Seite des Atlantiks existierte eine exakte Kopie dieser Schallplatte, mit der das Rauschen wieder herausgefiltert wurde.

Handlich war dieses neue System nicht. Vakuumröhren, Synchromotoren, Plattenspieler und weitere elektromagnetische Geräte verhalfen einem SIGSALY-Terminal zu einem Gewicht von 55 Tonnen.

Trotzdem wurden zwischen 1943 und 1945 zwölf solcher Terminals gebaut und unter anderem nach Paris, Algier, Manila, Guam und einige Orte in Australien verschifft. Das SIGSALY-Netzwerk sorgte damit für abhörsichere Kommunikation zwischen den alliierten Staatschefs und Oberbefehlshabern. Tatsächlich gelang es den Deutschen nie, das Verfahren zu knacken.

Zweitkarriere ab den 1970er Jahren

Das aufwändige System blieb auch nach dem Ende des Zweiten Weltkriegs weiterhin in Verwendung, teilweise sogar bis in die 1970er Jahre, parallel dazu jedoch fand der verzerrte Sound des Vocoders schon ab den 1950er Jahren Verwendung in einem ganz anderen Bereich – der Musik! So stattete schon ab 1957 Siemens einen seiner Synthesizer mit einem Vocoder aus. Und bereits einige Jahre zuvor, nämlich 1953, war in Köln das Studio für elektronische Musik des WDR gegründet worden. In dessen topmoderner Ausstattung durften die Vocoder nicht fehlen.

Kraftwerk, »Wir sind die Roboter«

Dass das in Deutschland und nicht in den USA passierte, war kein Zufall. Auch in Deutschland und Österreich arbeiteten Entwickler an eigenen Vocodern, wie zum Beispiel Werner Meyer-Epplers oder der österreichische Computerpionier Ernst Rothauser. Mit der Einrichtung eines Studios für elektronische Musik war gleichzeitig eine Absage an den Konservativismus des Nachkriegsdeutschlands verbunden.

Den richtigen Durchbruch in der Musikwelt verschaffte dem Vocoder aber Robert Moeg, der ab 1968 so genannte Solid-State-Vocoder baute. Statt Elektronenröhren wurden nun Halbleiterbauteile eingesetzt, was weitaus praktikabler war.

Als Moeg schließlich noch mit Wendy Carlos, der Pionierin früher elektronischer Musik, eine Zusammenarbeit startete und sie gemeinsam einen Vocoder entwarfen, den Carlos für die Komposition des Soundtracks für Stanley Kubricks Klassiker »A Clockwork Orange« verwendete, war der Vocoder aus der Musikwelt nicht mehr wegzudenken.

Der große Unterschied zwischen diesen neuen Vocodern und dem ursprünglichen SIGSALY-System war nun übrigens, dass sie sich mit Synthesizern ansteuern ließen. Über ein Keyboard konnte man die Tonhöhe der erzeugten Sprache ändern und den Vocoder dadurch spielen wie ein Musikinstrument. Der Vocoder sprach nicht mehr nur, er sang.

Von Kraftwerk bis zum Hiphop

Wie der Autor Dave Tompkins in seinem Buch »How to Wreck a Nice Beach« (selbst eine falsch verstandene Version des durch den Vocoder verzerrten Satzes »How to recognise speech«) schreibt, begann der Vocoder nun seinen Siegeszug durch etliche Genres.

Während die deutschen Elektronikpioniere Kraftwerk ab den 1970er Jahren schon Vocoder in ihren Liedern einsetzten, begann in den USA der Vocoderboom im Hiphop mit dem Song »Planet Rock«, den der New Yorker DJ Afrika Bambaataa im Jahr 1983 veröffentlichte.

Und auch der japanische Komponist Tomita, der mit »elektronisierten« Versionen berühmter Songs von Elvis Presley oder den Beatles bekannt wurde, verwendete ausgiebig die schaurig-schönen Vocodereffekte.

Aus der Musikwelt ist der Vocoder heute schon lange nicht mehr wegzudenken, obwohl mittlerweile einige andere Geräte oder Softwarelösungen verwendet werden, um ähnliche Effekte zu erzielen. Zum Beispiel die vom Musiker Peter Frampton verwendete Talkbox, mit der er seine Gitarre zum Sprechen bringt, aber auch Software wie Autotune, die eigentlich nur schief gesungene Töne korrigieren soll. Übertreibt man die Korrektur, verleiht sie der Stimme einen metallischen Klang, der etwas an einen Vocodereffekt erinnert.

All diese heute so beliebten Effekte verdanken ihre Existenz Homer Dudley und jenem Gedanken, der vor beinahe 100 Jahren als Resultat eines Krankenhausaufenthalts geboren worden war.

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.