Verschiedene Verfahren

Wie man sieht, wartet das Gehör mit der Erzeugung sehr feiner Messungen und der Übermittlung sehr feiner zeitlicher, spektraler, sowie hochauflösender Informationen auf. Dieses Sinnesorgan zu täuschen entpuppt sich also als wesentlich aufwendiger, als die Täuschung des Auges beispielsweise. Zwei Ansätze in der 'Überlistung' des auditiven Sinnes sollen hier nun genauer erklärt werden.

3D Surround und andere Techniken

Insbesondere in Kinos, mittlerweile auch in einigen privaten Haushalten finden sogenannte 3D Surround Systeme große Verbreitung. Sie basieren im professionellen Bereich auf dem Prinzip der gleichzeitigen Aufzeichnung (oder nachträglichen Vertonung) mehrerer getrennter Audiospuren. In den Kinosälen, die dieses Tonaufzeichnungsverfahren an Ihr Publikum weitergeben wollen, müssen für die vielen Audiospuren dann auch entsprechend viele teure Lautsprechersysteme zur Verfügung stehen. Der Hauptaufbau besteht aus drei Lautsprechern, welche sich hinter der Leinwand, genau gegenüber des Publikums befinden. Die restlichen Lautsprecher werden seitlich und hinter dem Publikum angebracht.

Es wird also ein hoher technischer Aufwand benötigt, um an vielen Punkten des Raumes möglichst viele Tonspuren gleichzeitig hören zu können. Schade nur, daß diese aufwendige Technik nicht auch entsprechend genutzt wird: Aufgrund des Aufwands bei der (Nach-)vertonung solcher Filme beschränken sich die Produzenten in den meisten Fällen auf die Zuordnung: Sprache vorne, Umgebungsgeräusche hinten. Dies beruht auf dem Problem der Synchronisierung vieler Spuren auf ein Bild. Auch die Räumliche Verteilung der Lautsprechersysteme kann Probleme ergeben, wenn durch Überlagerung Auslöschungen oder ungewünschte Verstärkungen auftreten. Somit bleibt der Mehrzahl der Systeme (seitlich und hinten) nur die Abstrahlung von Umgebungsgeräuschen, die vom Publikum ohnehin nicht einer punktförmigen Schallquelle zugeordnet werden. Diese Techniken bieten also (noch) nicht die Möglichkeiten, die an die modernen VR Systeme gestellt werden. Von den im Folgenden vorgestellten Systemen wird zusätzlich erwartet, daß die Schallortung nicht nur in einer Ebene möglich wird - etwa auf einer horizontalen Ebene in Ohrenhöhe (wie im Kino). Die Schallortung soll bei den VR Systemen in allen Punkten eines Polarkoordinatensystems um den Kopf herum möglich sein.

Kunstkopf-Mikrofonie

Die Kunstkopf Mikrofonie basiert auf dem einfachen Nachstellen eines echten Hörerlebnisses. Vergleichbar mit der rot-grünen 3D-Brille im Kino werden dem Ohr Informationen zugeführt unter Ausschaltung der eigentlichen Sinneswahrnehmung. Da ja nun bekannt ist, daß die Form der Hörmuscheln und der Abstand der Ohren eine Schlüsselrolle im dreidimensionalen Hören spielen, liegt es nahe, die Aufzeichnung von Audioinformationen dem originalen Hören nachzuempfinden. Man verwendet dazu beispielsweise einen Perückenhalter aus Styropor, welcher die Form eines menschlichen Kopfes besitzt. An der Stelle der Ohren werden dem Styroporkopf Mikrofone eingesetzt, die Hörmuscheln werden künstlich nachgebildet. Somit hat man die natürliche Hörumgebung eines Menschen geschaffen. Zeichnet man nun die von den Mikrofonen empfangenen Informationen auf, so kann man ohne weitere Nachbearbeitung das dreidimensionale Hörerlebnis nachempfinden, wenn man sich die Aufzeichnungen mit einem Kopfhörer wieder anhört.

Das Prinzip der Kunstkopf-Mikrofonie beruht also auf dem Ausschalten der Wirkung der Ohrmuscheln des Zuhörers durch das Verwenden von Kopfhörern. Die Wirkung der Ohrmuscheln und der Kopfes wurden ja bereits bei der Aufzeichnung mit auf das Band übertragen. Die Wirkung dieser Methode ist verblüffend gut, vor Allem, wenn der Seheindruck zum Gehörten paßt. Damit treten auch gleich die Nachteile dieser Methode zutage:

  1. Es Bedarf der Kopfhörer für den Konsumenten. Dies bedeutet eine eingeschränkte Bewegungsfreiheit sowie eine unnatürliche Situation, welche unter Umständen den Erlebniswert des Gehörten senkt.

  2. Das Signal, das dem Zuhörer vorgespielt wird, muß im Vorlauf aufgezeichnet werden. Es ist keine Echtzeiterzeugung der Schallinformation möglich. Wäre dies nicht so, dann könnte man sich den Kunstkopf sparen und den Zuhörer direkt dem dreidimensionalen Hörerlebnis aussetzen.

Somit ist diese Technologie zwar dafür geeignet, sich einem dreidimensionalen Hörempfindens auszusetzen, allerdings nicht in Zusammenhang mit anderen multimedialen Technologien, geschweige denn Echtzeitsimulationen oder interaktiven 'VR-Shows'.

Schallfeldsimulation

Die HRTF (Head Related Transfer Function)

Die HRTF spielt bei den bisher angewendeten Methoden der 3D-Schallerzeugung eine Schlüsselrolle. Die HRTF ist eine individuelle Beschreibung der Summe aller Hörfunktionen eines Menschen. Die Werte der HRTF werden als Koeffizienten für die Berechnung der dreidimensionalen Schallerzeugung benötigt. In einer HRTF werden Kopfform, Torus, die Form der Ohrmuscheln, u.s.w. Berücksichtigt, abhängig von der Richtung des einfallenden akustischen Signals. Daher ist die beste Möglichkeit, die HRTFs einer Person zu bestimmen, die Messung an eben dieser Person. Nun läßt sich daraus leicht erkennen, daß eine Messung an einer Person nicht die gleichen Ergebnisse für einige andere Personen erzielen wird - es ist sogar noch schwieriger: Wird z.B. das Ortungsvermögen bestimmter Frequenzen in bestimmten Einfallswinkeln gemessen, so ergeben sich bei zwei Personen teilweise so große Unterschiede in der Aufnahme der Signale, daß ein Mittelwert aus diesen Meßwerten Null ergeben würde. Man kann also nicht die 'typisch mitteleuropäische' HRTF ermitteln, indem man eine repräsentative Menge an Messungen durchführt. Da diese Methode zum Scheitern verurteilt ist, wird die Erzeugung der HRTFs von einer Anderen Seite her angegangen. Bei der Gestaltung einer VR-Simulation werden die benötigten Schallinformationen ausgewertet um herauszufinden, welche Informationen überhaupt für die Berechnung anhand einer HRTF eine Rolle spielen. Schränkt man so die zu Berechnenden Möglichkeiten ein, ist es möglich ein Optimum für alle unbekannten HRTFs der Betrachter und Zuhörer zu finden. Ein weitaus größerer Effekt für Jeden Einzelnen wäre aber tatsächlich mit einer Bestimmung seiner eigenen HRTFs möglich. Die Bestimmung erfolgt duch Messung mit Mikrofonen in den Ohrmuscheln des Zuhörers. Dabei werden maximal 100 Messungen aus verschiedenen Richtungen vorgenommen, da das Auflösungsvermögen des Hörsinns ungefähr bei 100 Richtungen liegt.

Faltet man nun ein Audiosignal an den HRTFs, dann glaubt der Zuhörer, das Signal käme aus der entsprechenden Richtung, die zur Erzeugung der HRTF verwendet wurde. Da eine Faltung mit allen 100 HRTFs zu rechenintensiv ist, werden derzeit nur die stärksten Raumrichtungen (mittels Direktschallsimulation) dargestellt.

Cone Tracing (Spiegelschallquellenmethode)

Das Cone Tracing Verfahren, zu deutsch: Das Spiegelschallquellenverfahren simuliert beliebige Reflexionen erster Ordnung. Das heißt, daß die Schallinformation aus einer Quelle durch die virtuelle Schallquelle, die nach der ersten Reflexion des Schalls an einer Wand des Raumes entsteht, dargestellt wird. Dabei werden nur die virtuellen Schallquellen berücksichtigt, deren Schallkegel den Empfänger auch erfassen. Dies bedeutet, daß der Rechenaufwand exponentiell ansteigt, je weiter entfernt der Empfänger sich von den Schallquellen befindet, da die Schallkegel sich mit größerer Entfernung immer mehr erweitern. Trifft nun ein Schallkegel einer virtuellen Schallquelle wiederum auf eine Wand, dann muß auch dessen Reflexion an der Wand berechnet und ausgegeben werden. Mit zunehmender Reflexionstiefe wächst nicht nur der Rechenaufwand sondern auch die Wahrscheinlichkeit, daß die Schallkegel den Empfänger erreichen. Möchte man also eine höhere Reflexionstiefe erreichen, so muß man auch die Spiegelung von virtuellen Schallquellen an den virtuellen Wänden berücksichtigen.

Bei Abbildung 11-2 handelt es sich um eine stark vereinfachte Modelldarstellung. Bei der Simulation werden noch mehr Lautsprecher, auch unter verschiedenen Winkeln verwendet.

Das Cone Tracing Verfahren eignet sich besonders für die Echtzeitdarstellung von Schallreflexionen bis zur 3. Ordnung in rechteckigen Räumen. In diesem Spezialfall reduziert sich die Anzahl der virtuellen Schallquellen auf ein Maß, das mit angebrachter Rechenleistung noch zu Bewältigen ist. Es existieren Echtzeitsysteme, die akustisches Raytracing unterstützen. Diese Systeme verwenden das Cone Tracing Verfahren mit den eben genannten Einschränkungen.

Somit läßt sich das Cone Tracing Verfahren einsetzen zur Simulation von virtuellen Schallquellen über Direktschallsimulation und sehr gut auch zur Echtzeitsimulation von Reflexionen niederer Ordnung in kubischen Räumen. Für eine größere Tiefe, d.h.: eine größere Anzahl an Reflexionen ist das Verfahren nicht sehr geeignet, da der Rechenaufwand exponentiell ansteigt. Auch müssen die virtuellen Räume rundum geschlossen sein.

Particle Tracing

Im Gegensatz zum Cone Tracing Verfahren werden die Schallquellen beim Particle Tracing Verfahren durch eine Anzahl von Teilchen repräsentiert, die sich bei der Aussendung von Schall vom Sender fortbewegen und deren Anzahl mit steigender Entfernung vom Sender abnimmt. Dabei ist jedem Teilchen ein bestimmtes Frequenzband zugeordnet. Auf dem Weg durch den Raum folgen die "Schallteilchen" dabei dem einfachen Gesetz: "Einfallswinkel = Ausfallswinkel". Das Verfahren bestimmt rein statistisch für jeden Punkt im Raum die Einfallswinkel und das Energieniveau der Partikel. Der Rechenaufwand beim Particle Tracing ist deshalb immens groß, eine Echtzeitberechnung ist hier noch nicht möglich. Dies liegt an der Vielzahl der verschiedensten Berechnungen, die bei diesem Verfahren notwendig sind. Die Teilchen werden einzeln auf ihrer 'Reise' berechnet und verlieren ihre Energie aufgrund von Entfernung vom Ursprung, Anzahl der Reflexionen und Absorptionsgrad der Wände. Fällt das Energieniveau unter einen vorher festgelegten Grenzwert, dann endet die weitere Wegberechnung des Partikels.

An jeder Stelle, an der sich ein Zuhörer befinden kann, muß dann ein virtueller Detektor stehen, der den Eintrittswinkel und das Energieniveau der Partikel in diesem Punkt erfaßt. Die Detektoren sollten dabei so eng stehen, daß zwischen ihnen keine wesentlichen raumakustischen Unterschiede hörbar werden. Auf diese Weise können alle Parameter für die 3D Auralisierung bestimmt werden. Trifft nun ein Partikel in seinem Verlauf nicht auf einen Detektor, so kann es bei der Ausgabe vernachlässigt werden.

Auffällig ist an den beiden Schallfeldsimulationen, daß sie im Gegensatz zu den visuellen Ray-Tracing Verfahren die Berechnungen immer vom Sender aus beginnen. Beim Ray-Tracing Verfahren in der grafischen Darstellung wird aber vom Beobachter ausgegangen, was die Anzahl der möglichen Strahlenverläufe stark verringert. Auch die Kollisionserkennung von Partikeln oder Schallkegeln mit den Wänden des Raumes kann noch in vielen Belangen vereinfacht und verbessert werden. Man sieht hier besonders deutlich, daß sich die Technik der 3dimensionalen Klangerzeugung noch in ihrem Anfangsstadium befindet.