Das Kefk Network Wiki befindet sich im Testbetrieb.


Faltungshall

Aus Kefk.

Wechseln zu: Navigation, Suche

Der Faltungshall ist ein akustischer Hall-Effekt, der mit Hilfe der Faltung Abbilder real existierender Räume per Computersystem auf Audiosignale errechnet.

Im Gegensatz zum synthetischen Hall, der durch künstlich erzeugte Reflexionen bestimmte Raumtypen nachbildet, hat der Faltungshall eine akustische Probe eines echten Raumes als Grundlage. Durch Erzeugen eines Geräusches (Idealer Impuls bzw. Dirac-Stoß oder Sinussweep) kann der individuelle Nachhall jedes beliebigen Raumes per Mikrofon (Stereomikrofonie) aufgenommen werden. Diese Aufnahme heißt Impulsantwort. Sie ergibt einen typischen Signalverlauf, der oft als Fingerabdruck des individuellen Raumklanges bezeichnet wird. Mit diesem individuellen Raumklang kann dann jedes Audiosignal versehen werden. Dieses Audiosignal klingt dann als wäre es in dem entsprechenden Raum. Die Hörperspektive entspricht der Mikrofonposition (Stereomikrofonie) bei der Impulsanwort-Aufnahme.

Inhaltsverzeichnis

Besonderheiten

Als Vorteile bieten sich ein realistischer Klang sowie die kostenlose Verfügbarkeit vieler Impulsantworten im Internet. Außerdem ist die Technik billiger als die alternativen HiEnd-Effektgeräte.

Ein Nachteil ist, dass VST-basierte PlugIns sehr viel CPU-Leistung brauchen. Zudem sind Impulsantworten starr und nicht editierbar (z. B. Position im Raum). Leichte Latenzen (individuell, je nach Datenreduktion bzw. Näherungsgrad und Rechenleistung) sind ein weiterer Negativaspekt.

Grundprinzip

Bild:Convolution FFT and IFFT.jpg
Die Umrechnung zwischen Ortsraum und Frequenzraum per FFT und IFFT

Jeder Klang bzw. jedes Audiosignal außer Sinustönen ist ein Gemisch aus mehreren Sinustönen (Einzelfrequenzen). Das Audiosignal ist eine Gesamtschwingung. Tontechniker sprechen hier vom Highlander-Prinzip der Schwingungen; "Es kann nur Eine geben".

Der Klang eines Audiosignals, beispielsweise der eines Instrumentes, resultiert aus dem momentanen Vorhandensein all seiner Frequenzen zum jeweiligen Zeitpunkt. Diese Frequenzen haben alle je eine bestimmte Amplitude (Lautstärke) und eine bestimmte Phasenlage.

Durch die Fast Fourier Transformation (FFT) kann ein Zeitpunkt eines Audiosignals (Ortsraum) im Frequenzraum dargestellt werden. Umgekehrt kann jede Konstellation im Frequenzraum durch die Inverse FFT einen Zeitpunkt eines Audiosignals darstellen. Jede Veränderung im Frequenzraum (z.B. Veränderung der Amplitude einer Frequenz) hat, durch die IFFT auf den Ortsraum übertragen, eine typische Klangveränderung zur Folge.

Kreuzmultiplikation

Rein theoretisch wäre die Addition der Frequenzbilder im Frequenzraum nicht nötig. Man könnte stattdessen jeden Zeitpunkt des zu verhallenden Signals mit jedem Zeitpunkt der Impulsantwort multiplizieren. Die Rechenmethode dafür heißt Kreuzmultiplikation.

Bild:KreuzmultiplikationJPEG.jpg
Kreuzmultiplikation auf wertkontinuierlicher Ebene

Da die Berechnung auf digitaler Ebene erfolgt, sind beide Signale (zu Verhallendes und Impulsantwort) diskrete Signale. Diskret bedeutet, sie haben eine endliche Anzahl an Werten. Sie bestehen aus einer endlichen Anzahl sogenannter Audio-Samples. Damit ist auch die Anzahl an Berechnunsvorgängen begrenzt. Bei einer Samplingfrequenz (Abtastrate) von 44,1 kHz hat jeder Audiokanal 44.100 Samples pro Sekunde.

[[Hilfe:Cache|Fehler beim Thumbnail-Erstellen]]: convert: unable to open image `/var/www/kefk/w/images/d/d0/Summenintegral_Faltung_JPEG.jpg': No such file or directory.
Kreuzmultiplikation auf diskreter Ebene

Diese Kreuzmultiplikationen sind aber relativ kompliziert und erfordern entsprechend einen hohen Rechenaufwand. Daher werden die Signale nicht wie hier dargestellt im Ortsraum berechnet, sondern durch gewichtete Additionen im Frequenzraum. Gewichtet bedeutet, dass man die Phasenlagen der Einzelschwingungen berücksichtigt. Z.B. ergibt die Addition zweier gleicher Frequenzen die genau Gegenphasig sind (-180°) Null; sie löschen sich aus. Zur Einbeziehung der Phasenlagen wird mit Komplexen Zahlen gerechnet, denn dafür sind Quadrate negativer Zahlen im Koordinatensystem des Einheitskreises nötig.

Faltung

Bild:Convolution Raster.jpg
Sowohl für den Gesamtverlauf (Ortsraum) des zu Verhallenden Signals, als auch für den der Impulsantwort werden für jeden Zeitpunkt per FFT die Frequenzspektren gebildet

Beim Faltungshall wird jeder Zeitpunkt des zu verhallenden Signals in den Frequenzraum übertragen. Ebenso liegt jeder Zeitpunkt der sogenannten Impulsantwort (siehe Einleitung) im Frequenzraum vor. Im Frequenzraum wird jeder Zeitpunkt des zu verhallenden Signals mit jedem Zeitpunkt der Impulsantwort addiert und das Ergebnis wieder (an der zeitlich richtigen Position) per IFFT in den Ortsraum übertragen. Das Ergebnis ist wieder ein Verlauf im Ortsraum; das verhallte Signal.

Auf digitaler Ebene bedeutet das, jedes Sample des ursprünglichen Audiosignals wird mit jedem Sample der Impulsantwort skaliert.

Genau wie bei den beiden Ausgangssignalen besteht das neue Signal aus einer individuellen Funktion für jeden Zeitpunkt. Ein Klang bzw. ein Audio-Gesamtsignal ergibt sich nicht aus einer periodischen Funktion. Es weist für jeden Zeitpunkt eine andere mathematische Funktion auf. Darum ist für die Faltung dieser relativ hohe Rechenaufwand nötig, bei dem jeder Zeitpunkt (bzw. jedes Sample) des einen Signals mit jedem Sample des anderen Signals verrechnet werden muss.

Bild:Convolution Cross Multiplication.jpg
Jeder Zeitpunkt des einen Signals wird mit jedem Zeitpunkt des anderen Signals verrechnet und das Ergebnis per IFFT wieder in den Ortsraum übertragen

Rendering und Datenreduktion

Die Faltungshall-Berechnung kann durch Echtzeitberechnung (Echtzeit-Effekt) stattfinden oder durch Rendering. Echtzeitberechnung bedeutet, das verhallte Signal wird während des Abspielens errechnet. Wegen der großen Rechenkapazität ergibt sich dabei immer eine bestimmte Zeitverzögerung (Latenz). Rendering bedeutet, das Hallsignal bzw. dessen Audiodatei wird offline berechnet. Das Abspielen ist dann latenzfrei möglich.

Wenn beispielsweise die Impulsantwort, also die Nachhallzeit, fünf Sekunden beträgt und das zu verhallende Signal (z. B. ein Instrument) eine Minute dauert, beträgt bei einer Abtastrate von 44,1 kHz die Anzahl an Faltungsoperationen für ein Stereosignal:

60 x 44.100 x 5 x 44.100 x 2 = 1.166.886.000.000

Das sind über eine Billion Verrechnungen zweier Frequenzspektren für eine Minute Stereo eines verhallten Signals.

Bei den heutigen Rechenleistungen kann Faltungshall bei der Echtzeitberechnung immer nur genähert werden. Sonst wäre die Latenz unakzeptabel lang. Selbst das Rendering erfolgt heute wegen der großen Rechenkapazitäten nur in Annäherung. Die bisher genaueste Simulation bietet die MIR-Anwendung der Vienna Symphonic Library. Dabei werden Instrumente eines Orchesters je einzeln verhallt. Die individuelle Abstrahlcharakteristik jedes einzelnen Instrumentes findet dabei Berücksichtigung.

Siehe auch

Faltung | Fouriertransformation | Impulsantwort | Frequenzspektrum | Harmonische | Nachhall | Signalprozessor |

Literatur

Weblinks

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Faltungshall, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge
Andere Sprachen