Das Kefk Network Wiki befindet sich im Testbetrieb.


Gabor-Transformation

Aus Kefk.

Wechseln zu: Navigation, Suche

Die Gabor-Transformation (nach Dennis Gábor) ist eine spezielle (und in bestimmter Weise optimale) gefensterte Fourier-Transformation. Sie ist eng verwandt mit der Wavelet-Theorie und wird in vielen Bereichen der digitalen Bildverarbeitung eingesetzt.

Jede lokale Veränderung des Signals f bewirkt eine Änderung der Fourier-Transformation (FT) über der gesamten Frequenzachse. So überdeckt zum Beispiel der Graph der FT der Delta-Distribution (Dirac-Funktion) den gesamten Frequenzbereich. Die FT enthält daher keine lokalen Informationen des Signals f. Dies bedeutet andererseits, dass die Information des Frequenzspektrums den Ortsbereich, in dem die Frequenz auftritt, nicht unmittelbar angibt. Eine Möglichkeit der Lokalisierung der FT im Ortsraum ist die Fensterfouriertransformation (WFT), die den lokalen Frequenzinhalt in einem Fenster g um den Punkt τ beschreibt. Dabei wird für g üblicherweise eine schnell auf 0 abfallende Funktion gewählt, damit sie als Fenster wirkt.


F^{Fen}(\omega, \tau)  =  \int\limits_{-\infty}^{+\infty} f(t) g (t-\tau)e^{-i\omega t}dt

Die Fensterfouriertransformation ist somit von zwei Parametern abhängig, der Frequenz ω und dem Zentrum der Lokalisierung τ. Man spricht deshalb auch von einer Darstellung im Orts-/Frequenzraum. Die Fensterfouriertransformation wird auch als short-time Fourier transform (STFT) bezeichnet

Die WFT mit einer Gaußfunktion gα(t) als Fensterfunktion wurde von Dennis Gábor 1946 verwendet:


g_\alpha(t) = \frac{1}{2\sqrt{\pi\alpha}}e^{-\frac{t^2}{4\alpha}}


Diese spezielle WFT heißt Gabor-Transformation. Bezeichnet man das Ergebnis der Gabortransformation von f mit Gf so ergibt wegen der Symmetrie von gα


G_f(\omega,\tau)= \int\limits_{-\infty}^{+\infty}
f(t)g_\alpha(t-\tau)e^{-i\omega t}dt


=e^{-i\omega \tau}\int\limits_{-\infty}^{+\infty}f(t)g_\alpha(\tau-t)e^{i\omega (\tau-t)}dt

Parser-Fehler (Unbekannter Fehler\ast): =e^{-i\omega \tau}(f(\tau) \ast (g_\alpha(\tau)e^{i\omega \tau}))


Parser-Fehler (Unbekannter Fehler\ast): =e^{-i\omega \tau}(f(\tau)\ast h(\tau))


Im Ortsraum stellt die Gaborfilterung daher bis auf den Faktor eiωτ eine Faltung dar. Dieser Faktor bewirkt jedoch lediglich eine Phasenverschiebung und kann daher bei Anwendungen, die nur die Amplitude des Ergebnisses berücksichtigen, vernachlässigt werden.

Da die Fouriertransformation einer Gaußfunktion wieder eine Gaußfunktion ergibt, stellt das Ergebnis der Gabortransformation sowohl im Orts- als auch im Frequenzraum lokale Information dar. Der Filter kann jede beliebige elliptische Region des Frequenz- oder des Ortsraums überdecken. Ferner erzielt die Gabortransformation – unabhängig von der Anordnung – maximale gleichzeitige Auflösung im Orts- und Frequenzraum, das heißt die Gaußfunktion erreicht als (einzige) Fensterfunktion das Minimum der Unschärferelation \sigma_g^2 \cdot \sigma_G^2 \geq \frac{\pi}{2}, wobei \sigma_g^2 die Varianz der Fensterfunktion im Ortsraum (Ortsunschärfe) und \sigma_G^2 entsprechend die im Frequenzraum (Frequenzunschärfe) angibt. Daraus ergibt sich direkt der reziproke Zusammenhang zwischen den Unschärfen und damit ein wichtiger trade-off. Das heißt um die Auflösung im Ortsraum zu verdoppeln, muss eine halbierte Auflösung im Frequenzraum in Kauf genommen werden, und umgekehrt.

Filter mit geringer Bandbreite im Frequenzraum sind erwünscht, da sie eine feine Unterscheidung zwischen verschiedenen Texturen erlauben. Andererseits sind für eine genaue Erkennung von Texturgrenzen Filter nötig, die im Ortsraum eine geringe Bandbreite aufweisen.

Eine weitere interessante Eigenschaft von Gaborfiltern ist, dass sie eine gute Annäherung an die Empfindlichkeitsprofile von Neuronen im visuellen Kortex zu sein scheinen, in der Art, dass sie frequenz- und richtungsspezifische Signale verarbeiten.

Siehe auch

Persönliche Werkzeuge