Das Kefk Network Wiki befindet sich im Testbetrieb.


Distanzfunktion

Aus Kefk.

Wechseln zu: Navigation, Suche

Distanzfunktionen und Ähnlichkeitsmaße beschreiben den Grad der Übereinstimmung von Vektoren.

In typischen Anwendungen stellen die Vektoren Folgen von Messwerten dar. Ähnlichkeitsmaße werden in Auswertemethoden wie dem Vektorraum-Retrieval und dem Clustering benutzt.

Als Distanzfunktion lassen sich verschiedene Metriken verwenden. Distanzfunktionen werden oft auch unpräzise als Metrik bezeichnet; nicht alle Distanzfunktionen sind jedoch Metriken im streng mathematischen Sinne.

Inhaltsverzeichnis

Häufig verwendete Distanzfunktionen

Lp-Distanz oder Minkowski-Metrik

L_p(x,y) = \sqrt[p]{\sum_{i=1}^n |x_i-y_i|^p}, \quad x,y \in \mathbb{R}^n

Die nachfolgenden Distanzfunktionen (City-Block-Distanz, Euklidische Distanz und Maximum-Distanz) stellen Spezialfälle der Lp-Distanz da

City-Block-, Taxi- bzw. Manhattan-Distanz

d(x,y) = L_1(x,y) = \sum_{i=1}^n |x_i-y_i|

Siehe auch: Normierter Raum Siehe auch: Manhattan-Metrik

Euklidischer Abstand

d(x,y) = L_2(x,y) = |x-y| = \sqrt{\sum_{i=1}^n (x_i-y_i)^2}

Maximum- bzw. Tschebyschow-Distanz

d(x,y) = \lim_{p \rightarrow \infty} L_p(x,y) = \max\{|x_i-y_i|,1 \le i \le n\}

Abstand zweier Mengen

Sei (X,d) ein Metrischer Raum.

Weiter seien A\subset X\ ,\ B\subset X Teilmengen.

Der Abstand zwischen A und B wird definiert als:

dist(A,B):=\inf\, \{d(x,y):\ x\in A\, ,\, y\in B\}

Bemerkung:

dist(\{a\},\{b\})=d(a,b)\

Mahalanobis-Distanz

Siehe dazu Hauptartikel Mahalanobis-Distanz.

Häufig verwendete Ähnlichkeitsmaße

Kosinus-Ähnlichkeitsmaß

Es wird ein Vektorraum über den reellen Zahlen vorausgesetzt.

Die Distanz ist der Kosinus des Winkels α(x,y) zwischen den Vektoren x und y.

d(x,y) = \cos \alpha (x,y) = \frac{x \cdot y}{|x| |y|} =
\frac {\sum_{i=1}^n x_i y_i}{\sqrt{\sum_{i=1}^n x_i^2} \sqrt{\sum_{i=1}^n y_i^2}}

Dabei bezeichnet |x| = \|x\|_2 die euklidsche Norm.

Dice-Ähnlichkeitsmaß

d(x,y) = 
\frac {2 x \cdot y}{ x^2 + y^2 } =
\frac {2 \sum_{i=1}^n x_i y_i}
      {\sum_{i=1}^n x_i^2 + \sum_{i=1}^n y_i^2}

Dabei ist x^2 = x \cdot x = \langle x, x \rangle.

Jaccard- (oder Tanimoto)-Ähnlichkeitsmaß

d(x,y) = 
\frac {x \cdot y}{ x^2 + y^2 - x \cdot y} =
\frac {\sum_{i=1}^n x_i y_i}
      {\sum_{i=1}^n x_i^2 + \sum_{i=1}^n y_i^2 - \sum_{i=1}^n x_i y_i}

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Distanzfunktion, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge