Das Kefk Network Wiki befindet sich im Testbetrieb.
Web Analytics
Aus Kefk.
Mit Web Analytics (auch u.a. Web Controlling, Web Analyse, Traffic Analyse, Clickstream Analyse) bezeichnet man die Sammlung und Auswertung des Verhaltens von Besuchern auf Websites. Typischerweise wird untersucht, woher die Besucher kommen, welche Bereiche aufgesucht, wie oft welche Seiten gesehen werden. Für professionell betriebene Websites wird diese Analyse vor allem zur Optimierung der Website und zur besseren Erreichung von Zielen der Website (z.B. Häufigkeit von Besuchen, Vermehrung von Seitenaufrufen, Bestellungen, Newsletter-Abonnements) eingesetzt.
Wie oft bei neuen Verfahren gibt es auch im Bereich Web Analytics eine gewisse Unklarheit und Uneinigkeit hinsichtlich der Begriffe und Bedeutungen (s. Terminologie). Für Diskussionen sorgt auch immer wieder die Frage, welches Verfahren zur Datensammlung das beste im Einzelfall oder allgemein ist (s. Verfahren). Grundlegend kann bei Web Analytics zwischen Auswertungsverfahren zur permanenten Messung der Site-Effektivität und Methoden zur Auffindung von Schwachpunkten in der Site und Verbesserungsmöglichkeiten unterschieden werden (s. Methoden). Weltweit bieten etwa 150 Unternehmen professionelle Lösungen für Web Analytics an. Die Produkte können teilweise unternehmensintern installiert werden oder auch als ASP-Angebot mit (meist) monatlichen Nutzungsgebühren ohne wesentliche unternehmensinterne Hard- oder Software-Aufwände genutzt werden (s. Lösungsübersichten).
Inhaltsverzeichnis |
Terminologie
Während sich weltweit der Begriff Web Analytics durchgesetzt hat, wird in Deutschland oft der Begriff 'Web Controlling' synonym verwendet. Der ältere Begriff 'Logfile-Analyse' teilt mit Web Analytics eine Schnittmenge (Analyse von Web Server Protokolldateien), allerdings kann mit Logfile-Analyse auch die Analyse anderer Protokoll-Dateien gemeint sein. Wie 'Web Controlling' hat sich in Deutschland auch der Begriff 'Page Impression' (PI) abweichend vom international genutzten 'Page View' (PV) durchgesetzt. Gemeint ist in jedem Fall der Abruf einer Seite eines Internetangebotes durch einen menschlichen Besucher (keine Crawler, Spider etc.). Mehrere einzelne Seitenabrufe werden zu einer Session zusammengefasst (Visit, Besuch). Ein Besucher (Visitor) kann eine Websites in mehreren Sessions besuchen.
Verfahren zur Datensammlung
Gewöhnlich werden für Web Analytics entweder die Logfiles der Web Server ausgewertet oder bestimmte Tags in Websites zur Datengewinnung genutzt. Neben diesen beiden existieren noch einige exotischere Verfahren und Mischformen.
Server-basierte Daten: Logfile-Analyse
Die Software zum Betrieb von Websites, ein sogenannter Webserver wie Apache oder MSII, produziert gewöhnlich einen fortlaufendes Protokoll aller Aktivitäten der Software. Diente dies zunächst vor allem zur Aufzeichnung und Behebung von Fehlern im Betrieb, entdeckte man schnell die Möglichkeit, mithilfe dieser Logfiles Ergebnisse zur Beliebtheit der Website, zur Häufigkeit von Seitenabrufen, zur Aktivität der Website-Besucher zu sammeln. Da diese Protokolle direkt von der eigenen Software angelegt werden, zeigen sie ein getreues Abbild der Server-Aktivitäten. Zur Auswertung der Protokolle - pure Text-Dateien, die zeilenweise Aktivitäten der Software wiedergeben – wird gewöhnlich eine Software genutzt, die Statistiken erstellt, Daten zuordnet und in Grafiken und Tabellen anschaulich macht.
Client-basierte Daten: Tags & Pixel
Seit etwa 1996 gibt es ein weiteres, einfaches Verfahren zur Datensammlung: Direkt in den Quell-Code der Website selbst werden unsichtbare Minibilder (1-Pixel-Grafik) integriert. Ein Abruf dieser Grafik kann jetzt für genau einen Seitenabruf stehen. Die Pixel-Datei muss sich dabei nicht auf dem gleichen Server wie die eigentlichen Inhalte der Website befinden. So können ASP-Dienstleister die Sammlung, Speicherung und Auswertung der Daten übernehmen. Neben den noch immer genutzten 1-Pixel-Bildern wird heute von fast allen Lösungen zusätzlich Javascript-Code zur Datenerhebung eingesetzt. Diese 'Javascript-Tags' werden ebenso in den Quellcode der Seite integriert, können aber zusätzliche Informationen über den abrufenden Client (gewöhnlich der Browser) sammeln – z.B. grafische Auflösung des genutzten Monitors, im Browser installierte Plugins etc.
weitere Verfahren
Für die Netzwerk-Protokoll-Analyse (NPA, Network Sniffer) wird ein spezieller Decoder zwischen die eigenen Webserver und der Verbindung zum Internet eingesetzt. Dieser sammelt nun den gesamten Datenverkehr in diesem Netzwerk. Beim URL-Rewritung wird ein Proxie zwischen Webserver und Internet installiert, der in speziellen Logfiles die Traffic-Daten speichert und dabei gleichzeitig zusätzliche Informationen (Session-IDs) in die URL schreibt. Sogenannte Hybrid-Verfahren verarbeiten mehr als eine Datenquelle gleichzeitig. Besonders die integrierte Auswertung von Tag-Daten und Server-Daten stellt eine besonders reichhaltige und zuverlässige, aber auch aufwändige Art der Traffic-Analyse dar.
Cookies
Um einen einzelnen Seitenaufruf einer Session und eine Session einem eventuell wiederkehrenden Besucher zuordnen zu können, werden gewöhnlich Cookies eingesetzt. Es gibt heftige Debatten um dieses Thema, hier sei etwa auf folgende Seite (HTTP-Cookie) verwiesen. Festzuhalten bleibt, dass für eine professionelle Traffic-Analyse, die in das Zentrum ihrer Aufmerksamkeit den 'Besucher' (nicht die einzelne Session) stellt, Cookies gegenwärtig unabdingbar sind. Alternative Methoden mit Flash-Objects scheinen nur eine Nischenexistenz zu führen.
Tag vs. Logfile - Vor- und Nachteile
Traffic-Analysen haben mit starken Verzerrungen im Datenbestand zu kämpfen. Keine Art der Analyse kann für sich beanspruchen, den tatsächlichen Datenverkehr einer Website wahrheitsgetreu abzubilden.
| server-basiert | client-basiert |
|---|---|
| Seitenabrufe, die aus Proxies, Zwischenspeichern o.ä. bedient werden, können vom Server nicht registriert werden | Verzerrungen durch Zwischenspeicher können vermieden werden |
| die gewöhnliche Weise der Session-Zuordnung (gleiche IP-Adresse für max. 30 Min.) ist hochgradig fehleranfällig | durch Nutzung von Cookies kann die Session- und Besucher-Zuordnung bis auf ein für die weitere Verarbeitung akzeptables Maß gesteigert werden |
| die gewöhnliche Weise der Besucher-Zuordnung (IP-Adresse, ggf. + UserAgent) ist in keiner Hinsicht verlässlich | Besucher, die Javascript und/oder Bilder in ihrem Browser blockieren, werden nicht erkannt |
| Daten sind und bleiben im Unternehmen selbst | Cookie-Blockaden und Löschraten sorgen für Unsicherheiten |
| das Datenformat ist offen, Daten können von verschiedenen Analyse-Tools ausgewertet werden | das Datenformat ist propritär, d.h. daten können bei einem Wechsel kaum von Anbieter A zu Anbieter B mitgenommen werden |
| sämtliche Spider, Bots uä. werden in den Logfiles registriert | Spider und Bots werden nur teilweise registriert – das verschlankt die anfallende Datenmenge, ist aber für Suchmaschinenoptimierungen ein Hindernis |
| die Fehlermeldungen der Server werden unmittelbar registriert | nicht alle Fehlermeldungen werden erkannt |
| durch Javascript können reichere Daten über Clients gesammelt werden | |
| verschiedene Standorte, Server-Cluster, Domains und Subdomains o.ä. stellen kein wesentliches Problem dar |
Zusammenfassend lässt sich feststellen, dass das client-seitige Verfahren in Kombination mit 1-Party-Cookies heute das gebräuchlichste und – pragmatisch gesehen – das beste ist. Die Datenqualität ist stark genug, um auf dieser Grundlage belastbare Entscheidungen treffen zu können. Die Kosten für ein gleichwertig zuverlässiges System auf Basis von Logfiles (+ Cookies) liegen im allgemeinen deutlich höher und kommen am ehesten dort in Frage, wo eine erhebliche Sensibilität der Daten vorliegt.
Methoden Web Analytics
Allgemein lassen sich zwei Anwendungsbereiche von Web Analytics unterscheiden:
1.regelmässiges Monitoring der Effektivität der Website und dazugehörige Kampagnen
Durch die Definition von Kennziffern (z.B. Kosten, Umsatz, Konversionsrate, PageViews pro Session, Sessions pro Besucher) lassen sich die einzelnen Daten der Analysen zu sinnvollen Informationen verdichten und in einen Kontext der Vergleichbarkeit setzen: Verlauf des Umsatzes über das Jahr, Kosten pro Kampagne, Konversionsrate im Vergleich zu einem gesetzten Ziel etc
2.Strategien zur Optimierung der Website
- Pfad-Analysen helfen bei der Suche nach besonders beliebten und unbeliebten Seiten in einer Website
- Segmentierungen helfen beim Auffinden und weiteren Unterscheiden von bestimmten Besuchergruppen (z.B. Besucher von Suchmaschine A im Vergleich zu Besuchern von Suchmaschine B)
- Konversionspfade (Funnel) helfen bei der Messung und Optimierung von definierten, wichtigen Seitenabfolgen in der Website
- Optimierungen von Startseiten oder Landing Pages durch schnelles Ausprobieren von kleinen Verbesserungen und Veränderungen (A/B-Tests)
Datenschutz und Vertrauenswürdigkeit
Professionelle Anbieter erfüllen alle Anforderungen des Datenschutzs. Bei amerikanischen Untnernehmen, die in Deutschland agieren, sollte dies jedoch im Vorfeld geklärt werden, da dort der Datenschutz nicht in einem so sicheren Umfang wie in Deutschland bzw. Europa geregelt ist.
Weblinks
Literatur
- Web Analytics Demystified, Eric T. Peterson, 2004 (englisch)
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Web_Analytics, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
