Statistische Fehler: Unterschied zwischen den Versionen

Aus Imperia Support Wiki
K (Zählunterschiede bei Tracking-Links)
K (Zählunterschiede bei Seitenaufrufen)
Zeile 3: Zeile 3:
 
=== Zählunterschiede bei Seitenaufrufen ===
 
=== Zählunterschiede bei Seitenaufrufen ===
  
Bei der Verwendung von mehreren Skripten zum Zählen von Seitenaufrufen können überraschenderweise bei einer gleichen Anzahl von Seitenaufrufen in den einzelnen Statistiktool z.T. größere Zählunterschiede auftreten. Dies kann in den folgenden Ursachen begründet liegen:
+
Bei der Verwendung von mehreren Skripten zum Zählen von Seitenaufrufen können überraschenderweise bei einer gleichen Anzahl von Seitenaufrufen in den einzelnen Statistiktools z.T. größere Zählunterschiede auftreten. Dies kann in den folgenden Ursachen begründet liegen:
  
 
* Der Browser des Nutzers hat das Laden der Seite vor dem Laden des Zählskriptes abgebrochen (z.B. weil der Nutzer "Stop" gedrückt hat, oder ein Fehler auf der Seite auftrat)
 
* Der Browser des Nutzers hat das Laden der Seite vor dem Laden des Zählskriptes abgebrochen (z.B. weil der Nutzer "Stop" gedrückt hat, oder ein Fehler auf der Seite auftrat)

Version vom 28. September 2010, 11:03 Uhr

Jedes statistische Tool im Internet weist Zählfehler auf. Folgende Fehlerfälle sind bekannt und sollten bei der Bewertung von Statistiken berücksichtigt werden:

Zählunterschiede bei Seitenaufrufen

Bei der Verwendung von mehreren Skripten zum Zählen von Seitenaufrufen können überraschenderweise bei einer gleichen Anzahl von Seitenaufrufen in den einzelnen Statistiktools z.T. größere Zählunterschiede auftreten. Dies kann in den folgenden Ursachen begründet liegen:

  • Der Browser des Nutzers hat das Laden der Seite vor dem Laden des Zählskriptes abgebrochen (z.B. weil der Nutzer "Stop" gedrückt hat, oder ein Fehler auf der Seite auftrat)
  • Das Zählskript war nicht verfügbar (z.B. weil der Server sehr beschäftigt war und zu lange zum Antworten braucht, die Verbindung zum Server gestört ist, etc.)
  • Das Zählskript hat den Seitenaufruf nicht gezählt (z.B. weil das Zählskript den Aufruf einem Suchmaschinen-Bot zurechnet oder für einen nicht-zählwürdigen Aufruf hält)

Dies wird durch weitere Faktoren beeinflusst:

  • Zählskript steht zu weit unten in der aufrufenden Seite
  • Zählskript hat eine andere Domain als die aufgerufene Seite (die DNS-Auflösung braucht Zeit im Browser des Aufrufers)
  • Zählskript funktioniert nur bei aktivierten Javascript

Diese Faktoren lassen es zu, das z.T. bis zu 10% Zählunterschiede auftreten, im Extremfall weit mehr.

Zählunterschiede bei Tracking-Links

Statistische Fehler.png

Bei der Verwendung von mehreren Tracking-Links hintereinander gilt die obige Fehlerkette, wobei die Fehler sich mit jedem Zwischenschritt multiplizieren.

Nach dem Klicken durch den Nutzer wird dabei zuerst das erste Zählskript aufgerufen, dass nach den o.a. Faktoren immer weniger oder gleich 100% der Klicks zählt.

Nach dem Zählen des Klicks wird eine Weiterleitung an den aufrufenden Browser ausgegeben. Hier kann durch die Weiterleitung als solche auch noch ein Verlust auftreten, so dass auch hier weniger oder gleich 100% der Anfragen weitergeleitet werden.

Nun folgt ein zweites Zählsystem, das wie das erste Zählsystem ebenfalls nur weniger oder gleich 100% der Klicks zählt, eine weitere Weiterleitung auslöst (die ebenfalls weniger oder gleich 100% der Browser ausführen), und dann schließlich auf die eigentliche Zielseite weiterleitet.

Bei einer angenommenen Fehlerquote von 2% pro Zwischenschritt bedeutet dies:

98% * 98% * 98% * 98% = 92% Gesamt-Erfolgsquote

Bei einem Totalausfall eines Zwischensystems bedeutet dies:

100% * 100% * 0% * 100% = 0% Gesamt-Erfolgsquote

Verfügbarkeit von Systemen

Belastung Server.png

Die punktuelle Verfügbarkeit eines Zählsystems hängt von seiner Belastung ab. Im Tagesverlauf steigt dabei i.d.R. die Belastung zur Mittagszeit stark an und flacht im Tagesverlauf dann wieder ab. Dies führt in Spitzenzeiten ggf. zu einer Verlangsamung der Skriptausführung.

Dies kann bedeuten, dass gerade zu Zeitpunkten, in denen viele Seitenaufrufe und Klicks produziert werden, die zählenden Systeme wegen der vielen Aufrufe nicht dazu kommen, diese Aufrufe zu zählen.