Statistische Fehler

Aus Imperia Support Wiki

Jedes statistische Tool im Internet weist Zählfehler auf. Folgende Fehlerfälle sind bekannt und sollten bei der Bewertung von Statistiken berücksichtigt werden:

Zählunterschiede bei Seitenaufrufen

Beispiel für das verspätete Laden eines Zählpixels (hier nach 2 Sekunden)

Bei der Verwendung von mehreren Skripten zum Zählen von Seitenaufrufen können überraschenderweise bei einer gleichen Anzahl von Seitenaufrufen in den einzelnen Statistiktools z.T. größere Zählunterschiede auftreten. Dies kann in den folgenden Ursachen begründet liegen:

  • Der Browser des Nutzers hat das Laden der Seite vor dem Laden des Zählskriptes abgebrochen (z.B. weil der Nutzer "Stop" gedrückt hat, oder ein Fehler auf der Seite auftrat)
  • Das Zählskript war nicht verfügbar (z.B. weil der Server sehr beschäftigt war und zu lange zum Antworten braucht, die Verbindung zum Server gestört ist, etc.)
  • Das Zählskript hat den Seitenaufruf nicht gezählt (z.B. weil das Zählskript den Aufruf einem Suchmaschinen-Bot zurechnet oder für einen nicht-zählwürdigen Aufruf hält, siehe "Unterscheidung von Nutzer und Bots")

Dies wird durch weitere Faktoren beeinflusst:

  • Zählskript steht zu weit unten in der aufrufenden Seite
  • Zählskript hat eine andere Domain als die aufgerufene Seite (die DNS-Auflösung braucht Zeit im Browser des Aufrufers)
  • Zählskript funktioniert nur bei aktivierten Javascript
  • Zählskript funktioniert nur bei eingeschalteten Cookies
  • Zählskripte werden durch Ad-Blocker blockiert

Ggf. können aber auch die Klickraten höher liegen als die tatsächliche Klickrate:

  • Bestimmte Browser können durch sog. Pre-Caching Seiten aufrufen (bzw. Links anklicken), die der Nutzer noch gar nicht angefordert hat.
  • Bestimmte technische Umstände können Anfragen mehrfach abschicken.

Diese Faktoren lassen es zu, das z.T. bis zu 10% Zählunterschiede auftreten, im Extremfall weit mehr.

Zählunterschiede bei Tracking-Links

Statistische Fehler.png

Bei der Verwendung von mehreren Tracking-Links hintereinander gilt die obige Fehlerkette, wobei die Fehler sich mit jedem Zwischenschritt multiplizieren.

Nach dem Klicken durch den Nutzer wird dabei zuerst das erste Zählskript aufgerufen, dass nach den o.a. Faktoren immer weniger oder gleich 100% der Klicks zählt.

Nach dem Zählen des Klicks wird eine Weiterleitung an den aufrufenden Browser ausgegeben. Hier kann durch die Weiterleitung als solche auch noch ein Verlust auftreten, so dass auch hier weniger oder gleich 100% der Anfragen weitergeleitet werden.

Nun folgt ein zweites Zählsystem, das wie das erste Zählsystem ebenfalls nur weniger oder gleich 100% der Klicks zählt, eine weitere Weiterleitung auslöst (die ebenfalls weniger oder gleich 100% der Browser ausführen), und dann schließlich auf die eigentliche Zielseite weiterleitet.

Bei einer angenommenen Fehlerquote von 2% pro Zwischenschritt bedeutet dies:

98% * 98% * 98% * 98% = 92% Gesamt-Erfolgsquote

Bei einem Totalausfall eines Zwischensystems bedeutet dies:

100% * 100% * 0% * 100% = 0% Gesamt-Erfolgsquote

Verfügbarkeit von Systemen

Belastung Server.png

Die punktuelle Verfügbarkeit eines Zählsystems hängt von seiner Belastung ab. Im Tagesverlauf steigt dabei i.d.R. die Belastung zur Mittagszeit stark an und flacht im Tagesverlauf dann wieder ab. Dies führt in Spitzenzeiten ggf. zu einer Verlangsamung der Skriptausführung.

Dies kann bedeuten, dass gerade zu Zeitpunkten, in denen viele Seitenaufrufe und Klicks produziert werden, die zählenden Systeme wegen der vielen Aufrufe nicht dazu kommen, diese Aufrufe zu zählen.