Unterscheidung von Nutzer und Bots

Aus Imperia Support Wiki

Im Internet ist die Unterscheidung zwischen "echten" Benutzern (d.h. Menschen, die mit einem Browser über eine Internetseite surfen) und automatisierten Skripten schwierig, und verlässt sich auf einige technische Parameter.

Der am Häufigsten verwendete Parameter ist der sog. Useragent-String. Dies ist eine von dem jeweiligen Besucher freiwillig übermittelte Angabe, die das zum Surfen verwendete Programm beschreibt. Diese Angabe ist in der Regel korrekt, und wird gerade von Suchmaschinen explizit verwendet, um Anfragen von Suchmaschinen von regulären Nutzern unterscheiden zu können.

Tatsächlich kann diese Angabe aber frei gesetzt werden. So ist es ohne großen Aufwand möglich, bei Browsern diese Kennung zu verändern, und sich so als ein anderer Useragent auszugeben (siehe z.B. https://addons.mozilla.org/en-US/firefox/addon/user-agent-switcher/). Auch bei der Programmierung von Bots oder automatischen Programmen zum Absuchen von Internetseiten ist die Manipulation dieser Kennung ohne nennenswerten Aufwand möglich.

Eine weitere Unterscheidung besteht deswegen zumeist darin, Sekundärbedingungen abzutesten, die in der Regel nur von Browsern erfüllt werden. So kann z.B. durch ein Zählpixel oder die Verwendung von Javascript der Nachweis verbessert werden, ob ein "echter" Nutzer oder ein Bot die Aufrufe erzeugt. Auch hier gilt aber festzuhalten, dass dieser Aufruf ebenfalls durch ein Programm nachgebildet werden kann. Denn im Endeffekt ist ein Browser auch nur ein Programm, dass sich genau so gut automatisiert ausführen kann.

Zuletzt kann eine Analyse der IP-Adresse noch Rückschlüsse auf einen automatisierten oder "echten" Nutzer geben. Auch diese Analyse kann aber ggf. durch Proxies (mehrere Nutzer sind im Internet unter einer identischen IP vertreten) oder Skripte (wechselnde IP-Adressen durch eine automatisierte Trennung und Neuverbindung mit dem Provider bei gleichzeitiger Neuzuteilung einer IP-Adresse aus dem Provider-Pool) umgehbar.

Fazit: Ein 100% verlässlicher Nachweis, ob ein Aufruf von einem "echten" Nutzer oder einem Bot hervorgerufen wurde, ist niemals zu 100% möglich, da in beiden Fällen letztendlich ein Programm den Aufruf erzeugt.

Siehe auch "Statistische Fehler".