Eine der größten Seuchen derzeit ist Referrer Spam. Semalt und Co. sind für Webseiten zwar nicht gefährlich, aber nerven durch ihr ständiges Auftauchen in den Statistikmodulen von Google Analytics, Piwik usw.
Sowohl in Google Analytics als auch in der open source Alternative Piwik gibt es Möglichkeiten, den Referrer Spam aus den Anzeigen herauszufiltern. Ich zeige Euch hier, wie das in Piwik geht.
Wie man Referrer Spam mittels der .htacess Datei gleich ganz von der Webseite fernhalten kann, habe ich in diesem Artikel schon beschrieben. Leider werden diese Plagegeister auch raffinierter und passen sich den Abwehrstrategien an. Zumal eine anwachsende .htaccess vom Apache Webserver auch erst einmal eingelesen und interpretiert werden will. Das kostet auch wieder Ressourcen und da mittlerweile alle nur noch auf Pagespeed Optimierung schauen …
Vorweg: die Anregung habe ich wieder bei philiseo.de gefunden. Dort werden auch noch Lösungen für Google beschrieben.
Ihr müsst Euch nur die Datei global.ini.php aus dem config/ Verzeichnis der Piwikinstallation herunterladen. Sucht dort die Stelle mit dem folgenden Code:
; Comma separated list of known Referrer Spammers, ie. bot visits that set a fake Referrer field. ; All Visits with a Referrer URL host set to one of these will be excluded. ; If you find new spam entries in Referrers>Websites, please report them here: https://github.com/piwik/piwik/issues/5099 referrer_urls_spam = "semalt.com"
Wichtig ist hier die Zeile:
referrer_urls_spam = "semalt.com"
die die dort eingetragenen Referrer Spam Robots aus den Piwikstatistiken ausschließt. Mittlerweile sind dort eine ganze Reihe von Spambots aufgeführt. Ihr könnte dort nun einfach die Plagegeister hinzufügen, die auf Euren Webseiten zusätzlich auftauchen. Die Hosts werden einfach kommagetrennt dort hintereinander weg geschrieben. Dann die Datei wieder speichern und an den gleichen Ort hochgeladen. Die originale Datei überschreibt Ihr natürlich.
Solltet Ihr bei all-inkl. sein und die Piwikinstallation unter dem PHP-Nutzer laufen, dann klappt das mit dem Überschreiben der global.ini.php nicht. Dazu müsst Ihr vorher über die KAS -> Tools -> Besitzrechte Funktion das config-Verzeichnis von Piwik auf den FTP-Nutzer umstellen. Nachdem Ihr die Datei mit Eurer Version überschrieben habt, solltet Ihr das Verzeichnis wieder an den PHP-Benutzer übergeben. Und zwar jedes Mal rekursiv!
Update: Die Macher von Piwik pflegen jetzt eine öffentliche schwarze Liste von bekannten Referrer Spammern, die auf Github jedem zur Verfügung steht. Es handelt sich um eine einfache Textdatei, wobei in jeder Zeile ein Spammer eingetragen ist.
Hallo,
danke für die Anleitung!
Kann es aber sein, dass diese inzwischen veraltet ist? Die oben angegebenen Zeilen sind in der aktuellen global.ini.php (2.13.1) nicht mehr zu finden.
Vgl. dagegen folgenden Blog-Eintrag bei Piwik: Stopping Referrer Spam
Beste Grüße
David Stingl
Wie es aussieht, hat haben die Entwickler reagiert und die Funktionalität direkt in Piwik eingebaut (basierend auf der Blacklist, die ich als Update-Hinweis eingefügt habe). Wenn Piwik jetzt also aktuell gehalten wird, braucht man sich um den Referrer Spam wohl nicht mehr eigenhändig kümmern.
Ja, wie es aussieht, schon. Nur leider erscheint in meinen Statistiken immer noch munter Referrer-Spam von
100dollars-seo.com
trotz aktueller Piwik-Version …Außerdem gibt es leider keinerlei Eingriffsmöglichkeit wie manuelle Updates der Blacklist o. ä.
Da besteht noch etwas Handlungsbedarf seitens der Piwik-Macher.
Ja, dieses 100 Dollar Zeugs habe ich auch. Es gibt aber die Möglichkeit, diese öffentliche Blacklist zu erweitern, indem man ein neues issue eröffnet oder einen Pull request macht. Dazu müsste ich mich aber erstmal bei Github registrieren …
Und dann ist auch noch die Frage, wann diese Liste Eingang in die Piwik Installation findet.
Das Problem ist, dass diese 100-Dollar-Domain bereits ganz oben in der Liste drin steht … leider ohne Wirkung.