Bot Logger - Website X5 Hilfe - Die Helpsite

Direkt zum Seiteninhalt

Hauptmenü:

Bot Logger

Scripte > Protection

Zugriff von Bot-Spidern erfassen

Mit diesem Skript wird automatisch in der Datei botlog.txt festgehalten, wenn wie im Beispiel ein Spider Google-Bot, Baidu-Bot oder Bing-Bot auf Deiner Homepage vorbeigeschaut hat.

In einem Unterverzeichnis befinden sich die Dateien "botlog.php, botlog.txt, botview.php (botview.php~)". Die Datei "botlog.php" enthält den eigentlichen Code der die Daten des Spiders ausliest, in der Datei "botlog.txt" werden die Daten gespeichert und mit der Datei "botview.php" kann die Text-Datei angesehen und/oder bearbeitet werden.

ZIP-Datei entpacken und Verzeichnis "wsX5Obj" auf den Webserver ins Root-Verzeichnis kopieren.
Wichtig:
Die  aufrufende Datei muss die Dateiendung .php aufweisen.
Beim Einfügen des  HTML-Codes in den Body-Bereich der Seite sollte beachtet werden, dass  beim Einfügen der zweiten Zeile des Codes (der Button), auch Nutzer Einsicht in die Log-Daten haben. Will man das vermeiden, empfielt sich die zweite Button-Code-Zeile in einem geschützten Bereich einzufügen.

x runter geladen


(Die "Text speichern" -Button sind hier in der Demo inaktiv)
Code für den <BODY> Bereich
<!-- Dieser Code registriert die Besucherdaten -->
<?php include("wsX5Obj/Obj94_0/botlog.php"); ?>
<!-- Diesen Code ggf. auf geschützter Seite einfügen -->
<input type=button value="Bot-Log Editor"
onClick="location='wsX5Obj/Obj94_0/botview.php'; return false;">

oder neues Fenster:
<!-- Dieser Code registriert die Besucherdaten -->
<?php include("wsX5Obj/Obj94_0/botlog.php"); ?>
<!-- Diesen Code ggf. auf geschützter Seite einfügen -->
<input type="button" value="Bot-Log Editor"
onclick="window.open('wsX5Obj/Obj94_0/botview.php', 'einNeuesFenster');" />
Code "botlog.php"
<?php
$host = gethostbyaddr($_SERVER['REMOTE_ADDR']);
$domain = explode(".", $host); $domain_array = count($domain)-2;
// Google-Bot-Check
if ($domain["$domain_array"] == "googlebot"){
$msg = "Google-Bot: " . date("d.m.Y H:i") . " | ";
$msg .= "IP-Adresse: " . $_SERVER['REMOTE_ADDR'] . " | ";
$msg .= "Hostname: " . gethostbyaddr($_SERVER['REMOTE_ADDR']) . "\n";
$Dateiname = "wsX5Obj/Obj94_0/botlog.txt";
$Datei = fOpen($Dateiname,"a+");
fPuts($Datei,$msg);
fClose($Datei);
}
// Baidu-Bot-Check
if ($domain["$domain_array"] == "baidu"){
$msg = "BAIDU-Bot: " . date("d.m.Y H:i") . " | ";
$msg .= "IP-Adresse: " . $_SERVER['REMOTE_ADDR'] . " | ";
$msg .= "Hostname: " . gethostbyaddr($_SERVER['REMOTE_ADDR']) . "\n";
$Dateiname = "wsX5Obj/Obj94_0/botlog.txt";
$Datei = fOpen($Dateiname,"a+");
fPuts($Datei,$msg);
fClose($Datei);
}
// Bing-Bot-Check
if ($domain["$domain_array"] == "bingbot"){
$msg = "MSN-Bot: " . date("d.m.Y H:i") . " | ";
$msg .= "IP-Adresse: " . $_SERVER['REMOTE_ADDR'] . " | ";
$msg .= "Hostname: " . gethostbyaddr($_SERVER['REMOTE_ADDR']) . "\n";
$Dateiname = "wsX5Obj/Obj94_0/botlog.txt";
$Datei = fOpen($Dateiname,"a+");
fPuts($Datei,$msg);
fClose($Datei);
}
?>
Das Skript kann natürlich den eigenen Bedürfnissen je nach Informatiosbedarf angepasst und auch erweitert werden.
Dazu muss das Skript mit dem entsprechenden Bot nur ergänzt werden. Natürlich kann man auch mehrere Abfragen getrennt nach Bots einbauen.
MSN zum Beispiel gibt dazu einige Auskünfte:
(Es gibt mehrere Crawler für unterschiedliche Inhalte)
MSNBot – erfasst textbasierte Inhalte für Live.com
MSNBot-Media –  Bilder und alle anderen Mediendateien für  images.live.com.
MSNBot-NewsBlogs – erfasst Nachrichten und Blogs. search.live.com/news
MSNBot-Products   – Produkte & Shopping products.live.com
MSNBot-Academic  – Akademische Suche academic.live.com
Feedbacks zu ""

es gibt insgesamt 0 Kommentar(e)



Name*
Vorname
Kommentar*
Email *
Homepage
Telefon
Sicherheitscode *
 
Logo HTML5
Button Spenden

© 2009 - 2017




  Besucher Statistik
 » 2 Online
 » 3 Heute
 » 1053 Woche
 » 3754 Monat
 » 61269 Jahr
 » 237569 Gesamt
Rekord: 1420 (10.04.2014)
Zurück zum Seiteninhalt | Zurück zum Hauptmenü