Forum Webscript.Ru
Программирование => PHP => Тема начата: Perlita от 11 Октября 2002, 09:44:47
-
Подскажите плиз как поступить...
Скрпит обрабатывает файл со статистикой посещения сайта
Файл представляет собой строки вида:
....
10/07/02|64.68.82.71|/news/27052002.php|Unknown|
....
Можно ли в статистике не учитывать посещения поисковых роботов, т.е. как-то различать посещения броузера пользователя от посещений поисковых роботов.
-
Отлавливай заходящего через $HTTP_SERVER_VARS["HTTP_USER_AGENT"] Список всех пауков в инете есть. Ссылку не помню - дома лежит. :(
Можно воспользоваться get_browser() для человеческого представления записи User_Agent, но думаю, тебе это не надо.
-
Спасибо... суть понял. А по-другому никак, через куки каки-нибудь?
-
Perlita
:):):):):):):)
Ну какие у робота куки.
Сам подумай...
-
Нуу да... :) я и подумал, что на этом сыграть можно. Т.е. так и идентифицировать робота
-
Не ужели роботы так часто по сайту ходят? Если это так то можно как-то узнать сколько процентов хитов приходится на роботов?
-
Googlebot ходит каждый день, хитов получается когда как, когда 10%, когда и больше -) настоящее нашествие роботов
-
Роботы часто ходят.
И я ндекс и гугля и другие.
Я, по началу, отлавливал по отсутствию загрузки картинок.
Но получается не очень верная картина - лучше уж все-таки, по сигнатурам.
-
Perlita
http://www.searchengines.ru/stories.php?story=02/03/03/9055683
Правда не все
-
Perlita я чем тебя $HTTP_SERVER_VARS["HTTP_USER_AGENT"] не устраивает?
-
спасибо за урль.
Tronyx просто думал, что есть более простой способ, чем проверка $HTTP_SERVER_VARS["HTTP_USER_AGENT"] со значениями из массива
-
Ага, специальный заголовок в НТТР - "Я робот!".
-
Tronyx просто думал, что есть более простой способ, чем проверка $HTTP_SERVER_VARS["HTTP_USER_AGENT"] со значениями из массива
Проще некуда.
-
http://www.robotstxt.org/wc/active/html/index.html - список 284 роботов