Автор Тема: Идентификация роботов  (Прочитано 4999 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Perlita

  • Завсегдатай
  • Новичок
  • *
  • Сообщений: 32
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Идентификация роботов
« : 11 Октября 2002, 09:44:47 »
Подскажите плиз как поступить...

Скрпит обрабатывает файл со статистикой посещения сайта
Файл представляет собой строки вида:
....
10/07/02|64.68.82.71|/news/27052002.php|Unknown|
....
Можно ли в статистике не учитывать посещения поисковых роботов, т.е. как-то различать посещения броузера пользователя от посещений поисковых роботов.

Оффлайн ThE0ReTiC

  • Главный по тарелочкам
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 4041
  • +2/-0
  • 2
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #1 : 11 Октября 2002, 10:40:27 »
Отлавливай заходящего через $HTTP_SERVER_VARS["HTTP_USER_AGENT"]  Список всех пауков в инете есть. Ссылку не помню - дома лежит. :(
Можно воспользоваться get_browser() для человеческого представления записи User_Agent, но думаю, тебе это не надо.
AS IS...

Оффлайн Perlita

  • Завсегдатай
  • Новичок
  • *
  • Сообщений: 32
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #2 : 11 Октября 2002, 10:50:46 »
Спасибо... суть понял. А по-другому никак, через куки каки-нибудь?

Оффлайн ThE0ReTiC

  • Главный по тарелочкам
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 4041
  • +2/-0
  • 2
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #3 : 11 Октября 2002, 11:02:01 »
Perlita
:):):):):):):)
Ну какие у робота куки.
Сам подумай...
AS IS...

Оффлайн Perlita

  • Завсегдатай
  • Новичок
  • *
  • Сообщений: 32
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #4 : 11 Октября 2002, 11:07:07 »
Нуу да...  :) я и  подумал, что на этом сыграть можно. Т.е. так и идентифицировать робота

Оффлайн rembo

  • Больной
  • Постоялец
  • ***
  • Сообщений: 219
  • +0/-0
  • 2
    • Просмотр профиля
    • http://www.v4.ru
Идентификация роботов
« Ответ #5 : 11 Октября 2002, 11:26:30 »
Не ужели роботы так часто по сайту ходят? Если это так то можно как-то узнать сколько процентов хитов приходится на роботов?
программист должен все сделать так, чтоб потом ничего не делать

Оффлайн Perlita

  • Завсегдатай
  • Новичок
  • *
  • Сообщений: 32
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #6 : 11 Октября 2002, 11:50:53 »
Googlebot ходит каждый день, хитов получается когда как, когда 10%, когда и больше -) настоящее нашествие роботов

Оффлайн Меняздесьдавнонет

  • новичЕк
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 5698
  • +0/-0
  • 2
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #7 : 11 Октября 2002, 12:24:31 »
Роботы часто ходят.
И я ндекс и гугля и другие.
Я, по началу, отлавливал по отсутствию загрузки картинок.
Но получается не очень верная картина - лучше уж все-таки, по сигнатурам.

Оффлайн ThE0ReTiC

  • Главный по тарелочкам
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 4041
  • +2/-0
  • 2
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #8 : 11 Октября 2002, 12:40:22 »
AS IS...

Оффлайн Tronyx

  • Модератор
  • Ветеран
  • *****
  • Сообщений: 826
  • +0/-0
  • 2
    • Просмотр профиля
Идентификация роботов
« Ответ #9 : 11 Октября 2002, 13:08:13 »
Perlita я чем тебя $HTTP_SERVER_VARS["HTTP_USER_AGENT"] не устраивает?
С уважением, Владимир Гончаренко - COPI# 93
Ролевая онлайн игра

Оффлайн Perlita

  • Завсегдатай
  • Новичок
  • *
  • Сообщений: 32
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #10 : 11 Октября 2002, 14:33:15 »
спасибо за урль.
Tronyx просто думал, что есть более простой способ, чем проверка $HTTP_SERVER_VARS["HTTP_USER_AGENT"] со значениями из массива

Оффлайн Меняздесьдавнонет

  • новичЕк
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 5698
  • +0/-0
  • 2
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #11 : 11 Октября 2002, 15:04:01 »
Ага, специальный заголовок в НТТР - "Я робот!".

Оффлайн Tronyx

  • Модератор
  • Ветеран
  • *****
  • Сообщений: 826
  • +0/-0
  • 2
    • Просмотр профиля
Идентификация роботов
« Ответ #12 : 11 Октября 2002, 15:08:05 »
Цитировать
Tronyx просто думал, что есть более простой способ, чем проверка $HTTP_SERVER_VARS["HTTP_USER_AGENT"] со значениями из массива

Проще некуда.
С уважением, Владимир Гончаренко - COPI# 93
Ролевая онлайн игра

Оффлайн Perlita

  • Завсегдатай
  • Новичок
  • *
  • Сообщений: 32
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Идентификация роботов
« Ответ #13 : 12 Октября 2002, 19:01:35 »
http://www.robotstxt.org/wc/active/html/index.html - список 284 роботов

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28