Forum Webscript.Ru

Общие => Веб Сервера => Тема начата: shp от 09 Апреля 2005, 17:11:39

Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: shp от 09 Апреля 2005, 17:11:39
Как запретить доступ к robots.txt всем, кроме роботов через .htaccess?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: serezniy от 09 Апреля 2005, 19:03:08
никак
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Voyager2K от 10 Апреля 2005, 03:33:41
как вариант по IP  , но не заребет ли тебя собирать базу всех поисковых паучков ?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 10 Апреля 2005, 08:35:53
вы не поняли.
этот вопрос - сам по себе гениальный.
отвечать на него не надо.
его надо в музей в первозданном виде, да
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: ThE0ReTiC от 10 Апреля 2005, 17:19:48
shp
а зачем?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: shp от 10 Апреля 2005, 19:39:16
ThE0ReTiC,
В wwwroot может быть несколько директорий, куда паукам соваться не надо, например, с инклюдами или другими служебными файлами (думаю, это Вы и без меня прекрасно знаете, ведь правда?), соответственно, их желательно прописать в robots.txt. С другой стороны, просмотрев содержимое robots.txt, в таком случае можно получить кое-какие сведения о содержимом wwwroot.
Конечно, на многих сайтах все это добро вынесено за пределы wwwroot, некоторые поисковики все равно игнорируют Disallow и т.д... Но все это частный случай. Да и просто - зачем предоставлять пользователям лишнюю информацию, если этого можно не делать?
В принципе, проблема не критична, но за спрос ведь не бьют?
P.S. Пользуясь случаем, хочу задать маленький вопрос (надеюсь, на меня не обидятся, что я не создал отдельную тему). Вот правило в .htaccess:

 Order deny,allow
 Deny from all

Оно запрещает всем, кроме сервака, доступ к .htaccess и к *.inc. Существует ли возможность добавления отрицания к регулярному выражению (как в mod_rewrite) для того, чтобы запретить доступ ко всем файлам, кроме .htaccess и *.inc?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 10 Апреля 2005, 21:59:58
Цитировать
shp:
Да и просто - зачем предоставлять пользователям лишнюю информацию, если этого можно не делать?
В принципе, проблема не критична, но за спрос ведь не бьют?

За спрос не бьют. Бьют за непонимание самых базовых основ, которое приводит к спросу.
Ты долджен определиться -выкладываешь ты что-то, или нет. Безо всяких "лишнее - не лишнее". Если выложил - значит забыл обо всяких ограничениях.
Цитировать
shp:
запретить доступ ко всем файлам, кроме .htaccess и *.inc?

запретить доступ ко всем, кроме  .htaccess и *.inc? Ты ничего не напутал?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 10 Апреля 2005, 22:03:05
я, кстати, чё-та не понял.
Цитировать
wwwroot может быть несколько директорий, куда паукам соваться не надо, например, с инклюдами или другими служебными файлами (думаю, это Вы и без меня прекрасно знаете, ведь правда?),

Нет, не знаем.
а что будет, если паук сунется в такую директорию?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: shp от 10 Апреля 2005, 22:05:44
Цитировать
RomikChef:
запретить доступ ко всем, кроме .htaccess и *.inc? Ты ничего не напутал?

Это для примера. В реальности - это, конечно, бред
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 10 Апреля 2005, 22:52:58
обожаю вопросы для примера.
ну, для примера тебе и ответ - да.
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: shp от 10 Апреля 2005, 23:41:41
Цитировать
RomikChef:
обожаю вопросы для примера.

Ты больше обожаешь разводить ненужный флейм
Цитировать
RomikChef:
 Бьют за непонимание самых базовых основ, которое приводит к спросу.

Вот себя и бей. Это же ты спрашивал:
Цитировать
RomikChef:
а что будет, если паук сунется в такую директорию?

Ничего страшного, конечно, не случится. Просто всякий мусор проиндексирует
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 11 Апреля 2005, 09:55:37
Цитировать
shp:
Ты больше обожаешь разводить ненужный флейм

не надо ля-ля. флейм разводишь ты.
какой вопрос - такой и ответ.
задашь конкретный вопрос - получишь конкретный ответ.
пока от тебя ещё ни одного осмысленного вопроса не прозвучало.
такие проблемы, какие стоят перед тобой, перед другими людьми просто не возникают. поэтому тебе надо не дуться и сопли пускать, а ЗАДУМАТЬСЯ над тем, что тебе говорят.
А то больно много вас тут бегает. Зананий на копейку, а гонору на рубль. Фитилёк прикрути.
Цитировать
shp:
Просто всякий мусор проиндексирует

очень интересно. и каким же это образом он всякий мусор проиндексирует?
сделает листинг каталога на диске, прочитает список файлов - да?

паук что-то проиндексирует только в том случае, если у тебя совершенно криворукий админ. Что абсолютно невозможно на самом деле, а индексация - плод твоей богатой фантазии. Если же паче чаяния, это на самом деле так, то и в этом случае надо не глупостями заниматься а отрыванием рук админу и вставлением их туда, откуда они на самом деле растут.
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Green Kakadu от 11 Апреля 2005, 09:55:48
если на этот мусор нигде не стоит ссылок, то его никто и не проиндексирует, соответственно, можно это в robots.txt и не пихать.
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 11 Апреля 2005, 10:00:54
щас будут тебе ссылки.
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Yukko от 11 Апреля 2005, 11:07:32
Цитировать
с инклюдами или другими служебными файлами

всю жизнь думал, что инклюды и служебные файлы можно подключать из директории, которая лежит вне wwwroot...
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 11 Апреля 2005, 11:25:01
Yukko, даже если их не подключать, они все равно никакому пауку не будут видны. убирают их из ввврут только отУГАДЫВАНИЯ, а не от индексирования.
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: shp от 11 Апреля 2005, 17:27:18
Цитировать
Yukko:
всю жизнь думал, что инклюды и служебные файлы можно подключать из директории, которая лежит вне wwwroot...

Вообще-то я об этом уже писал в начале. Инклюды лежат в wwwroot - это частный случай.
RomikChef,
таких как ты - крикунов - сотни. Тем, кто больше всех кричит и кидает понты, до специалиста обычно как до луны. Лишь бы сообщений побольше набрать... Особенно таких много на phpclub.ru.
В общем, предлагаю не засорять форум. Не можешь помочь - не отвечай. Неужели так сложно?
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Yukko от 11 Апреля 2005, 17:36:47
shp
внимательно прочитай тему! ОЧЕНЬ внимательно! Судя по всему, ты думаешь, что у тебя поисковик прямо по файловой системе ходит!? Тебе уже сказали, что, как и куда положить! Если на файл, какой бы он ни был, вспомогательный ли, с паролями, с кодами от ядерной бомбы, до тех пор, пока на него нету ссылки, ни один поисковик его не найдет, пусть он хоть в корне сайта валяется!
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: commander от 11 Апреля 2005, 17:54:24
shp
флэйм порождает флэйм!
RomikChef
Рома будь посдерженне плиз... ;)
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: Меняздесьдавнонет от 11 Апреля 2005, 18:08:55
вы бы не морализаторством занимались, а объяснили ему, если такие правильные.
пока топик всё ещё топчется на месте
до чувака так и не дошла вся бессмысленность его вопросов.
Название: Как запретить доступ к robots.txt всем, кроме роботов?
Отправлено: shp от 11 Апреля 2005, 18:46:29
Цитировать
Yukko:
Судя по всему, ты думаешь, что у тебя поисковик прямо по файловой системе ходит!?

Нет, я так не думаю. Давайте на этом закроем тему.