Forum Webscript.Ru
Программирование => Perl => Тема начата: xmolex от 12 Июля 2006, 18:16:38
-
Здравствуйте уважаемые коллеги.
Работаю сейчас над разработкой поисковой машины. Когда анализируешь страницы на ссылки, попадаются адреса скриптов, которые кидают тебя на скачивание файлов. Но качать файлы программа не должна. Существует ли какой-нибудь метод для определения, что мы качаем текст (html) или бинарник?
Не знаю даже где искать (наверное слова не те подобрал для поисковика), может кто ссылочку подкинет или опытом поделится. Заранее благодарен.
-
Content-Type
-
Может подскажете как получить только заголовок. Что-то ничего не нашел опять.
-
perldoc LWP::Simple | less -p head
-
Спасибо. Только less в windows работать не будет :)
-
у меня работает
-
Для винды аналог:
perldoc LWP::Simple | find /I "head"
-
xmolex:
Только less в windows работать не будет
http://www.greenwoodsoftware.com/less/download.html
и у Вас будет работать. :)
-
Спасибо за заботу, только у меня основная система FreeBSD. А здесь флуд начался. Лучше подскажите
почему возникает ошибка "Prototype mismatch: sub main::head: none vs ($) at robot.pl line 3". Программа работает, но почему она выводится?
На третьей строке я подгружаю модуль "use LWP::Simple;"
Вызов делаю "my($head) = head($base);".
Заранее благодарен.
-
а какие еще модули используются?
-
use CGI qw(:all);
-
main::head -- ?
-
Чего? Я так понял, что в CGI и LWP::Simple есть sub head, как быть?