Программирование > PHP
Как узнать о редиректе?
vovanabok:
Есть пхп-скрипт "S", который грабит контент некой хтмл-страницы "А". У которой, соответственно, есть урл-адрес "А-урл".
Но вот, переходя по адресу "А-урл", для скрипта открывается страница "Б" вследствии действия Коварного_редиректа, некогда установленного на странице "А".
Вопрос: как в пхп-скрипте "S" узнать, имел ли место Коварный_редирект и что скрипт грабит на самом деле совершенно другую, совершенно ни в чем невиноватую страницу "Б"?
Постусловие: контент страницы "А" разработчику неизвестен.
APL:
это не редирект... скрипт, как и браузер, по http-запросу получает то, что выдает сервер, и браузер, если там стоит редирект перенаправляет на другую стр, а скрипт получит все нормально...
или вы под редиректом что-то другое имеете в виду...
или уж напишите что по вашему такое "для скрипта открывается страница "Б""?
"для скрипта" ничего не открывается :)
vovanabok:
отслеживая отображаемые результаты граббинга очереди страниц, я увидел, что вместо ожидаемого [title] страницы "А" в окошке броузера отображается [title] страницы "Б", на которую, как я понял, и произошел редирект.
что еще могу сказать: урл желаемой страницы "А" имел примерно такой вид:
http://какой.то.урл/component/option,com_banners/task,click/bid,6/news/article/491/1/article/497/1/
подозрительный конечно урл. но не ставить же резалку, которая будет отметать все урлы, что имеют строку "banner" или "click".
CGVictor:
vovanabok
--- Цитировать ---vovanabok:
по адресу "А-урл", для скрипта открывается страница "Б" вследствии
--- Конец цитаты ---
Контент забирается чем? Способ?
Ну а вообще - curl.
* адрес здесь ни при чем.
vovanabok:
Граблю таким способом:
--- Цитировать ---function get_url_content($url){
$c = \'\';
$fo = @fopen($url, "r");
while (!feof($fo)) {
$c .= fread($fo, 8192);
}
fclose($fo);
return $c;
}
--- Конец цитаты ---
2 CGVictor: curl нужно ставить, как я понял. скрипт на не моем хостинге работает...
2 APL: чтоб ответить на вопрос, продолжаю тестирование...
Навигация
Перейти к полной версии