1
Регулярные выражения / Парсинг галерей
« : 06 Ноября 2007, 08:52:24 »
Какая проблема...
пишу парсер галереи фотографий из каталога (для личных целей необходимо набрать базу таких фоток).. галерея имеет ссылки вида "домен/скрипт?адрес_галереи"... эти ссылки я нормально парсю (вместе с ссылками парсится и дополнительные данные). затем ухожу по этой ссылке. там хранятся фотографии... парсю все, что имеет href="...
парсю таким образом
preg_replace_callback(\'/href="(.*?)png"/\', ..., ...)
сюда попадают все картинки... но как оказывается часть из них имеет относительный путь, часть абсолютный...
каким образом мне получить полные пути к картинкам для дальнейшей их обработки?
пишу парсер галереи фотографий из каталога (для личных целей необходимо набрать базу таких фоток).. галерея имеет ссылки вида "домен/скрипт?адрес_галереи"... эти ссылки я нормально парсю (вместе с ссылками парсится и дополнительные данные). затем ухожу по этой ссылке. там хранятся фотографии... парсю все, что имеет href="...
парсю таким образом
preg_replace_callback(\'/href="(.*?)png"/\', ..., ...)
сюда попадают все картинки... но как оказывается часть из них имеет относительный путь, часть абсолютный...
каким образом мне получить полные пути к картинкам для дальнейшей их обработки?