Автор Тема: Забрать страничку с другого сайта  (Прочитано 14793 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн semya

  • Фанат форума
  • Старожил
  • ****
  • Сообщений: 307
  • +0/-0
  • 0
    • Просмотр профиля
Забрать страничку с другого сайта
« Ответ #30 : 16 Мая 2003, 12:05:59 »
Цитировать
Кстати, случаем не встречал какой-нить утилитки для отладки регекспов?

неа, а было бы интересно! найдешь кидай ссылку, или мож кто подскажет. Я думаю, что насчет жадности максимальных операторов регэкспов тебе книжка подскажет намного больше. Кстати после ее прочтения, начал намного активнее юзать регэкспы, т.к. стал их наконец нормально понимать и без них сейчас просто никуда...

Оффлайн kosm

  • Фанат форума
  • Постоялец
  • ***
  • Сообщений: 110
  • +0/-0
  • 0
    • Просмотр профиля
    • http://japanretro.tk
Забрать страничку с другого сайта
« Ответ #31 : 16 Мая 2003, 12:21:24 »
semya
Ok

Оффлайн kosm

  • Фанат форума
  • Постоялец
  • ***
  • Сообщений: 110
  • +0/-0
  • 0
    • Просмотр профиля
    • http://japanretro.tk
Забрать страничку с другого сайта
« Ответ #32 : 16 Мая 2003, 13:01:46 »
semya
Разобрался, почему у меня все-таки не кушался .*
Все дело было в модификаторе /s, который разрешает точке соответствовать \\n
/^.*/is  теперь правильно захватывает заголовок.

Нашел утилитку для отладки регекспов. Вернее она у меня была, просто вспомнил про нее. Куда закинуть?

PS: Кстати, средства отладки есть в перловых редакторах Komodo и OptiPerl, но там они как-то глючно работают.

Оффлайн kosm

  • Фанат форума
  • Постоялец
  • ***
  • Сообщений: 110
  • +0/-0
  • 0
    • Просмотр профиля
    • http://japanretro.tk
Забрать страничку с другого сайта
« Ответ #33 : 16 Мая 2003, 15:59:02 »
Интересно. Теперь дальше застрял. Я вытянул только титульную страницу, т.е. оглавление с ссылками на сами новостные странички. Как мне теперь их обрабатывать? Каждую страничку по ссылке тоже нужно коцать. Какая методика тут?

Оффлайн kosm

  • Фанат форума
  • Постоялец
  • ***
  • Сообщений: 110
  • +0/-0
  • 0
    • Просмотр профиля
    • http://japanretro.tk
Забрать страничку с другого сайта
« Ответ #34 : 16 Мая 2003, 17:33:34 »
Народ, ну подскажите с какой стороны подступиться, а?
Т.е. ссылки все я из странички выберу, а что с ними дальше делать?
1. Пройтись по каждой и содержимое каждой добавлять ниже (расставляя метки), а ссылку менять на метку? Получится наверно громоздко и долго грузиться... И получится ли вообще.
2. Изенить ссылки таким образом, чтобы они шли не прямо на страничку, а через ф-цию, которая коцает?

Если первое я примерно представляю как сделать, то что делать со вторым ума пока не приложу?
Первый вариант мне кажется тут не совсем подходит.
Помогите плиз, а?

semya, ты куда пропал? Нужна твоя помощь... Плиззз :)

Спасибо!

Оффлайн semya

  • Фанат форума
  • Старожил
  • ****
  • Сообщений: 307
  • +0/-0
  • 0
    • Просмотр профиля
Забрать страничку с другого сайта
« Ответ #35 : 16 Мая 2003, 18:47:04 »
а есть ли тебе смысл выбирать сначала весь список, а потом ходить по новостям, ты посмотри более подробно на ссылку, мож там что-то типа news.php?id=news_id и тебе только достаточно смотреть какую новость ты еще не выбирал и забирать ее не мучаюясь с оглавлением? а иначе конечно придется ходить по каждой новости и забирать ее, и я уверен, что там глобальным поиском по тексту страницы с помощью preg_match_all() можно одним запросом выбрать все новости... кидай в приват или по асе адрес и что надо выбрать, я тебе скрипт накатаю, но тока завтра...

П.С. - ты вроде обещался утилитку для регэкспов... я тебе мыло в персональные сообщения кинул...

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28