Автор Тема: Читка HTML и резка на страницы.  (Прочитано 2061 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн GrAfF

  • Завсегдатай
  • Пользователь
  • **
  • Сообщений: 59
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Читка HTML и резка на страницы.
« : 15 Августа 2003, 03:22:54 »
HI!
Помогите плиз, нужно два мелких алгоритма. Самостоятельно, боюсь, затянется. Да и спецы тут. ;)
1. Есть HTML. Как получить из файла содержание тегов TITLE и всех P?
2. Есть длинный HTML с кучей тегов P. Нужно его бы порезать на 2-3 страницы, чтобы не слишком длинно было. То есть вытаскиваем все P (они все друг за другом). А как их вытащить, разбить полученное на куски для разных страниц (Не знаю как лучше. Что, если по 10 кило, например?), добавить нужные P, чтобы закрыть порезанные абзацы? И что, если вдруг текст разрежется точно по тегу, то есть

в другом? А вставка потом в другой шаблон, т.е. остальный HTML не важен.

WBR, GrAfF.

Оффлайн Chs

  • Perl программер
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 1108
  • +0/-0
  • 2
    • Просмотр профиля
    • http://chs.now.at/
Читка HTML и резка на страницы.
« Ответ #1 : 15 Августа 2003, 08:57:49 »
perldoc perlre
2B OR NOT 2B = FF

Оффлайн AliMamed

  • \\o/ ali akbar \\o/
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 2409
  • +2/-0
  • 2
    • Просмотр профиля
    • http://alimamed.pp.ru
Читка HTML и резка на страницы.
« Ответ #2 : 15 Августа 2003, 12:30:35 »
все < p > в массив
ну, будем исповедоваться?

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28