Forum Webscript.Ru

Программирование => Perl => Тема начата: GrAfF от 15 Августа 2003, 03:22:54

Название: Читка HTML и резка на страницы.
Отправлено: GrAfF от 15 Августа 2003, 03:22:54
HI!
Помогите плиз, нужно два мелких алгоритма. Самостоятельно, боюсь, затянется. Да и спецы тут. ;)
1. Есть HTML. Как получить из файла содержание тегов TITLE и всех P?
2. Есть длинный HTML с кучей тегов P. Нужно его бы порезать на 2-3 страницы, чтобы не слишком длинно было. То есть вытаскиваем все P (они все друг за другом). А как их вытащить, разбить полученное на куски для разных страниц (Не знаю как лучше. Что, если по 10 кило, например?), добавить нужные P, чтобы закрыть порезанные абзацы? И что, если вдруг текст разрежется точно по тегу, то есть

в другом? А вставка потом в другой шаблон, т.е. остальный HTML не важен.

Название: Читка HTML и резка на страницы.
Отправлено: Chs от 15 Августа 2003, 08:57:49
perldoc perlre
Название: Читка HTML и резка на страницы.
Отправлено: AliMamed от 15 Августа 2003, 12:30:35
все < p > в массив