HI!
Помогите плиз, нужно два мелких алгоритма. Самостоятельно, боюсь, затянется. Да и спецы тут.
1. Есть HTML. Как получить из файла содержание тегов TITLE и всех P?
2. Есть длинный HTML с кучей тегов P. Нужно его бы порезать на 2-3 страницы, чтобы не слишком длинно было. То есть вытаскиваем все P (они все друг за другом). А как их вытащить, разбить полученное на куски для разных страниц (Не знаю как лучше. Что, если по 10 кило, например?), добавить нужные P, чтобы закрыть порезанные абзацы? И что, если вдруг текст разрежется точно по тегу, то есть
в другом? А вставка потом в другой шаблон, т.е. остальный HTML не важен.