Forum Webscript.Ru

Программирование => Perl => Тема начата: kapr от 25 Февраля 2005, 20:18:48

Название: вырезать теги из html файла
Отправлено: kapr от 25 Февраля 2005, 20:18:48
Нужно вырезать из файла теги ~~sgi
Если надо удалить со скриптами

s~~~sgi
Если только теги
Название: вырезать теги из html файла
Отправлено: NeoNox от 26 Февраля 2005, 12:24:14
restart2003
ты читаешь что перед тобой сказали?
резать теги такой регуляркой не правильно.
Название: вырезать теги из html файла
Отправлено: restart2003 от 27 Февраля 2005, 05:00:37
А что в ней неправильного? Если надо всего-то вырезать пару тегов скриптов, не обязательно подгружать парсеры итп (по воробьям из пушки).
Название: вырезать теги из html файла
Отправлено: NeoNox от 27 Февраля 2005, 14:01:00
Посмотри что будет с текстом
Цитировать


main text

применяя первую регулярку.
И к второй я тоже могу найти пример где она не сработает.
Чти перлдок. perldoc -q \'How do I remove HTML from a string?\'
Название: вырезать теги из html файла
Отправлено: restart2003 от 27 Февраля 2005, 14:41:50
NeoNox
Гмда, спасибо. А про теги без параметров я и не подумал :)
Название: вырезать теги из html файла
Отправлено: NeoNox от 28 Февраля 2005, 13:41:57
Цитировать
restart2003:
А про теги без параметров

А при чем тут теги без параметров?
Рекомендую включить use re \'debug\'; в начале скрипта что-бы понять как происходит поиск при s~(.+?)~~sgi