Автор Тема: Как надежно удалить <хтмл-теги> из тескта  (Прочитано 8760 раз)

0 Пользователей и 1 Гость просматривают эту тему.

  • Гость
смотри Subject

Оффлайн lodevar

  • Сеньор-Помидор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 757
  • +0/-0
  • 2
    • Просмотр профиля
    • http://lodevar.hut.ru
Как надежно удалить <хтмл-теги> из тескта
« Ответ #1 : 06 Ноября 2001, 16:24:37 »
Почитай про HTML::Parser
С наилучшими пожеланиями. LODEVAR

Оффлайн NeoNox

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 3012
  • +0/-0
  • 0
    • Просмотр профиля
Как надежно удалить <хтмл-теги> из тескта
« Ответ #2 : 07 Ноября 2001, 11:28:08 »
Цитировать
Почитай про HTML::Parser

... или соорудить конструкцию при помощи регэкспа.
The documentations is your friend

Оффлайн cyberg

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 18
  • +0/-0
  • 0
    • Просмотр профиля
    • http://www.gpstudio.ru
Как надежно удалить <хтмл-теги> из тескта
« Ответ #3 : 07 Ноября 2001, 13:28:26 »
Может так?

$text =~ s/<([^>]|\\n)*>//g;
$text =~ s/$text =~ s/>//g;
G&P studio

Оффлайн Green Kakadu

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 2757
  • +1/-0
  • 0
    • Просмотр профиля
    • http://gnezdo.webscript.ru
а так
« Ответ #4 : 07 Ноября 2001, 15:00:34 »
$text =~s/<[^>]+>//g;
 в исканиях.

Оффлайн Haze

  • Просто я...
  • Пользователь
  • **
  • Сообщений: 70
  • +0/-0
  • 2
    • Просмотр профиля
    • http://www.baltic.ee
Как надежно удалить <хтмл-теги> из тескта
« Ответ #5 : 07 Ноября 2001, 17:26:34 »
а как насчет > < в тексте?
Предлагаю использовать ту особенность, что, после < идет буква лат. алфавита без пробела (по крайней мере обычно :) )

s/<[a-zA-z][^>]*>//g

Оффлайн NeoNox

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 3012
  • +0/-0
  • 0
    • Просмотр профиля
Как надежно удалить <хтмл-теги> из тескта
« Ответ #6 : 08 Ноября 2001, 11:33:14 »
Да еще на пробел перед > и после буквы/цифры не мешало бы проверочку создать...
s/<[a-zA-z][^>]* *>//g
The documentations is your friend

Оффлайн Haze

  • Просто я...
  • Пользователь
  • **
  • Сообщений: 70
  • +0/-0
  • 2
    • Просмотр профиля
    • http://www.baltic.ee
Как надежно удалить <хтмл-теги> из тескта
« Ответ #7 : 08 Ноября 2001, 11:42:38 »
NeoNox

Цитировать
Да еще на пробел перед > и после буквы/цифры не мешало бы проверочку создать...


Зачем??? Ведь в тегах после < всегда идет закрывающая > и для других целей она использоваться не может!

Оффлайн NeoNox

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 3012
  • +0/-0
  • 0
    • Просмотр профиля
Как надежно удалить <хтмл-теги> из тескта
« Ответ #8 : 08 Ноября 2001, 11:52:01 »
Цитировать
Зачем??? Ведь в тегах после < всегда идет закрывающая > и для других целей она использоваться не может!

а вот и не правда ваша :)
в спецификации ХТМЛ сказано, что перед закрывающей скобкой допускаются пробелы!
The documentations is your friend

Оффлайн dimfish

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 27
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Как надежно удалить <хтмл-теги> из тескта
« Ответ #9 : 08 Ноября 2001, 12:15:32 »
Как надежно удалить <хтмл-теги> из тескта
надежно можно с HTML::Parser - конечно можно самому извращаться - но зачем изобретать велосипед?

Оффлайн lodevar

  • Сеньор-Помидор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 757
  • +0/-0
  • 2
    • Просмотр профиля
    • http://lodevar.hut.ru
Как надежно удалить <хтмл-теги> из тескта
« Ответ #10 : 08 Ноября 2001, 12:19:19 »
Цитировать
надежно можно с HTML::Parser
Все возвращается на круги свои.
С наилучшими пожеланиями. LODEVAR

Оффлайн dimfish

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 27
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Как надежно удалить <хтмл-теги> из тескта
« Ответ #11 : 08 Ноября 2001, 12:23:53 »
lodevar
дык первый ответ был исчерпывающий ;)

Оффлайн lodevar

  • Сеньор-Помидор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 757
  • +0/-0
  • 2
    • Просмотр профиля
    • http://lodevar.hut.ru
Как надежно удалить <хтмл-теги> из тескта
« Ответ #12 : 08 Ноября 2001, 12:27:20 »
вот и я про то.
С наилучшими пожеланиями. LODEVAR

Оффлайн NeoNox

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 3012
  • +0/-0
  • 0
    • Просмотр профиля
Как надежно удалить <хтмл-теги> из тескта
« Ответ #13 : 08 Ноября 2001, 12:32:41 »
Цитировать
дык первый ответ был исчерпывающий

В споре рождается истина! :)
Хотя, я бы все-таки через регэксп делал.
The documentations is your friend

Оффлайн Haze

  • Просто я...
  • Пользователь
  • **
  • Сообщений: 70
  • +0/-0
  • 2
    • Просмотр профиля
    • http://www.baltic.ee
Как надежно удалить <хтмл-теги> из тескта
« Ответ #14 : 08 Ноября 2001, 12:43:12 »
Цитировать
а вот и не правда ваша  
в спецификации ХТМЛ сказано, что перед закрывающей скобкой допускаются пробелы!


Да я не про то! Я про то, что если тег начался, то в нем не могут использоваться ">", кроме как для закрытия! Поэтому проверка на пробел излишняя...

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28