Автор Тема: вопрос по регекспам  (Прочитано 5851 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Elenka

  • Завсегдатай
  • Пользователь
  • **
  • Сообщений: 83
  • +0/-0
  • 0
    • Просмотр профиля
    • http://soccercleats.blogs.sapo.pt
вопрос по регекспам
« : 11 Декабря 2006, 01:09:08 »
есть HTML-код, нужно удалить все теги кроме заранее заданных...

ну к примеру

$text=~s/<(\\/)?(img|p|br)[^>]*?//ig;

удаляет теги img, p, br, НО как сделать обратное ? тобишь оставить только эти теги, а остальные выкинуть?

про модули парсинга хтмл итд спасибо, за совет читать ман тоже заранее благодарю :)

Оффлайн Elenka

  • Завсегдатай
  • Пользователь
  • **
  • Сообщений: 83
  • +0/-0
  • 0
    • Просмотр профиля
    • http://soccercleats.blogs.sapo.pt
вопрос по регекспам
« Ответ #1 : 11 Декабря 2006, 01:13:56 »
единственное, что приходит на ум, так сделать не =~, a !~, но оно не работает, в регекспах КРОМЕ существует только для отдельных символов ^[img] - кроме букв i,m,g. Как сделать именно фразы, ума ни приложу

Оффлайн ondr

  • Модератор
  • Глобальный модератор
  • Старожил
  • *****
  • Сообщений: 440
  • +0/-0
  • 0
    • Просмотр профиля
вопрос по регекспам
« Ответ #2 : 11 Декабря 2006, 09:12:15 »
perldoc HTML::Scrubber
0 OK, 0:1

Оффлайн ctax

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 22
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
вопрос по регекспам
« Ответ #3 : 11 Декабря 2006, 09:30:13 »
$qwe="

text


Image:


";
print $_  for grep /(])/,$qwe=~/(<.+?>)|([^<]+)/g;

Оффлайн ravshaniy

  • Фанат форума
  • Постоялец
  • ***
  • Сообщений: 191
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
вопрос по регекспам
« Ответ #4 : 11 Декабря 2006, 12:53:33 »
хм, у меня пока тока так получилось, не оператор s///
my $tag = "(img|p|br)";
my $patern = qr/(<(?:\\/?)$tag\\b(?:.*?)>)/i;
my $text="";
while ($body =~ m/$patern/gm){ $text .= $1; }
print $text;
убили кенни, сволочи

Оффлайн Elenka

  • Завсегдатай
  • Пользователь
  • **
  • Сообщений: 83
  • +0/-0
  • 0
    • Просмотр профиля
    • http://soccercleats.blogs.sapo.pt
вопрос по регекспам
« Ответ #5 : 11 Декабря 2006, 14:12:19 »
всем спасибо)

Оффлайн Serg31416

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 18
  • +0/-0
  • 0
    • Просмотр профиля
    • http://www.cronc.com/ru.shtml
вопрос по регекспам
« Ответ #6 : 25 Декабря 2006, 19:19:56 »
Привет.

 Вот так, наверно...

$_=\' ddd

aaa
 \';
s#<(?!(?:img|p|br))\\b[^>]*>##gi;
print;

Успехов!
 Сергей cronc.com/ru.shtml

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28