Автор Тема: regexp  (Прочитано 3909 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Knopka

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 5
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
regexp
« : 18 Апреля 2005, 12:16:30 »
imeetsa text vida


...some text...



vnutri toshe imeutsa spans i tablesi tags v neogranichennom kol-ve, nushno vitashit tolko text



takix kyskov neogr kol-vo

primer texta:
Цитировать

...



some text
no need this text

some text
text we needtext




any tags
...



some text
no need this text

some text
text we needtext




any tags


nushno vibrat tolko videlenniy text
« Последнее редактирование: 18 Апреля 2005, 12:33:54 от Knopka »

Оффлайн Knopka

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 5
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
regexp
« Ответ #1 : 18 Апреля 2005, 12:20:32 »
проблема заключается в том, чтобы дать программе понять, что между .. могут быть тоже ... то есть когда открывается, то нужно следить за тем, что внутренние открытые должны быть закрытыми и соответственно последний закрытый это  конец куска ...

Оффлайн Knopka

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 5
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
regexp
« Ответ #2 : 18 Апреля 2005, 12:24:51 »
while($text=~m%((вот эта часть, где нужно обозначить любой текст, в том числе вложенные span`s вызывает затруднение)*?)%ig)
{
 $t=$1;
}

Оффлайн Knopka

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 5
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
regexp
« Ответ #3 : 18 Апреля 2005, 12:32:00 »
while($text=~m%(([\\w\\W](%ig)

при этой конструкции дает после нескольких удачных прокруток "Segmentation fault"

Оффлайн vladsu

  • Фанат форума
  • Старожил
  • ****
  • Сообщений: 271
  • +0/-0
  • 0
    • Просмотр профиля
    • http://vladislavsurguchev.eu/
regexp
« Ответ #4 : 18 Апреля 2005, 14:37:06 »
Может Вам стоит взглянуть на
HTML:: Parser
----------------------------------------------
Мой сайт чёрно-белых фотографий из разных уголков мира тут

Оффлайн AnnA

  • Фанатка форума
  • Старожил
  • ****
  • Сообщений: 263
  • +0/-0
  • 2
    • Просмотр профиля
    • http://
regexp
« Ответ #5 : 18 Апреля 2005, 14:39:25 »
Knopka
HTML::Parser замечательно справляется с такими задачами.
или HTML::TokeParser
пока-пока. :)

Оффлайн AnnA

  • Фанатка форума
  • Старожил
  • ****
  • Сообщений: 263
  • +0/-0
  • 2
    • Просмотр профиля
    • http://
regexp
« Ответ #6 : 18 Апреля 2005, 14:40:42 »
о. :) на 2 секунды опоздала.
пока-пока. :)

Оффлайн Lastiik

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 28
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
regexp
« Ответ #7 : 18 Апреля 2005, 18:01:29 »
да, уже ок, не могу только внутренние таблицы удалять...

то есть, если


some info


delete this info


info

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28