Автор Тема: хелп плиз, чистка html  (Прочитано 2253 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн sk

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 6
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
хелп плиз, чистка html
« : 17 Ноября 2004, 14:42:49 »
Есть html код страницы сваленный в переменную, из него необходимо выбросить все что совпадаетс маской "".
Никак не получается. Может кто поможет с регуляркой ?

Оффлайн Green Kakadu

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 2757
  • +1/-0
  • 0
    • Просмотр профиля
    • http://gnezdo.webscript.ru
хелп плиз, чистка html
« Ответ #1 : 17 Ноября 2004, 15:00:37 »
//
 в исканиях.

Оффлайн sk

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 6
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
хелп плиз, чистка html
« Ответ #2 : 17 Ноября 2004, 15:09:17 »
пробовал, не работает
$buf = ereg_replace("","",$buf);
ответ: Warning: REG_BADRPT:drepetition-operator operand invalid in ...

Оффлайн sk

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 6
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
хелп плиз, чистка html
« Ответ #3 : 17 Ноября 2004, 16:03:32 »
С горем попалам решил задачу, на удивление даже время выполнения скрипта осталось почти неизменным, код привожу:

preg_match_all("/\\/i",$buf,$matc);
if (sizeof($matc[0])!=0):
$j   = 0;
$num = sizeof($matc[0]);
while ($j<$num) {$buf = str_replace($matc[0][$j]," ",$buf);$j++;}
endif;

P.S. если кому вдруг понадобится, полный код "вылизывания html":
$buf = str_replace("\\r","",$buf);
$buf = str_replace("\\n","",$buf);
$buf = str_replace("\\t"," ",$buf);
$buf = str_replace(chr(160)," ",$buf);
preg_match_all("/\\/i",$buf,$matc);
if (sizeof($matc[0])!=0):
$j   = 0;
$num = sizeof($matc[0]);
while ($j<$num) {$buf = str_replace($matc[0][$j]," ",$buf);$j++;}
endif;
$buf = ereg_replace("[ ]+"," ",$buf);
$buf = str_replace("> <","><",$buf);

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28