Автор Тема: Как надежно удалить <хтмл-теги> из тескта  (Прочитано 8763 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн cyberg

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 18
  • +0/-0
  • 0
    • Просмотр профиля
    • http://www.gpstudio.ru
Как надежно удалить <хтмл-теги> из тескта
« Ответ #15 : 09 Ноября 2001, 06:46:57 »
а где прочитать про HTML::Parser ???
G&P studio

Оффлайн lodevar

  • Сеньор-Помидор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 757
  • +0/-0
  • 2
    • Просмотр профиля
    • http://lodevar.hut.ru
То, что нужно по теме беседы здесь:
« Ответ #16 : 09 Ноября 2001, 09:22:22 »
http://www.eugene.dp.ua/Superadmin/perl/chapter20/20_1.htm#206

З.Ы. Это перепечатка Perl Cookbook (c) O\'RELLY

Так что: "покупайте книги товарищи. Книга - лучший друг человека" (чей-то лозунг).:D
« Последнее редактирование: 09 Ноября 2001, 09:27:32 от lodevar »
С наилучшими пожеланиями. LODEVAR

  • Гость
Как надежно удалить <хтмл-теги> из тескта
« Ответ #17 : 09 Ноября 2001, 18:13:01 »
Цитировать
Да я не про то! Я про то, что если тег начался, то в нем не могут использоваться ">", кроме как для закрытия! Поэтому проверка на пробел излишняя...

Интересное мнение а как насчет такого \'проблемы>> Пупкина\'> В ALT все будет показываться как надо с ->>>, короче ВОПРОС ТОТ ЖЕ ???????

  • Гость
та же
« Ответ #18 : 09 Ноября 2001, 18:17:12 »
как я понял Парсер для собственного сервера, а у меня хостинг на кудыкиной горе и ни как я его туды не закину, если не прав поясните плиз потому как я пронего читал но мой хостинг его не поддерживает

  • Гость
та же
« Ответ #19 : 09 Ноября 2001, 18:23:22 »
а как Вам например тотже вариант с IMG но при этом тег разделен на две или три строки
src=\'Пупкин.gif\'
 alt=\'проблемы ->>> Пупкина\'>  А .....???????

Оффлайн Haze

  • Просто я...
  • Пользователь
  • **
  • Сообщений: 70
  • +0/-0
  • 2
    • Просмотр профиля
    • http://www.baltic.ee
Как надежно удалить <хтмл-теги> из тескта
« Ответ #20 : 10 Ноября 2001, 03:07:42 »
Тогда используй модуль... На самом деле проблем может быть очень много, но в данном случае:

s/<[A-za-z]([^\'">]*[\'"][^\'"]*?[\'"])*[^>]*>//sig

Это, конечно, сплошное извращение, а не выражение :), оптимизировать надо, да и опять же что-нибудь пропустит :) Думать надо долго и мучительно, а это такое неблагодарное занятие...

  • Гость
Как удалить множество пустых строк в одну
« Ответ #21 : 14 Ноября 2001, 15:05:39 »
После удаления ХТМЛов остается туча пустых строк, надобно их схлопнуть в одну

Оффлайн lodevar

  • Сеньор-Помидор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 757
  • +0/-0
  • 2
    • Просмотр профиля
    • http://lodevar.hut.ru
Как надежно удалить <хтмл-теги> из тескта
« Ответ #22 : 14 Ноября 2001, 15:56:46 »
Цитировать
а у меня хостинг на кудыкиной горе и ни как я его туды не закину
хостера в студию... :)
С наилучшими пожеланиями. LODEVAR

  • Гость
Как надежно удалить <хтмл-теги> из тескта
« Ответ #23 : 27 Ноября 2001, 21:50:15 »
Казахский вариант :D

$mail="f:/mail.html";
open (OUT, "<$mail");
$sort="f:/txt.txt";
open (IN, ">$sort");

undef ($/);
$_=;

$_=~s/\\<+?style.+?\\<+?\\/style\\+?>//isg;# смерть теблицам стилий Если я павелно это понимю
$_=~s/\\<+?SCRIPT.+?\\<+?\\/SCRIPT+?\\>//isg;# смерть скриптам
$_=~s/\\<+?.+?\\>+?//sg;#теги выкусывает любые однозначно С комментарияме правде есть пролема
$_=~s/(\\s+\\n\\n)//sg;#находит и убивает много лишних переводов строки НЕ ВСЕ

print IN $_;

Осталась одно только проблема на мой взгляд
вот из такой строки
остоётся "-->"

Если ктото заметит что скрипт работает криво высылайте пожалысто код который скрипт ненашол
добавим пофиксим исправим

ююю

  • Гость
Как надежно удалить <хтмл-теги> из тескта
« Ответ #24 : 27 Ноября 2001, 22:04:54 »
Казахский вариант  :D

Блин опять закривулил Устал навегное нуно спать

$_=~s/\\<+?style.+?\\<+?\\/style.+?\\>//isg;# смерть  теблицам стилий
$_=~s/\\<+?SCRIPT.+?\\<+?\\/SCRIPT.+?\\>//isg;# смерть скриптам
$_=~s/\\<+?.+?\\>+?//sg;#теги выкусывает любые однозначно С комментарияме правде есть пролема
$_=~s/(\\s+\\n\\n)//sg;

ююю

  • Гость
Как надежно удалить <хтмл-теги> из тескта
« Ответ #25 : 03 Декабря 2001, 17:25:17 »
$value =~ s/\\ $value =~ s/\\>/>/gi;

Оффлайн Green Kakadu

  • Координатор
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 2757
  • +1/-0
  • 0
    • Просмотр профиля
    • http://gnezdo.webscript.ru
ж)
« Ответ #26 : 03 Декабря 2001, 17:46:43 »
Цитировать
$value =~ s/\\$value =~ s/\\>/>/gi;

типа круто. только не по теме немножко... :)
 в исканиях.

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28