Автор Тема: Тэги в сообщении форума 3 (Прочитано 5797 раз)

Отец Никон · « : 17 Января 2003, 19:14:57 »

Вроде бы ясно, как удалить тэги из текста:
$post=~s/$post=~s/>/>/g;

Но как сделать, чтобы некоторые тэги игнорировались? Если это простые тэги, типа , то я думаю сделать просто:
$post=~s/<B>//g;
Но как быть, например, с тэгом ? Ведь внутри его могут быть какие-то атрибуты (напр. ) и простой заменой не обойтись.

И ещё: как сделать, чтобы URL-ы выделялись тэгом ?

NeoNox · « **Ответ #1 :** 17 Января 2003, 19:36:34 »

$post=~s/<FONT (.*)>//gi;
А вообще купи книжку MRE или на сайтах поищи

NeoNox · « **Ответ #2 :** 17 Января 2003, 19:40:22 »

Хозяйке на заметку
Заменяем теги
sub html_encode {

my ($object, $tmp) = @_;

$tmp =~ s!&!&!g;

$tmp =~ s!>!>!g;

$tmp =~ s!<!<!g;

$tmp =~ s!\\"!"!g;

return $tmp}
Убираем их вообще (работает не по условию а как каток)
sub clearHTML {

my ($object, $Tmp) = @_;

$Tmp =~ s/<.+?>//g;

return $Tmp}
Перекодируем в одну и другую сторону:

sub unHTML {

my ($object, $Tmp) = @_;

my %ENT=(\'<\'=>\'lt\',\'>\'=>\'gt\',\'"\'=>\'quot\');

$Tmp =~ s!([<>"])!&$ENT{$1};!g;

$Tmp =~ s|<!--|<!--|g;

$Tmp =~ s|-->|-->|g;

$Tmp =~ s|<script>|<script>|ig;

$Tmp =~ s| | |g;

$Tmp =~ s|^\\$+$|&#36|g;

$Tmp =~ s|\\@|@|g;

$Tmp =~ s!\\|!|!g;

$Tmp =~ s|\\{|{|g;

$Tmp =~ s|\\}|}|g;

$Tmp =~ s|\\\\,|,|g;

$Tmp =~ s|\\~|~|g;

$Tmp =~ s|\'|'|g;

$Tmp =~ s|\\n|
|g;

$Tmp =~ s|\\s+$||g;

$Tmp =~ s|\\$|&#36|g;

$Tmp =~ s|\\r||g;

$Tmp =~ s!\\\\!\!g;

return $Tmp}

sub doHTML {

my $object = shift;

my $Tmp = $_[0];

$Tmp =~ s/@/\\@|g;

$Tmp =~ s/'/\'/g;

$Tmp =~ s/\\</</g;

$Tmp =~ s/\\>/>/g;

$Tmp =~ s!&#36!\\$!g;

$Tmp =~ s/|/\\|/g;

$Tmp =~ s/+/\\+/g;

$Tmp =~ s/*/\\*/g;

$Tmp =~ s/)/\\)/g;

$Tmp =~ s/(/\\(/g;

$Tmp =~ s/,/,/g;

$Tmp =~ s/}/\\}/g;

$Tmp =~ s/{/\\{/g;

$Tmp =~ s/\/\\\\/g;

$Tmp =~ s/"/"/g;

$Tmp =~ s/&/&/g;

return $Tmp}

Chs, может в факе раздел по регуляркам завести?

NeoNox · « **Ответ #3 :** 17 Января 2003, 19:59:04 »

Цитировать

И ещё: как сделать, чтобы URL-ы выделялись тэгом ?

$text =~ s~([^\\w\\"\\=\\[\\]]|[\\A\\n\\b])\\\\*(\\w+://[^<>\\s\\n\\"\\]\\[]+)~$1<a href="$2" target="_blank">$2</a>~isg;

$text =~ s~([^\\"\\=\\[\\]/\\:]|[\\A\\n\\b])\\\\*(www\\.[^<>\\s\\n\\]\\[]+)~$1<a href="http://$2" target="_blank">$2</a>~isg;

$text =~ s~([^\\f\\"\\=\\[\\]]|[\\A\\n\\b])\\\\*(\\f+://[^<>\\s\\n\\"\\]\\[]+)~$1<a href="$2" target="_blank">$2</a>~isg;

$text =~ s~([^\\"\\=\\[\\]/\\:]|[\\A\\n\\b])\\\\*(ftp\\.[^<>\\s\\n\\]\\[]+)~$1<a href="ftp://$2" target="_blank">$2</a>~isg;
[OFF]Да... php-шная подсветка подходит perl - скриптам как корове седло..[/OFF]

Отец Никон · « **Ответ #4 :** 18 Января 2003, 00:26:27 »

Цитировать

$post=~s/<FONT (.*)>//gi;
А вообще купи книжку MRE или на сайтах поищи

Что за книжка? Расшифровать можешь?
Что касаемо фака по рег. выр-ям, то вещь, думаю, для неофитов полезная будет.

NeoNox · « **Ответ #5 :** 18 Января 2003, 13:58:16 »

Mastering Regular Expressions
Автор: Jeffrey E. F. Friedl
http://www.oreilly.com/catalog/regex/
Здесь в pdf http://www.bosconet.org/UNIX/unix/Mastering%20Regular%20Expressions/
На русский она также переведена: Регулярные выражения
Автор тот-же.

Отец Никон · « **Ответ #7 :** 18 Января 2003, 23:16:05 »

И скрипт для выделения URL\'ов тоже не работает:

Цитировать

Unrecognized character \\xA0.

Что это за символ - я не пойму.

Отец Никон · « **Ответ #9 :** 18 Января 2003, 23:39:40 »

Цитировать

perldoc perlre

Опять

Да читал я его, даже перевод русский есть.

Chs · « **Ответ #10 :** 18 Января 2003, 23:46:05 »

Цитировать

Unrecognized character \\xA0.

Что это за символ - я не пойму.

Cимволы перед и после "=~" удали и поставь пробелы.

Chs · « **Ответ #11 :** 18 Января 2003, 23:52:01 »

Цитировать

perldoc perlre

Опять Да читал я его, даже перевод русский есть.

Тогда еще
perldoc perlop в части Quote and Quote-like Operators
и Regexp Quote-Like Operators

Отец Никон · « **Ответ #12 :** 19 Января 2003, 00:25:30 »

Если я удалю "символы", тогда естественно, всё будет работать, т.к. вообще не будет этого кода. Ты разъясни поконкретнее.

Chs · « **Ответ #13 :** 19 Января 2003, 00:37:55 »

Цитировать

Если я удалю "символы", тогда естественно, всё будет работать, т.к. вообще не будет этого кода. Ты разъясни поконкретнее.

Один символ до "=~" и один после и заменить пробелами. Так понятнее?

Отец Никон · « **Ответ #14 :** 19 Января 2003, 00:51:44 »

Ага, а теперь так:
/([^w"=[]]|[A\\nb])\\*(w+://[^<>s\\n"][]+)/: unmatched [] in regexp

Вроде тут всё закрыто или нет?

Новости:

Автор Тема: Тэги в сообщении форума 3 (Прочитано 5797 раз)