Автор Тема: Удаление пробелов лишних, не трогая тэги. (Прочитано 9541 раз)

Boatman · « : 16 Октября 2002, 19:30:32 »

Как удалить все лишние пробелы из ХТМЛ текста, не портя тэгов? Подскажите плиз шаблон для preg_replace или стандартную функцию.

Например:

preg_replace(\'/\\\\s+/\', \' \', $string);

но тока чтоб он не делал этого внутри тэгов (между < и >).

Меняздесьдавнонет · « **Ответ #1 :** 16 Октября 2002, 20:05:12 »

А что - эта функция удаляет ЛИШНИЕ пробелы из текста?
Именно удаляет?
Я, наверное, что-то не понимаю в лишних пробелах...

Maniac · « **Ответ #2 :** 16 Октября 2002, 20:34:18 »

А почему в тегах не удалять? Ситуация бы резко упростилась... Насколько я помню, в тегах нет мест, критичных к количеству пробелов.

Tronyx · « **Ответ #3 :** 16 Октября 2002, 22:08:08 »

Цитировать

А почему в тегах не удалять? Ситуация бы резко упростилась... Насколько я помню, в тегах нет мест, критичных к количеству пробелов.

Если использовать регу Boatmana то проблемы будут.

preg_replace(\'/\\s+/\', \' \', $string);

rembo · « **Ответ #4 :** 17 Октября 2002, 06:23:27 »

А какого $#^%& их вапще удалять?

Хтмлину оптимизировать такиим способом что ли?

ThE0ReTiC · « **Ответ #5 :** 17 Октября 2002, 11:21:00 »

rembo
Ну как вариант.

Меняздесьдавнонет · « **Ответ #6 :** 17 Октября 2002, 14:42:09 »

есть даже модуль под апач, который удаляет лишнее.
малораспространенный, впрочем - мод_гзип делает то же самое, и больше.

а замена вайтспейса на пробелы, я думаю, может повредить яваскрипты. там же есть зависимость от переврдов строк, кажется?

PilotV · « **Ответ #7 :** 17 Октября 2002, 15:58:52 »

Да, удаление лишних символов - переводов строк, пробелов, табуляций - вообще не то чтобы очень однозначная вещь для разных участков кода, как-то скрипты, теги, сам текст.
А еще все забыли про тег PRE
Не думаю, что эта задача стоит того, чтобы ею заниматься.

Boatman · « **Ответ #8 :** 17 Октября 2002, 20:16:16 »

замечательно!

Во-первых, что если у тебя
(там два пробела);

во-вторых речь не идет ни о какой оптимизации ХТМЛ, просто нужно поработать над текстом, независимо от гипертекста, сделать из \\s+ один пробел лишь одна из необходимых вещей.

Главное что надо, это работать над тем, что между тэгами.

Тут главное сам принцип реализовать.

хелп у кого еще есть идеи.

Меняздесьдавнонет · « **Ответ #9 :** 18 Октября 2002, 02:18:51 »

вот такая идея.

в цикле, пока не кончится строка, бежим по ней
strpos-ом и ищем по очереди < и >
запоминаем позицию (в начале - 0)
если нашлось <
вырезаем от запомненной позиции до позиции <
проверяем флаг. Если не тег, то
производим нужные операции.
ставим флаг ,что ищем >
конкатим отрезаное к результирующей строке.
позиция=найденая позиция.
гото 1

ну как?
должно, вроде, работать быстро и без ошибок.

КшЫуфксрук · « **Ответ #10 :** 18 Октября 2002, 02:33:18 »

Пока не встретится JavaScript c "<" или ">". Самое лучшее для такой задачи - взять толковый парсер HTML кода. Для Перла такие есть, нужно поискать для ПХП.

Меняздесьдавнонет · « **Ответ #11 :** 18 Октября 2002, 02:48:39 »

для пхп есть у антонио.
а в яваскрипте может встретиться < и >?
а зачем?
можно пример посмотреть? уж очень любопытно.

PilotV · « **Ответ #12 :** 18 Октября 2002, 03:22:39 »

[OFF]Вот любители говорить ни о чем...[/OFF]

Boatman · « **Ответ #13 :** 18 Октября 2002, 13:10:46 »

т. е. все, что между > и < вырезаем, обрабатываем, обработанным вставляем обратно?

А если текст полметра и там куча тэгов?

ЗЫ предполагается, что нету скриптов в тексте

Меняздесьдавнонет · « **Ответ #14 :** 18 Октября 2002, 13:50:15 »

я думаю, что текст на полметра будет обработан где-то за 0,01-0,001 секунды.
только не вырезаем и обрабатываем, а вырезаем, если не тег, то обрабатываем, и вклеиваем в новую строку. А если тег - то просто вклеиваем.
вставлять - это долго и неудобно получится.

Новости:

Автор Тема: Удаление пробелов лишних, не трогая тэги. (Прочитано 9541 раз)