Разбор HTML текста

Программирование > PHP

Разбор HTML текста

(1/1)

kiruxa:
Здравствуйте у меня есть входящий ХТМЛ текст (присылаються данные),
идет по шаблону впринципе все одинаковое

типа

....

мне надо вырезать все что в указано теге,
притом обрезать по закрывающемуся тегу....

подскажите куда смотреть и как правильно обрезать тег чтобы он отрезался по откр и закр тегу

спасибо,
непиннайте маленьких

ravshaniy:
1 вариант. вам могут помочь регулярные выражения как вариант

2 вариант - возможно что парсер типо xml. все таки стандарт дом, должен создать объекты.

3. ну и можно просто циклом. если вы читаете файл построчно. то построить условия в цикле так чтобы не считывать ненужные строки

4. вариант - красивый если использовать чтото типо grep. array_filter - кажется в php. осталось сделать так чтобы поток строк был массивом и как не странно

--- Код: ---array file ( string filename [, int use_include_path [, resource context]])
--- Конец кода ---

то есть возвращает массив строк.

возможно еще есть варианты. думаю что второй вариант лучше отбросить как малоэффективный

kiruxa:
Спасибо начал делать через DomDocument

Не могу получить ХТМЛ содержимое тага
$tag_list = $responseDoc->getElementsByTagName(\'table\');
foreach ($tag_list as $tag) {
if ($tag->attributes->getNamedItem(\'class\')->value==\'content\')
foreach ($tag->childNodes as $item) {

$node_name = iconv("UTF-8", "windows-1251", $item->nodeName);
$node_value = iconv("UTF-8", "iso8859-1", $item->nodeValue);
}
}

Не подзкажите как получить ХТМЛ содержимое?

hanslinger:
[p]simplexml[/p]

linzman:
а чем регекспы хуже?

Навигация

[0] Главная страница сообщений

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Перейти к полной версии