Программирование > Регулярные выражения
Парсинг HTML
(1/1)
Error202:
Есть HTML:
<li value=41>
<div class="Main">
<A href="http://link1.ru">Text1</A>
</div>
<div class="Other">
OtherText
</div>
<div class="Info">
<span style="color: #ffffff;"> TextInfo </span>
</div>
</li>
Как сделать regexp? :
1. Вытаскивался только http://link1.ru
2. Только Text1
3. Только OtherText
4. Только TextInfo
Всю голову сломал, так ничего и не выходит полезного...
commander:
1.
~/href="(.+)">/;
print $1;
2.
~/(.+?)/;
print $1;
3 и 4 по аналогии...
каков вопрос такой ответ... :)
если нужно что-то более или немее общее поставь другую задачу...
Error202:
А если таких кусков 4, и нужно в цикле эти данные вытаскивать...?
Error202:
:) Глупый вопрос... Я еще хотел сказать, что перед этими кусками куча HTML кода и после них... Т.е. привязку надо сделать по
*
Навигация
Перейти к полной версии