Программирование > Регулярные выражения

Парсинг HTML

(1/1)

Error202:
Есть HTML:

<li value=41>
<div class="Main">
<A href="http://link1.ru">Text1</A>
</div>
<div class="Other">
OtherText
</div>
<div class="Info">
<span style="color: #ffffff;"> TextInfo </span>
</div>
</li>


Как сделать regexp? :
1. Вытаскивался только http://link1.ru
2. Только Text1
3. Только OtherText
4. Только TextInfo

Всю голову сломал, так ничего и не выходит полезного...

commander:
1.
~/href="(.+)">/;  
print $1;
2.
~/(.+?)/;
print $1;
3 и 4 по аналогии...  

каков вопрос такой ответ... :)
если нужно что-то более или немее общее поставь другую задачу...

Error202:
А если таких кусков 4, и нужно в цикле эти данные вытаскивать...?

Error202:
:) Глупый вопрос... Я еще хотел сказать, что перед этими кусками куча HTML кода и после них... Т.е. привязку надо сделать по
*

Навигация

[0] Главная страница сообщений

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 
Перейти к полной версии