Forum Webscript.Ru

Программирование => Регулярные выражения => Тема начата: Error202 от 08 Ноября 2005, 15:45:11

Название: Парсинг HTML
Отправлено: Error202 от 08 Ноября 2005, 15:45:11
Есть HTML:




  • OtherText


    TextInfo




  • Как сделать regexp? :
    1. Вытаскивался только http://link1.ru
    2. Только Text1
    3. Только OtherText
    4. Только TextInfo

    Всю голову сломал, так ничего и не выходит полезного...
    Название: Парсинг HTML
    Отправлено: commander от 08 Ноября 2005, 16:18:46
    1.
    ~/href="(.+)">/;  
    print $1;
    2.
    ~/(.+?)<\\/A>/;
    print $1;
    3 и 4 по аналогии...  

    каков вопрос такой ответ... :)
    если нужно что-то более или немее общее поставь другую задачу...
    Название: Парсинг HTML
    Отправлено: Error202 от 08 Ноября 2005, 16:23:26
    А если таких кусков 4, и нужно в цикле эти данные вытаскивать...?
    Название: Парсинг HTML
    Отправлено: Error202 от 08 Ноября 2005, 16:33:17
    :) Глупый вопрос... Я еще хотел сказать, что перед этими кусками куча HTML кода и после них... Т.е. привязку надо сделать по