
Всем привет, вообщем такой вопрос:
есть строка, из неё нужно выбрать все подстроки, которые находятся в тегах <h1></h1>.
Чего то не получаеться регулярку написать, помогите плиз.

2 вопрос(решён) Спасибо всем!!!
Сделаю вывод, и задам вопрос, который у меня появился в ходе выяснения проблемы, чтобы не заводить другую тему!
Вопрос таков:
Как пропарсить страницы вида: site/page/ ?
Спустя 5 минут, 39 секунд (22.03.2010 - 14:48) netruxa написал(а):
$text = '<h1>teg h1</h1>текст любой<h1>teg h2</h1>';
preg_match_all('/<h1>(.*?)<\/h1>/', $text, $matches);
print_r($matches);
в массиве $matches[1] будут все слова, заключенные в теги ашодин
Спустя 9 минут, 50 секунд (22.03.2010 - 14:58) silius написал(а):
netruxa, спасибо за ответ, но...
что здесь не правильно:
твой код всё правильно и красиво выдаёт:
но мой код выбивает только это:
что здесь не правильно:
$parsing=file_get_contents($GLOBALS[url_mobile]);
preg_match_all("/<h1>(.*?)<\/h1>/", $parsing, $full_link);
print_r ($full_link);
твой код всё правильно и красиво выдаёт:
Array ( [0] => Array ( [0] => teg h1 [1] => teg h2) [1] => Array ( [0] => teg h1 [1] => teg h2 ) )
но мой код выбивает только это:
Array ( [0] => Array ( ) [1] => Array ( ) )
Спустя 17 минут, 9 секунд (22.03.2010 - 15:15) krasilich написал(а):
Если документ, который скачиваешь в utf8 лучше добавить модификатор u к регулярке.
Спустя 9 минут, 17 секунд (22.03.2010 - 15:24) silius написал(а):
krasilich, спасибо за совет, но всетаки, где проблема в моём коде?
Спустя 18 минут, 56 секунд (22.03.2010 - 15:43) krasilich написал(а):
//вот так не работает?
preg_match_all("/<h1>(.*?)<\/h1>/u", $parsing, $full_link);
//или так
preg_match_all("/<h1>(.*?)<\/h1>/s", $parsing, $full_link);
//а можно и так попробывать=)
preg_match_all("/<h1>(.*?)<\/h1>/su", $parsing, $full_link);
Спустя 4 минуты, 27 секунд (22.03.2010 - 15:48) silius написал(а):
krasilich
да в том то и дело, что не пашет, пробовал вывести $parsing(думал, может переменную на видит), все ок, выводит страницу, а регулярка не подхватывает
да в том то и дело, что не пашет, пробовал вывести $parsing(думал, может переменную на видит), все ок, выводит страницу, а регулярка не подхватывает

Спустя 15 минут, 22 секунды (22.03.2010 - 16:03) krasilich написал(а):
Какой урл тут? $GLOBALS[url_mobile]
Спустя 5 минут, 41 секунда (22.03.2010 - 16:09) silius написал(а):

я понял, что проблема в кодировке, но модификатор не помогает
кодировка страницы, которую стягиваю: utf-8
Спустя 3 минуты, 24 секунды (22.03.2010 - 16:12) silius написал(а):
Спустя 3 минуты, 6 секунд (22.03.2010 - 16:15) silius написал(а):
ПОНЯЛ я свою ошибку, но возник опят таки вопрос, как мне пропарсить страницы вида
http://site/page_1/
http://site/page_1/
Спустя 1 час, 5 минут, 45 секунд (22.03.2010 - 17:21) Игорь_Vasinsky написал(а):
Цитата |
Вопрос таков: Как пропарсить страницы вида: site/page/ ? |
Спустя 1 час, 35 минут, 8 секунд (22.03.2010 - 18:56) silius написал(а):
Вообщем, кто будет парсить сайты, внимательней исследуйте исходные страницы сайтов, потому что продолбаетесь как я целый день, недоглядев пробела!!!!!!!!!!
СПАСИБО ВСЕМ ОГРОМНОЕ!!!! Тема закрыта!

СПАСИБО ВСЕМ ОГРОМНОЕ!!!! Тема закрыта!
_____________
Windows - уникальная операционная система: в ней выключение компьютера начинается с нажатия кнопки ПУСК.