Форум PHP программистов > Регулярное выражение

[ Поиск ] - [ Пользователи ] - [ Календарь ]

silius

22.03.2010 - 15:42

1 вопрос(решён) Спасибо всем, кто в этом участвовал

Всем привет, вообщем такой вопрос:
есть строка, из неё нужно выбрать все подстроки, которые находятся в тегах <h1></h1>.
Чего то не получаеться регулярку написать, помогите плиз.

2 вопрос(решён) Спасибо всем!!!
Сделаю вывод, и задам вопрос, который у меня появился в ходе выяснения проблемы, чтобы не заводить другую тему!
Вопрос таков:
Как пропарсить страницы вида: site/page/ ?

Спустя 5 минут, 39 секунд (22.03.2010 - 14:48) netruxa написал(а):

$text = '<h1>teg h1</h1>текст любой<h1>teg h2</h1>';
preg_match_all('/<h1>(.*?)<\/h1>/', $text, $matches);
print_r($matches);

в массиве $matches[1] будут все слова, заключенные в теги ашодин

Спустя 9 минут, 50 секунд (22.03.2010 - 14:58) silius написал(а):

netruxa, спасибо за ответ, но...
что здесь не правильно:


$parsing=file_get_contents($GLOBALS[url_mobile]);
preg_match_all("/<h1>(.*?)<\/h1>/", $parsing, $full_link);
print_r ($full_link);

твой код всё правильно и красиво выдаёт:

Array ( [0] => Array ( [0] => teg h1 [1] => teg h2) [1] => Array ( [0] => teg h1 [1] => teg h2 ) )

но мой код выбивает только это:

Array ( [0] => Array ( ) [1] => Array ( ) )

Спустя 17 минут, 9 секунд (22.03.2010 - 15:15) krasilich написал(а):

Если документ, который скачиваешь в utf8 лучше добавить модификатор u к регулярке.

Спустя 9 минут, 17 секунд (22.03.2010 - 15:24) silius написал(а):

krasilich, спасибо за совет, но всетаки, где проблема в моём коде?

Спустя 18 минут, 56 секунд (22.03.2010 - 15:43) krasilich написал(а):

//вот так не работает?
preg_match_all("/<h1>(.*?)<\/h1>/u", $parsing, $full_link);

//или так

preg_match_all("/<h1>(.*?)<\/h1>/s", $parsing, $full_link);

//а можно и так попробывать=)

preg_match_all("/<h1>(.*?)<\/h1>/su", $parsing, $full_link);

Спустя 4 минуты, 27 секунд (22.03.2010 - 15:48) silius написал(а):

krasilich
да в том то и дело, что не пашет, пробовал вывести $parsing(думал, может переменную на видит), все ок, выводит страницу, а регулярка не подхватывает

Спустя 15 минут, 22 секунды (22.03.2010 - 16:03) krasilich написал(а):

Какой урл тут? $GLOBALS[url_mobile]

Спустя 5 минут, 41 секунда (22.03.2010 - 16:09) silius написал(а):

я понял, что проблема в кодировке, но модификатор не помогает

кодировка страницы, которую стягиваю: utf-8

Спустя 3 минуты, 24 секунды (22.03.2010 - 16:12) silius написал(а):

урл тут

Спустя 3 минуты, 6 секунд (22.03.2010 - 16:15) silius написал(а):

ПОНЯЛ я свою ошибку, но возник опят таки вопрос, как мне пропарсить страницы вида
http://site/page_1/

Спустя 1 час, 5 минут, 45 секунд (22.03.2010 - 17:21) Игорь_Vasinsky написал(а):

Цитата

Вопрос таков:
Как пропарсить страницы вида: site/page/ ?

вот тут же тема и раскрыта:

http://phpforum.ru/index.php?showtopic=26899&st=30

Спустя 1 час, 35 минут, 8 секунд (22.03.2010 - 18:56) silius написал(а):

Вообщем, кто будет парсить сайты, внимательней исследуйте исходные страницы сайтов, потому что продолбаетесь как я целый день, недоглядев пробела!!!!!!!!!!

СПАСИБО ВСЕМ ОГРОМНОЕ!!!! Тема закрыта!

_____________
Windows - уникальная операционная система: в ней выключение компьютера начинается с нажатия кнопки ПУСК.

Быстрый ответ:

Здесь расположена полная версия этой страницы.