[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Регулярное выражение
silius
1 вопрос(решён) Спасибо всем, кто в этом участвовал smile.gif
Всем привет, вообщем такой вопрос:
есть строка, из неё нужно выбрать все подстроки, которые находятся в тегах <h1></h1>.
Чего то не получаеться регулярку написать, помогите плиз. sad.gif

2 вопрос(решён) Спасибо всем!!!
Сделаю вывод, и задам вопрос, который у меня появился в ходе выяснения проблемы, чтобы не заводить другую тему!
Вопрос таков:
Как пропарсить страницы вида: site/page/ ?



Спустя 5 минут, 39 секунд (22.03.2010 - 14:48) netruxa написал(а):
$text = '<h1>teg h1</h1>текст любой<h1>teg h2</h1>';
preg_match_all('/<h1>(.*?)<\/h1>/', $text, $matches);
print_r($matches);

в массиве $matches[1] будут все слова, заключенные в теги ашодин

Спустя 9 минут, 50 секунд (22.03.2010 - 14:58) silius написал(а):
netruxa, спасибо за ответ, но...
что здесь не правильно:

$parsing=file_get_contents($GLOBALS[url_mobile]);
preg_match_all("/<h1>(.*?)<\/h1>/", $parsing, $full_link);
print_r ($full_link);

твой код всё правильно и красиво выдаёт:
Array ( [0] => Array ( [0] => teg h1 [1] => teg h2) [1] => Array ( [0] => teg h1 [1] => teg h2 ) )

но мой код выбивает только это:
Array ( [0] => Array ( ) [1] => Array ( ) )

Спустя 17 минут, 9 секунд (22.03.2010 - 15:15) krasilich написал(а):
Если документ, который скачиваешь в utf8 лучше добавить модификатор u к регулярке.

Спустя 9 минут, 17 секунд (22.03.2010 - 15:24) silius написал(а):
krasilich, спасибо за совет, но всетаки, где проблема в моём коде?

Спустя 18 минут, 56 секунд (22.03.2010 - 15:43) krasilich написал(а):
//вот так не работает?
preg_match_all("/<h1>(.*?)<\/h1>/u", $parsing, $full_link);

//или так

preg_match_all("/<h1>(.*?)<\/h1>/s", $parsing, $full_link);

//а можно и так попробывать=)

preg_match_all("/<h1>(.*?)<\/h1>/su", $parsing, $full_link);

Спустя 4 минуты, 27 секунд (22.03.2010 - 15:48) silius написал(а):
krasilich
да в том то и дело, что не пашет, пробовал вывести $parsing(думал, может переменную на видит), все ок, выводит страницу, а регулярка не подхватывает sad.gif

Спустя 15 минут, 22 секунды (22.03.2010 - 16:03) krasilich написал(а):
Какой урл тут? $GLOBALS[url_mobile]

Спустя 5 минут, 41 секунда (22.03.2010 - 16:09) silius написал(а):
smile.gif
я понял, что проблема в кодировке, но модификатор не помогает

кодировка страницы, которую стягиваю: utf-8

Спустя 3 минуты, 24 секунды (22.03.2010 - 16:12) silius написал(а):

Спустя 3 минуты, 6 секунд (22.03.2010 - 16:15) silius написал(а):
ПОНЯЛ я свою ошибку, но возник опят таки вопрос, как мне пропарсить страницы вида
http://site/page_1/

Спустя 1 час, 5 минут, 45 секунд (22.03.2010 - 17:21) Игорь_Vasinsky написал(а):
Цитата
Вопрос таков:
Как пропарсить страницы вида: site/page/ ?


вот тут же тема и раскрыта:

http://phpforum.ru/index.php?showtopic=26899&st=30

Спустя 1 час, 35 минут, 8 секунд (22.03.2010 - 18:56) silius написал(а):
Вообщем, кто будет парсить сайты, внимательней исследуйте исходные страницы сайтов, потому что продолбаетесь как я целый день, недоглядев пробела!!!!!!!!!! wink.gif

СПАСИБО ВСЕМ ОГРОМНОЕ!!!! Тема закрыта!


_____________
Windows - уникальная операционная система: в ней выключение компьютера начинается с нажатия кнопки ПУСК.
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.