Форум PHP программистов

[ Поиск ] - [ Пользователи ] - [ Календарь ]

Полная Версия: Регулярые...

apc

1.04.2009 - 15:33

Нужно найти текст такого плана:
{+тут только англ. буквы и цифры+}
+ - не учитывать я их просто так написал
спасибо

Спустя 28 минут, 49 секунд (1.04.2009 - 15:02) twin написал(а):

/^[a-z0-9]+$/i

Спустя 4 минуты, 45 секунд (1.04.2009 - 15:07) apc написал(а):

спасибо(бульк)
но я тут что то символа { не вижу, или /^ - {,а $/i - }

Спустя 6 минут, 4 секунды (1.04.2009 - 15:13) twin написал(а):

Я думал это просто скобки

Тогда так наверно:

/{[a-z0-9]+}/i

Спустя 9 минут, 9 секунд (1.04.2009 - 15:22) apc написал(а):

что то так не работает

PHP

$text = 'fj jgj jdsk jfsdjf ; sdfj klds f sdjf lksaj {sd} , dsjflkj sdlk {weqw2} sa';
preg_replace("/{[a-z0-9]+}/i", 'work', $text);
echo $text;

Спустя 7 часов, 50 минут, 1 секунда (1.04.2009 - 23:12) kirik написал(а):

apc

PHP

$text = 'fj jgj jdsk jfsdjf ; sdfj klds f sdjf lksaj {sd} , dsjflkj sdlk {weqw2} sa';
$text = preg_replace("/{[a-z0-9]+}/i", 'work', $text);
echo $text;

Спустя 19 дней, 19 часов, 16 минут, 16 секунд (21.04.2009 - 18:28) Grazor написал(а):

Цитата (twin @ 1.04.2009 - 15:13)

/{[a-z0-9]+}/i

ээ... может тогда не +, а *, у нас же не один символ

PHP

/{[a-z0-9]*}/<

*/i вконце - оно почему-то на /< заменяется

Спустя 1 месяц, 10 дней, 21 час, 24 минуты, 22 секунды (1.06.2009 - 15:52) разум написал(а):

Господа, нуждаюсь в помощи. Уже не первый час бьюсь, толку 0.
Есть страница, получаемая curl'ом
в странице повторяется такой код

Цитата

<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td>
<td class="row4 med tLeft">
<a class="genmed" href="./viewtopic.php?t=310455">Шершни из ада / Hornets From Hell [2002, SatRip]</a>
</td>
<td class="row1"><a class="med" href="tracker.php?pid=9231">oia</a></td>
<td class="row4 med nowrap"><a class="med dLink" href="./download.php?id=260209">[ DL ]</a></td>
<td class="row4 small nowrap">729 MB</td>
<td class="row4 seedmed" title=" Last seen:
Never">0</td>
<td class="row4 leechmed" title="Личеры">0</td>
<td class="row4 small" title="Ответов: 0">0</td>
<td class="row4 small nowrap" style="padding: 1px 3px 2px;" title="Добавлен">
10:19
31-Май-09
</td>

Жирным выделены те значения, которые надо выцепить. В статике (каждая строка отдельно) значение получить удается, а вот при парсинге целой страницы - нет. Буду рад помощи.

Спустя 5 часов, 13 минут, 19 секунд (1.06.2009 - 21:06) kirik написал(а):

разум
тебе составить эти 9 регулярок?

Спустя 8 часов, 9 минут, 43 секунды (2.06.2009 - 05:16) разум написал(а):

Да нет, все не надо.
Можно один пример, как из этой строки

Цитата

<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td>

в массив получить данные 521 и Животный и растительный мир.
Дальше уже разберусь по аналогии.

Спустя 4 часа, 14 минут, 37 секунд (2.06.2009 - 09:30) kirik написал(а):

Цитата (разум @ 1.06.2009 - 21:16)

Можно один пример, как из этой строки

Дзержи:

PHP

$src = '<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td>
  <td class="row4 med tLeft">
  <a class="genmed"  href="./viewtopic.php?t=310455"><b>Шершни из ада / Hornets From Hell [2002, SatRip]</b></a>
</td>';

preg_match_all('/\<a[^\>]+href=([\'"])tracker\.php\?f=(\d+)\\1[^\>]*>([^\<]+)\<\/a\>/is', $src, $out, PREG_SET_ORDER);
print_r($out);

Спустя 7 часов, 51 минута, 26 секунд (2.06.2009 - 17:22) разум написал(а):

Благодарю, вроде разобрался.

Спустя 2 часа, 46 минут, 59 секунд (2.06.2009 - 20:09) разум написал(а):

Встал вопрос с такой строкой:

Цитата

<a class="genmed" href="./viewtopic.php?t=310455">Шершни из ада / Hornets From Hell [2002, SatRip]</a>

В начале были проблемы с тегами , кое-как решил, но видимо криво:

Код

preg_match_all('/\<a[^\>]+href=([\'"]).\/viewtopic\.php\?t=(\d+)\\1[^\>]*>([^\<]+)\<\/b\>\<\/a\>/is', $page, $out2, PREG_SET_ORDER);

Теперь не воспринимаются названия начинающиеся на [ т.е. к примеру [123]blah-blah.

Спустя 58 минут, 55 секунд (2.06.2009 - 21:07) kirik написал(а):

Цитата (разум @ 2.06.2009 - 12:09)

Теперь не воспринимаются названия начинающиеся на [ т.е. к примеру [123]blah-blah.

Приведи пример, какая ссылка не парсится.. У меня все ОК!

Спустя 9 часов, 2 минуты, 35 секунд (3.06.2009 - 06:10) разум написал(а):

Действительно, тут дело в другом, почему-то, если смотреть исходники страницы, в некоторых названиях встречается одиночный тег 
Получается строка такого плана:

Цитата

<a class="genmed" href="./viewtopic.php?t=311534">НЕДЕЛЯ в НБА с В.ГОМЕЛЬСКИМ на НТВ+ [26.05.2009, Баскетбол , TVRip] [2009, TVRip]</a>

Что можно сделать с этим тегом, чтобы он игнорировался?

Спустя 28 минут, 59 секунд (3.06.2009 - 06:39) kirik написал(а):

Такая регулярка должна подойти:

Код

/\<a[^\>]+href=([\'"])\.\/viewtopic\.php\?t=(\d+)\\1[^\>]*>\<b\>(.+?)\<\/b\>\<\/a\>/is

Спустя 3 часа, 2 минуты, 21 секунда (3.06.2009 - 09:41) разум написал(а):

С так и не видит.
Теперь встала еще одна проблема, он не выводит если перед тегом стоит  
пример:

Цитата

<a class="genmed" href="./viewtopic.php?t=964"><img src="images/tor_gold.gif" width="16" height="15" title="Золото" /> Tom Clancy's Rainbow Six: Vegas 2</a>

Спустя 32 минуты, 41 секунда (3.06.2009 - 10:14) kirik написал(а):

разум
напиши вот так:

Код

'/\<a[^\>]+href=([\'"])\.\/viewtopic\.php\?t=(\d+)\\1[^\>]*>(.+?)\<\/a\>/is'

и потом для каждого элемента striptags()

Спустя 5 часов, 13 минут, 32 секунды (3.06.2009 - 15:28) разум написал(а):

Огромное спасибо, работает.
Последний вопрос.

Цитата

<a class="genmed" href="./viewtopic.php?t=1133"><img src="images/tor_gold.gif" width="16" height="15" title="Золото" /> Snowboarding Championship 2004</a>

На этой строке он стопорится из-за тега <img>, не поможете?

Спустя 3 часа, 17 минут, 8 секунд (3.06.2009 - 18:45) kirik написал(а):

Цитата (разум @ 3.06.2009 - 07:28)

На этой строке он стопорится из-за тега <img>, не поможете?

С предыдущей регуляркой все красиво вытаскивается..

Быстрый ответ:

Здесь расположена полная версия этой страницы.