{+тут только англ. буквы и цифры+}
+ - не учитывать я их просто так написал
спасибо
Спустя 28 минут, 49 секунд (1.04.2009 - 15:02) twin написал(а):
/^[a-z0-9]+$/i
Спустя 4 минуты, 45 секунд (1.04.2009 - 15:07) apc написал(а):
спасибо(бульк)
но я тут что то символа { не вижу, или /^ - {,а $/i - }
но я тут что то символа { не вижу, или /^ - {,а $/i - }
Спустя 6 минут, 4 секунды (1.04.2009 - 15:13) twin написал(а):
Я думал это просто скобки Тогда так наверно:
/{[a-z0-9]+}/i
/{[a-z0-9]+}/i
Спустя 9 минут, 9 секунд (1.04.2009 - 15:22) apc написал(а):
что то так не работает
PHP |
$text = 'fj jgj jdsk jfsdjf ; sdfj klds f sdjf lksaj {sd} , dsjflkj sdlk {weqw2} sa'; |
Спустя 7 часов, 50 минут, 1 секунда (1.04.2009 - 23:12) kirik написал(а):
apc
PHP |
$text = 'fj jgj jdsk jfsdjf ; sdfj klds f sdjf lksaj {sd} , dsjflkj sdlk {weqw2} sa'; |
Спустя 19 дней, 19 часов, 16 минут, 16 секунд (21.04.2009 - 18:28) Grazor написал(а):
Цитата (twin @ 1.04.2009 - 15:13) |
/{[a-z0-9]+}/i |
ээ... может тогда не +, а *, у нас же не один символ
PHP |
/{[a-z0-9]*}/< |
*/i вконце - оно почему-то на /< заменяется
Спустя 1 месяц, 10 дней, 21 час, 24 минуты, 22 секунды (1.06.2009 - 15:52) разум написал(а):
Господа, нуждаюсь в помощи. Уже не первый час бьюсь, толку 0.
Есть страница, получаемая curl'ом
в странице повторяется такой код
Есть страница, получаемая curl'ом
в странице повторяется такой код
Цитата |
<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td> <td class="row4 med tLeft"> <a class="genmed" href="./viewtopic.php?t=310455"><b>Шершни из ада / Hornets From Hell [2002, SatRip]</b></a> </td> <td class="row1"><a class="med" href="tracker.php?pid=9231">oia</a></td> <td class="row4 med nowrap"><a class="med dLink" href="./download.php?id=260209">[<span class="dlSp"> </span><span class="bold" onclick="this.className='normal'">DL</span><span class="dlSp"> </span>]</a></td> <td class="row4 small nowrap">729 MB</td> <td class="row4 seedmed" title=" Last seen: Never"><b>0</b></td> <td class="row4 leechmed" title="Личеры"><b>0</b></td> <td class="row4 small" title="Ответов: 0">0</td> <td class="row4 small nowrap" style="padding: 1px 3px 2px;" title="Добавлен"> <p>10:19</p> <p>31-Май-09</p> </td> |
Жирным выделены те значения, которые надо выцепить. В статике (каждая строка отдельно) значение получить удается, а вот при парсинге целой страницы - нет. Буду рад помощи.
Спустя 5 часов, 13 минут, 19 секунд (1.06.2009 - 21:06) kirik написал(а):
разум
тебе составить эти 9 регулярок?
тебе составить эти 9 регулярок?
Спустя 8 часов, 9 минут, 43 секунды (2.06.2009 - 05:16) разум написал(а):
Да нет, все не надо.
Можно один пример, как из этой строки
Можно один пример, как из этой строки
Цитата |
<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td> |
в массив получить данные 521 и Животный и растительный мир.
Дальше уже разберусь по аналогии.
Спустя 4 часа, 14 минут, 37 секунд (2.06.2009 - 09:30) kirik написал(а):
Цитата (разум @ 1.06.2009 - 21:16) |
Можно один пример, как из этой строки |
Дзержи:
PHP |
$src = '<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td> |
Спустя 7 часов, 51 минута, 26 секунд (2.06.2009 - 17:22) разум написал(а):
Благодарю, вроде разобрался.
Спустя 2 часа, 46 минут, 59 секунд (2.06.2009 - 20:09) разум написал(а):
Встал вопрос с такой строкой:
Цитата |
<a class="genmed" href="./viewtopic.php?t=310455"><b>Шершни из ада / Hornets From Hell [2002, SatRip]</b></a> |
В начале были проблемы с тегами <b>, кое-как решил, но видимо криво:
Код |
preg_match_all('/\<a[^\>]+href=([\'"]).\/viewtopic\.php\?t=(\d+)\\1[^\>]*><b>([^\<]+)\<\/b\>\<\/a\>/is', $page, $out2, PREG_SET_ORDER); |
Теперь не воспринимаются названия начинающиеся на [ т.е. к примеру [123]blah-blah.
Спустя 58 минут, 55 секунд (2.06.2009 - 21:07) kirik написал(а):
Цитата (разум @ 2.06.2009 - 12:09) |
Теперь не воспринимаются названия начинающиеся на [ т.е. к примеру [123]blah-blah. |
Приведи пример, какая ссылка не парсится.. У меня все ОК!
Спустя 9 часов, 2 минуты, 35 секунд (3.06.2009 - 06:10) разум написал(а):
Действительно, тут дело в другом, почему-то, если смотреть исходники страницы, в некоторых названиях встречается одиночный тег <wbr>
Получается строка такого плана:
Получается строка такого плана:
Цитата |
<a class="genmed" href="./viewtopic.php?t=311534"><b>НЕДЕЛЯ в НБА с В.ГОМЕЛЬСКИМ<wbr> на НТВ+ [26.05.2009, Баскетбол , TVRip] [2009, TVRip]</b></a> |
Что можно сделать с этим тегом, чтобы он игнорировался?
Спустя 28 минут, 59 секунд (3.06.2009 - 06:39) kirik написал(а):
Такая регулярка должна подойти:
Код |
/\<a[^\>]+href=([\'"])\.\/viewtopic\.php\?t=(\d+)\\1[^\>]*>\<b\>(.+?)\<\/b\>\<\/a\>/is |
Спустя 3 часа, 2 минуты, 21 секунда (3.06.2009 - 09:41) разум написал(а):
С <wbr> так и не видит.
Теперь встала еще одна проблема, он не выводит если перед тегом <b> стоит
пример:
Теперь встала еще одна проблема, он не выводит если перед тегом <b> стоит
пример:
Цитата |
<a class="genmed" href="./viewtopic.php?t=964"><img src="images/tor_gold.gif" width="16" height="15" title="Золото" /> <b>Tom Clancy's Rainbow Six: Vegas 2</b></a> |
Спустя 32 минуты, 41 секунда (3.06.2009 - 10:14) kirik написал(а):
разум
напиши вот так:
напиши вот так:
Код |
'/\<a[^\>]+href=([\'"])\.\/viewtopic\.php\?t=(\d+)\\1[^\>]*>(.+?)\<\/a\>/is' |
и потом для каждого элемента striptags()
Спустя 5 часов, 13 минут, 32 секунды (3.06.2009 - 15:28) разум написал(а):
Огромное спасибо, работает.
Последний вопрос.
Последний вопрос.
Цитата |
<a class="genmed" href="./viewtopic.php?t=1133"><img src="images/tor_gold.gif" width="16" height="15" title="Золото" /> <b>Snowboarding<wbr> Championship<wbr> 2004</b></a> |
На этой строке он стопорится из-за тега <img>, не поможете?
Спустя 3 часа, 17 минут, 8 секунд (3.06.2009 - 18:45) kirik написал(а):
Цитата (разум @ 3.06.2009 - 07:28) |
На этой строке он стопорится из-за тега <img>, не поможете? |
С предыдущей регуляркой все красиво вытаскивается..