[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Регулярые...
apc
Нужно найти текст такого плана:
{+тут только англ. буквы и цифры+}
+ - не учитывать я их просто так написал
спасибо



Спустя 28 минут, 49 секунд (1.04.2009 - 15:02) twin написал(а):
/^[a-z0-9]+$/i

Спустя 4 минуты, 45 секунд (1.04.2009 - 15:07) apc написал(а):
спасибо(бульк)
но я тут что то символа { не вижу, или /^ - {,а $/i - }

Спустя 6 минут, 4 секунды (1.04.2009 - 15:13) twin написал(а):
Я думал это просто скобки biggrin.gif Тогда так наверно:

/{[a-z0-9]+}/i

Спустя 9 минут, 9 секунд (1.04.2009 - 15:22) apc написал(а):
что то так не работает
PHP
$text 'fj jgj jdsk jfsdjf ; sdfj klds f sdjf lksaj {sd} , dsjflkj sdlk {weqw2} sa';
preg_replace("/{[a-z0-9]+}/i"'work'$text);
echo 
$text;

Спустя 7 часов, 50 минут, 1 секунда (1.04.2009 - 23:12) kirik написал(а):
apc
PHP
$text 'fj jgj jdsk jfsdjf ; sdfj klds f sdjf lksaj {sd} , dsjflkj sdlk {weqw2} sa';
$text preg_replace("/{[a-z0-9]+}/i"'work'$text);
echo 
$text;

Спустя 19 дней, 19 часов, 16 минут, 16 секунд (21.04.2009 - 18:28) Grazor написал(а):
Цитата (twin @ 1.04.2009 - 15:13)
/{[a-z0-9]+}/i


ээ... может тогда не +, а *, у нас же не один символ
PHP
/{[a-z0-9]*}/<


*/i вконце - оно почему-то на /< заменяется mad.gif

Спустя 1 месяц, 10 дней, 21 час, 24 минуты, 22 секунды (1.06.2009 - 15:52) разум написал(а):
Господа, нуждаюсь в помощи. Уже не первый час бьюсь, толку 0.
Есть страница, получаемая curl'ом
в странице повторяется такой код
Цитата
<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td>
  <td class="row4 med tLeft">
  <a class="genmed"  href="./viewtopic.php?t=310455"><b>Шершни из ада / Hornets From Hell [2002, SatRip]</b></a>
</td>
  <td class="row1"><a class="med" href="tracker.php?pid=9231">oia</a></td>
  <td class="row4 med nowrap"><a class="med dLink" href="./download.php?id=260209">[<span class="dlSp"> </span><span class="bold" onclick="this.className='normal'">DL</span><span class="dlSp"> </span>]</a></td>
<td class="row4 small nowrap">729&nbsp;MB</td>
<td class="row4 seedmed" title=" Last seen:
Never"><b>0</b></td>
<td class="row4 leechmed" title="Личеры"><b>0</b></td>
<td class="row4 small" title="Ответов: 0">0</td>
  <td class="row4 small nowrap" style="padding: 1px 3px 2px;" title="Добавлен">
  <p>10:19</p>
  <p>31-Май-09</p>
</td>

Жирным выделены те значения, которые надо выцепить. В статике (каждая строка отдельно) значение получить удается, а вот при парсинге целой страницы - нет. Буду рад помощи.

Спустя 5 часов, 13 минут, 19 секунд (1.06.2009 - 21:06) kirik написал(а):
разум
тебе составить эти 9 регулярок?

Спустя 8 часов, 9 минут, 43 секунды (2.06.2009 - 05:16) разум написал(а):
Да нет, все не надо.
Можно один пример, как из этой строки
Цитата
<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td>

в массив получить данные 521 и Животный и растительный мир.
Дальше уже разберусь по аналогии.

Спустя 4 часа, 14 минут, 37 секунд (2.06.2009 - 09:30) kirik написал(а):
Цитата (разум @ 1.06.2009 - 21:16)
Можно один пример, как из этой строки

Дзержи:
PHP
$src '<td class="row1"><a class="gen" href="tracker.php?f=521">Животный и растительный мир</a></td>
  <td class="row4 med tLeft">
  <a class="genmed"  href="./viewtopic.php?t=310455"><b>Шершни из ада / Hornets From Hell [2002, SatRip]</b></a>
</td>'
;

preg_match_all('/\<a[^\>]+href=([\'"])tracker\.php\?f=(\d+)\\1[^\>]*>([^\<]+)\<\/a\>/is'$src$outPREG_SET_ORDER);
print_r($out);

Спустя 7 часов, 51 минута, 26 секунд (2.06.2009 - 17:22) разум написал(а):
Благодарю, вроде разобрался.

Спустя 2 часа, 46 минут, 59 секунд (2.06.2009 - 20:09) разум написал(а):
Встал вопрос с такой строкой:
Цитата
  <a class="genmed"  href="./viewtopic.php?t=310455"><b>Шершни из ада / Hornets From Hell [2002, SatRip]</b></a>

В начале были проблемы с тегами <b>, кое-как решил, но видимо криво:
Код
preg_match_all('/\<a[^\>]+href=([\'"]).\/viewtopic\.php\?t=(\d+)\\1[^\>]*><b>([^\<]+)\<\/b\>\<\/a\>/is', $page, $out2, PREG_SET_ORDER);

Теперь не воспринимаются названия начинающиеся на [ т.е. к примеру [123]blah-blah.

Спустя 58 минут, 55 секунд (2.06.2009 - 21:07) kirik написал(а):
Цитата (разум @ 2.06.2009 - 12:09)
Теперь не воспринимаются названия начинающиеся на [ т.е. к примеру [123]blah-blah.

Приведи пример, какая ссылка не парсится.. У меня все ОК!

Спустя 9 часов, 2 минуты, 35 секунд (3.06.2009 - 06:10) разум написал(а):
Действительно, тут дело в другом, почему-то, если смотреть исходники страницы, в некоторых названиях встречается одиночный тег <wbr>
Получается строка такого плана:
Цитата
<a class="genmed"  href="./viewtopic.php?t=311534"><b>НЕДЕЛЯ в НБА с В.ГОМЕЛЬСКИМ<wbr> на НТВ+ [26.05.2009, Баскетбол , TVRip] [2009, TVRip]</b></a>

Что можно сделать с этим тегом, чтобы он игнорировался?

Спустя 28 минут, 59 секунд (3.06.2009 - 06:39) kirik написал(а):
Такая регулярка должна подойти:
Код
/\<a[^\>]+href=([\'"])\.\/viewtopic\.php\?t=(\d+)\\1[^\>]*>\<b\>(.+?)\<\/b\>\<\/a\>/is

Спустя 3 часа, 2 минуты, 21 секунда (3.06.2009 - 09:41) разум написал(а):
С <wbr> так и не видит.
Теперь встала еще одна проблема, он не выводит если перед тегом <b> стоит &nbsp;
пример:
Цитата
<a class="genmed"  href="./viewtopic.php?t=964"><img src="images/tor_gold.gif" width="16" height="15" title="Золото" />&nbsp;<b>Tom Clancy's Rainbow Six: Vegas 2</b></a>


Спустя 32 минуты, 41 секунда (3.06.2009 - 10:14) kirik написал(а):
разум
напиши вот так:
Код
'/\<a[^\>]+href=([\'"])\.\/viewtopic\.php\?t=(\d+)\\1[^\>]*>(.+?)\<\/a\>/is'

и потом для каждого элемента striptags()

Спустя 5 часов, 13 минут, 32 секунды (3.06.2009 - 15:28) разум написал(а):
Огромное спасибо, работает.
Последний вопрос.
Цитата
<a class="genmed"  href="./viewtopic.php?t=1133"><img src="images/tor_gold.gif" width="16" height="15" title="Золото" />&nbsp;<b>Snowboarding<wbr> Championship<wbr> 2004</b></a>

На этой строке он стопорится из-за тега <img>, не поможете?

Спустя 3 часа, 17 минут, 8 секунд (3.06.2009 - 18:45) kirik написал(а):
Цитата (разум @ 3.06.2009 - 07:28)
На этой строке он стопорится из-за тега <img>, не поможете?

С предыдущей регуляркой все красиво вытаскивается..
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.