[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Регулярное выражения для поиска тега А в noindex
alexbel2404
Текст для примера

<noindex>000</noindex><a href="">Бббббббббб</a><noindex>111</noindex>
<a
href="http://www.site.ru/35461-diktator.html" title="Диктатор трейлер" alt="Диктатор трейлер">Диктатор трейлер</a>
<noindex>
222<a href="">Бббббббббб</a>333</noindex>

Есть регулярка
(<noindex.*?>|).*?(<a.*?href=\".*?\".*?>)(.*?)</a>.*(</noindex.*?>|)

Под нее подходят все 3 строки, мне нужно, чтоб в первой строке вытянулся только тег А, потому что он не обернут в noindex, т.е. так:

<a href="">Бббббббббб</a>
<a
href="http://www.site.ru/35461-diktator.html" title="Диктатор трейлер" alt="Диктатор трейлер">Диктатор трейлер</a>
<noindex>
222<a href="">Бббббббббб</a>333</noindex>


Есть соображения?)



Спустя 4 часа, 57 минут, 12 секунд (15.04.2012 - 22:09) m4a1fox написал(а):

$(document).ready(function(){
$('a').each(function(){
alert($(this).text());
})

})


Спустя 1 минута, 14 секунд (15.04.2012 - 22:10) alexbel2404 написал(а):
это еще что?))) совсем не по теме)

Спустя 4 минуты, 6 секунд (15.04.2012 - 22:14) m4a1fox написал(а):
alexbel2404
Цитата
это еще что?))) совсем не по теме)

Да? Ок! Не обращай внимание.

Спустя 12 минут, 59 секунд (15.04.2012 - 22:27) killer8080 написал(а):
alexbel2404
нужны ссылки которые не входят в noindex?

Спустя 7 минут, 54 секунды (15.04.2012 - 22:35) alexbel2404 написал(а):
мне нужно найти определенную ссылку в html'e и определить, заключена она в тег <noindex> или нет

Спустя 16 минут, 23 секунды (15.04.2012 - 22:52) killer8080 написал(а):
Цитата (alexbel2404 @ 15.04.2012 - 23:35)
мне нужно найти определенную ссылку в html'e

что значит определенную? по каким признакам она должна определятся?

Спустя 4 минуты, 16 секунд (15.04.2012 - 22:56) killer8080 написал(а):
можно просто найти все ссылки в noindex

Спустя 8 часов, 18 минут, 31 секунда (16.04.2012 - 07:14) alexbel2404 написал(а):
ну есть урл site.com, его нужно найти на странице, если найден, то нужно еще проверить, не закрыт ли он для индексирования)

Спустя 6 часов, 40 минут, 36 секунд (16.04.2012 - 13:55) alexbel2404 написал(а):
может у кого есть другие соображения по этому поводу? не так, как я это задумал реализовать

Спустя 2 часа, 53 минуты, 12 секунд (16.04.2012 - 16:48) killer8080 написал(а):
alexbel2404
в одну регулярку не знаю, как вариант можно так
$t = '  
<noindex>000</noindex>
<a href="">Бббббббббб</a>
<noindex>111</noindex>
<a href="http://www.site.ru/35461-diktator.html" title="Диктатор трейлер" alt="Диктатор трейлер">Диктатор трейлер</a>
<noindex>222<br/>
<a href="">Бббббббббб</a>333 <a href="http://site.com">link</a>
<a href="http://site2.com">link2</a>
</noindex>'
;
$noindex_links = array();
if(preg_match_all('#<noindex[^>]*>(.*)</noindex>#isuU', $t, $m)){
if(preg_match_all('#<a.*href=([\'"])?([^\'"\s]+?)(?(1)\\1).*>.*</a>#isuU', implode('', $m[1]), $m))
$noindex_links = array_unique($m[2]);
}
unset($m);
echo '<pre>'.htmlspecialchars(print_r($noindex_links, 1)).'</pre>';

Спустя 7 дней, 2 часа, 59 минут, 8 секунд (23.04.2012 - 19:47) alexbel2404 написал(а):
killer8080
код пустой массив возвращает

я почему-то уверен, что это можно сделать одной регуляркой, тут нужен гуру инвизибл)
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.