[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: ссылки в <noindex>
tvix
Я хочу определить если на странице ссылки, расположенные в тегах <noindex>...</noindex>
Как найти все теги <noindex> которые есть на странице и посмотреть есть ли в них ссылки, подскажите пожалуйста????

$url_host = parse_url($url, PHP_URL_HOST);
if ( preg_match('/^www\./i', $url_host) ) $url_host = substr($url_host, 4);
$html = @file_get_contents($url);
if ( false===$html ) return false;
$xml = new DOMDocument();
@$xml->loadHTML($html);
$nonk = $xml->getElementsByTagName('noindex');




Спустя 1 час, 3 минуты, 18 секунд (27.02.2012 - 12:41) FatCat написал(а):
preg_match-ем забрать массив всего, что в ноиндексе, затем foreach, и в цикле stristr по '<a '?

Спустя 1 час, 11 минут, 51 секунда (27.02.2012 - 13:52) Игорь_Vasinsky написал(а):
$url = 'http://ссылка на страницу';
//Получили удалённую страницу в переменную
$page = file_get_contents($url);
//Распарсили регуляркой и заполнили массив
preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';

Спустя 22 минуты, 43 секунды (27.02.2012 - 14:15) Visman написал(а):
Игорь_Vasinsky, разве это [^</noindex>] будет работать в регулярке?

Спустя 3 минуты, 11 секунд (27.02.2012 - 14:18) Игорь_Vasinsky написал(а):
ну ты проверь wink.gif

Спустя 14 минут, 12 секунд (27.02.2012 - 14:32) Visman написал(а):
Игорь_Vasinsky, я вижу что это символьный класс, который может состоять из всех символов кроме <, /, n, o, i, d, e, x, >.
Или я не прав?

Спустя 1 минута, 33 секунды (27.02.2012 - 14:34) Игорь_Vasinsky написал(а):
Свернутый текст
$page = 'Тег noindex используется для запрета индексации какой-либо части текста страницы или ее кода.Пример: 
<noindex >текст или код страницы, который нужно скрыть1</noindex >. Следует заметить, что данная конструкция воспринимается
только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве атрибута
используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть2</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть3</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть4</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.Тег noindex можно использовать в нескольких случаях:
1) Полезно заключить в него коды счетчиков

К сожалению, как уже говорилось, тег noindex имеет значение только для отечественных поисковиков.Поэтому для более
гибкого управления индексацией следует также обратить внимание на метатег Robots и на файл robots.txt'
;
preg_match_all("#<noindex>([^</noindex>].*)</noindex>#iusU", $page, $links);

//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';


<pre>Array
(
[0] => Array
(
[0] => <noindex>текст или код страницы, который нужно скрыть2</noindex>
[1] => <noindex>текст или код страницы, который нужно скрыть3</noindex>
[2] => <noindex>текст или код страницы, который нужно скрыть4</noindex>
)

[1] => Array
(
[0] => текст или код страницы, который нужно скрыть2
[1] => текст или код страницы, который нужно скрыть3
[2] => текст или код страницы, который нужно скрыть4
)

)
</pre>

Спустя 8 минут, 44 секунды (27.02.2012 - 14:43) tvix написал(а):
Подскажите плиз почему не работает данная конструкция????

$url = 'http://страница';
//Получили удалённую страницу в переменную
$page = file_get_contents($url);
//Распарсили регуляркой и заполнили массив
preg_match_all("#<noindex>([^</noindex>].*)</noindex>#ius", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';


А следующая далее (ниже код)конструкция не видит границ noindex, то есть у меня есть
есть текст
<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
<noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>
получается
Array ( [0] => Ссылкаи далее по тексту2Ссылкаи далее по тексту... [1] => Ссылкаи далее по тексту2Ссылкаи далее по тексту... )

if (preg_match('|<noindex.*?>(.*)</noindex>|sei', $html, $arr))
{
print_r ($arr);
}

Подскажите как изменить регулярное выражение,чтобы оно записывало содержание всех <noindex> на странице?????????????

Спустя 6 минут, 48 секунд (27.02.2012 - 14:50) Visman написал(а):
Игорь_Vasinsky, главное тут U tongue.gif

tvix, посмотри свернутый текст от Игорь_Vasinsky.

Спустя 5 минут, 14 секунд (27.02.2012 - 14:55) Игорь_Vasinsky написал(а):
$page = "<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
<noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>"
;

preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);

//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';



<pre>Array
(
[0] => Array
(
[0] => <noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
[1] => <noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>
)

[1] => Array
(
[0] => Ссылка</A>и далее по тексту
[1] => 2Ссылка</A>и далее по тексту...
)

)
</pre>


Спустя 1 минута, 22 секунды (27.02.2012 - 14:56) Игорь_Vasinsky написал(а):
пофиксил wink.gif

Спустя 6 минут, 48 секунд (27.02.2012 - 15:03) bob marley написал(а):
Цитата (Игорь_Vasinsky @ 27.02.2012 - 11:55)
$page = "<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
<noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>";

preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);

//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';


Люди,зачем здесь регулярные выражения,когда есть функция EXPLODE() ,скажите мне на милость?!

Спустя 1 минута, 10 секунд (27.02.2012 - 15:04) bob marley написал(а):
Цитата (tvix @ 27.02.2012 - 11:43)
$url = 'http://страница';
//Получили удалённую страницу в переменную
$page = file_get_contents($url);
//Распарсили регуляркой и заполнили массив
preg_match_all("#<noindex>([^</noindex>].*)</noindex>#ius", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';


Сколько раз не пробовал file_get_contents не выполняется если запрос с полным url!
И ещё раз повторю что регулрки не нужны,когда есть explode()

Спустя 2 минуты, 52 секунды (27.02.2012 - 15:07) Visman написал(а):
Цитата (bob marley @ 27.02.2012 - 20:03)
Люди,зачем здесь регулярные выражения,когда есть функция EXPLODE() ,скажите мне на милость?!

Пример на том же тексте можно привести?

Цитата (bob marley @ 27.02.2012 - 20:03)
Сколько раз не пробовал file_get_contents не выполняется если запрос с полным url!

Запрет функции работать с внешними источниками?

Спустя 18 секунд (27.02.2012 - 15:07) Игорь_Vasinsky написал(а):
покажи..мне интересно стало.

Спустя 1 минута, 18 секунд (27.02.2012 - 15:09) bob marley написал(а):
Visman
Пример приведу,подожди не много.

Запрещено или нет не в курсе.Но работать,по крайней мере у меня,отказывается.Попробуй тоже не полный путь прописать.

Спустя 4 минуты, 17 секунд (27.02.2012 - 15:13) Игорь_Vasinsky написал(а):
может быть она запрещена в php.ini.

Спустя 5 минут, 19 секунд (27.02.2012 - 15:18) bob marley написал(а):
На нормальный пример времени нет,я занят..Вот так вот можно:
Свернутый текст

<?php
$page = "<noindex>|<A href='/1.php'>Ссылка</A>и далее по тексту|</noindex>
<noindex>|<A href='/2.php'>2Ссылка</A>и далее по тексту...|</noindex>"
;
$array = explode('|', $page);
print_r($array);

Спустя 2 минуты, 14 секунд (27.02.2012 - 15:20) Игорь_Vasinsky написал(а):
:D :D :D :D :D :D :D

Эту переменную обработай

$page = 'Тег noindex используется для запрета индексации какой-либо части текста страницы или ее кода.Пример: 
<noindex >текст или код страницы, который нужно скрыть1</noindex >. Следует заметить, что данная конструкция воспринимается
только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве атрибута
используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть2</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть3</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть4</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.Тег noindex можно использовать в нескольких случаях:
1) Полезно заключить в него коды счетчиков

К сожалению, как уже говорилось, тег noindex имеет значение только для отечественных поисковиков.Поэтому для более
гибкого управления индексацией следует также обратить внимание на метатег Robots и на файл robots.txt'
;

Спустя 13 секунд (27.02.2012 - 15:21) Visman написал(а):
Проверил вытягивание страницы с удаленного сайта на локалхосте.
Сайт донор в UTF-8, текст пришел с кракозяблами (скрипт кодировку не понял).
Отсюда
preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);

не смог обработать файл корректно.
Убрал ключ u, стало все ОК.

Спустя 2 минуты, 44 секунды (27.02.2012 - 15:23) Игорь_Vasinsky написал(а):
))) ну епт.. смотреть нужно с какой кодировкой работаешь.

одно дело поставить или убрать модификатор -u
другое написать обработку принятых данных и выявление кодировки, перекодирование и т.д.

Спустя 1 минута, 48 секунд (27.02.2012 - 15:25) bob marley написал(а):
Игорь_Vasinsky
Я сказал нет времени.Я не обязан тут решать вопрос.Я показал "ПРИМЕР".А там самому врубиться можно!

Спустя 52 секунды (27.02.2012 - 15:26) Игорь_Vasinsky написал(а):
да ты его не решишь с explode() занятой ты наш)))

Спустя 2 минуты, 54 секунды (27.02.2012 - 15:29) bob marley написал(а):
Игорь_Vasinsky
С чего вдруг?Отсортировать сначала открывающийся тег,потом закрывающийся.
И даже если брать первый мой пример.Код верстает ТС и ему после открывающегося тега поставит | и перед закрывающемся тяжко чтоли?

Спустя 2 минуты, 13 секунд (27.02.2012 - 15:31) Игорь_Vasinsky написал(а):
ты как эти теги ловить будешь?

<noindex>
<noindex >
<NOINDEX>
<NOINDEX >

biggrin.gif

400 строчками говнокода?

а потом появиться <noindex class="yandex_no_index">

и усё. кончалось программирование.

Спустя 4 минуты, 43 секунды (27.02.2012 - 15:36) bob marley написал(а):
Игорь_Vasinsky
Я не понимаю вообще о чем разговор ты ведешь.
ТС может следить за этим?!Может.И вообще если надо скрывать блок с ссылками и открывать когда надо,сделайте,ТС,так и не занимайтесь сексом с мозгом!

<div style="display:none;">
Скрытый текст
</div>

<div style="display:block;">
Не скрытый текст
</div>

А там if-else прописать сам-то сможешь?!

Спустя 3 минуты, 24 секунды (27.02.2012 - 15:39) bob marley написал(а):
Пример:
Свернутый текст
index.php
<a href="index.php?look=menu">Отобразить меню</a>
<
div style="display:<?php if($_GET['look'] == 'menu'){echo 'block';}else{echo 'none';} ?>;">
ссылки
</div>

Спустя 2 минуты, 23 секунды (27.02.2012 - 15:42) Игорь_Vasinsky написал(а):
чё за фокус? biggrin.gif какой блок? какое меню? biggrin.gif biggrin.gif

название топика ссылки в <noindex>

Спустя 32 секунды (27.02.2012 - 15:42) bob marley написал(а):
Игорь_Vasinsky
Ой все короче,я ушел.

Спустя 1 минута, 22 секунды (27.02.2012 - 15:44) Игорь_Vasinsky написал(а):
это как? пустослов? не хорошо такую репутацию у нас получать или код или не прав.

Спустя 2 минуты, 57 секунд (27.02.2012 - 15:47) bob marley написал(а):
Игорь_Vasinsky
Я не видел в правилах форума,что я обязан писать готовый код!Я написал как это реализовать.

Спустя 40 секунд (27.02.2012 - 15:47) bob marley написал(а):
На вкус и цвет фломастеры разные,а если вам нечем заняться и хочет поспорить..Купите попугайчика!

Спустя 1 минута, 41 секунда (27.02.2012 - 15:49) Игорь_Vasinsky написал(а):
ты не написал как это реализовать - в том то и дело.

пошёл на google скоро запостю картинку лыжника biggrin.gif

Спустя 2 минуты, 22 секунды (27.02.2012 - 15:51) bob marley написал(а):
Игорь_Vasinsky
Я написал,сначала убрать отр. тег,а потом закр.
И следить за ними в полне не сложно.А ещё лучше первый мой пример.Я так делал.

Спустя 1 минута, 29 секунд (27.02.2012 - 15:53) Игорь_Vasinsky написал(а):
с тобой всё ясно.
Свернутый текст
user posted image
user posted image
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.