Как найти все теги <noindex> которые есть на странице и посмотреть есть ли в них ссылки, подскажите пожалуйста????
$url_host = parse_url($url, PHP_URL_HOST);
if ( preg_match('/^www\./i', $url_host) ) $url_host = substr($url_host, 4);
$html = @file_get_contents($url);
if ( false===$html ) return false;
$xml = new DOMDocument();
@$xml->loadHTML($html);
$nonk = $xml->getElementsByTagName('noindex');
Спустя 1 час, 3 минуты, 18 секунд (27.02.2012 - 12:41) FatCat написал(а):
preg_match-ем забрать массив всего, что в ноиндексе, затем foreach, и в цикле stristr по '<a '?
Спустя 1 час, 11 минут, 51 секунда (27.02.2012 - 13:52) Игорь_Vasinsky написал(а):
$url = 'http://ссылка на страницу';
//Получили удалённую страницу в переменную
$page = file_get_contents($url);
//Распарсили регуляркой и заполнили массив
preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';
Спустя 22 минуты, 43 секунды (27.02.2012 - 14:15) Visman написал(а):
Игорь_Vasinsky, разве это [^</noindex>] будет работать в регулярке?
Спустя 3 минуты, 11 секунд (27.02.2012 - 14:18) Игорь_Vasinsky написал(а):
ну ты проверь
Спустя 14 минут, 12 секунд (27.02.2012 - 14:32) Visman написал(а):
Игорь_Vasinsky, я вижу что это символьный класс, который может состоять из всех символов кроме <, /, n, o, i, d, e, x, >.
Или я не прав?
Или я не прав?
Спустя 1 минута, 33 секунды (27.02.2012 - 14:34) Игорь_Vasinsky написал(а):
Свернутый текст
$page = 'Тег noindex используется для запрета индексации какой-либо части текста страницы или ее кода.Пример:
<noindex >текст или код страницы, который нужно скрыть1</noindex >. Следует заметить, что данная конструкция воспринимается
только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве атрибута
используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть2</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть3</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть4</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.Тег noindex можно использовать в нескольких случаях:
1) Полезно заключить в него коды счетчиков
К сожалению, как уже говорилось, тег noindex имеет значение только для отечественных поисковиков.Поэтому для более
гибкого управления индексацией следует также обратить внимание на метатег Robots и на файл robots.txt';
preg_match_all("#<noindex>([^</noindex>].*)</noindex>#iusU", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';
<pre>Array
(
[0] => Array
(
[0] => <noindex>текст или код страницы, который нужно скрыть2</noindex>
[1] => <noindex>текст или код страницы, который нужно скрыть3</noindex>
[2] => <noindex>текст или код страницы, который нужно скрыть4</noindex>
)
[1] => Array
(
[0] => текст или код страницы, который нужно скрыть2
[1] => текст или код страницы, который нужно скрыть3
[2] => текст или код страницы, который нужно скрыть4
)
)
</pre>
Спустя 8 минут, 44 секунды (27.02.2012 - 14:43) tvix написал(а):
Подскажите плиз почему не работает данная конструкция????
А следующая далее (ниже код)конструкция не видит границ noindex, то есть у меня есть
есть текст
<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
<noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>
получается
Array ( [0] => Ссылкаи далее по тексту2Ссылкаи далее по тексту... [1] => Ссылкаи далее по тексту2Ссылкаи далее по тексту... )
Подскажите как изменить регулярное выражение,чтобы оно записывало содержание всех <noindex> на странице?????????????
$url = 'http://страница';
//Получили удалённую страницу в переменную
$page = file_get_contents($url);
//Распарсили регуляркой и заполнили массив
preg_match_all("#<noindex>([^</noindex>].*)</noindex>#ius", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';
А следующая далее (ниже код)конструкция не видит границ noindex, то есть у меня есть
есть текст
<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
<noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>
получается
Array ( [0] => Ссылкаи далее по тексту2Ссылкаи далее по тексту... [1] => Ссылкаи далее по тексту2Ссылкаи далее по тексту... )
if (preg_match('|<noindex.*?>(.*)</noindex>|sei', $html, $arr))
{
print_r ($arr);
}
Подскажите как изменить регулярное выражение,чтобы оно записывало содержание всех <noindex> на странице?????????????
Спустя 6 минут, 48 секунд (27.02.2012 - 14:50) Visman написал(а):
Игорь_Vasinsky, главное тут U
tvix, посмотри свернутый текст от Игорь_Vasinsky.
tvix, посмотри свернутый текст от Игорь_Vasinsky.
Спустя 5 минут, 14 секунд (27.02.2012 - 14:55) Игорь_Vasinsky написал(а):
$page = "<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
<noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>";
preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);
//Посмотрели массив
echo '<pre>' . print_r($links, 1) . '</pre>';
<pre>Array
(
[0] => Array
(
[0] => <noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex>
[1] => <noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>
)
[1] => Array
(
[0] => Ссылка</A>и далее по тексту
[1] => 2Ссылка</A>и далее по тексту...
)
)
</pre>
Спустя 1 минута, 22 секунды (27.02.2012 - 14:56) Игорь_Vasinsky написал(а):
пофиксил
Спустя 6 минут, 48 секунд (27.02.2012 - 15:03) bob marley написал(а):
Цитата (Игорь_Vasinsky @ 27.02.2012 - 11:55) |
$page = "<noindex ><A href='/1.php'>Ссылка</A>и далее по тексту</noindex> <noindex ><A href='/2.php'>2Ссылка</A>и далее по тексту...</noindex>"; preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links); //Посмотрели массив echo '<pre>' . print_r($links, 1) . '</pre>'; |
Люди,зачем здесь регулярные выражения,когда есть функция EXPLODE() ,скажите мне на милость?!
Спустя 1 минута, 10 секунд (27.02.2012 - 15:04) bob marley написал(а):
Цитата (tvix @ 27.02.2012 - 11:43) |
$url = 'http://страница'; //Получили удалённую страницу в переменную $page = file_get_contents($url); //Распарсили регуляркой и заполнили массив preg_match_all("#<noindex>([^</noindex>].*)</noindex>#ius", $page, $links); //Посмотрели массив echo '<pre>' . print_r($links, 1) . '</pre>'; |
Сколько раз не пробовал file_get_contents не выполняется если запрос с полным url!
И ещё раз повторю что регулрки не нужны,когда есть explode()
Спустя 2 минуты, 52 секунды (27.02.2012 - 15:07) Visman написал(а):
Цитата (bob marley @ 27.02.2012 - 20:03) |
Люди,зачем здесь регулярные выражения,когда есть функция EXPLODE() ,скажите мне на милость?! |
Пример на том же тексте можно привести?
Цитата (bob marley @ 27.02.2012 - 20:03) |
Сколько раз не пробовал file_get_contents не выполняется если запрос с полным url! |
Запрет функции работать с внешними источниками?
Спустя 18 секунд (27.02.2012 - 15:07) Игорь_Vasinsky написал(а):
покажи..мне интересно стало.
Спустя 1 минута, 18 секунд (27.02.2012 - 15:09) bob marley написал(а):
Visman
Пример приведу,подожди не много.
Запрещено или нет не в курсе.Но работать,по крайней мере у меня,отказывается.Попробуй тоже не полный путь прописать.
Пример приведу,подожди не много.
Запрещено или нет не в курсе.Но работать,по крайней мере у меня,отказывается.Попробуй тоже не полный путь прописать.
Спустя 4 минуты, 17 секунд (27.02.2012 - 15:13) Игорь_Vasinsky написал(а):
может быть она запрещена в php.ini.
Спустя 5 минут, 19 секунд (27.02.2012 - 15:18) bob marley написал(а):
На нормальный пример времени нет,я занят..Вот так вот можно:
Свернутый текст
<?php
$page = "<noindex>|<A href='/1.php'>Ссылка</A>и далее по тексту|</noindex>
<noindex>|<A href='/2.php'>2Ссылка</A>и далее по тексту...|</noindex>";
$array = explode('|', $page);
print_r($array);
Спустя 2 минуты, 14 секунд (27.02.2012 - 15:20) Игорь_Vasinsky написал(а):
:D :D :D :D :D :D :D
Эту переменную обработай
Эту переменную обработай
$page = 'Тег noindex используется для запрета индексации какой-либо части текста страницы или ее кода.Пример:
<noindex >текст или код страницы, который нужно скрыть1</noindex >. Следует заметить, что данная конструкция воспринимается
только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве атрибута
используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть2</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть3</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.
Пример: <noindex>текст или код страницы, который нужно скрыть4</noindex>. Следует заметить, что данная конструкция
воспринимается только поисковыми роботами Яндекса и Рамблера, Google и другие ее игнорируют. Также noindex в качестве
атрибута используется в мета-теге Robots.Тег noindex можно использовать в нескольких случаях:
1) Полезно заключить в него коды счетчиков
К сожалению, как уже говорилось, тег noindex имеет значение только для отечественных поисковиков.Поэтому для более
гибкого управления индексацией следует также обратить внимание на метатег Robots и на файл robots.txt';
Спустя 13 секунд (27.02.2012 - 15:21) Visman написал(а):
Проверил вытягивание страницы с удаленного сайта на локалхосте.
Сайт донор в UTF-8, текст пришел с кракозяблами (скрипт кодировку не понял).
Отсюда
не смог обработать файл корректно.
Убрал ключ u, стало все ОК.
Сайт донор в UTF-8, текст пришел с кракозяблами (скрипт кодировку не понял).
Отсюда
preg_match_all("#<noindex.*>([^</noindex>].*)</noindex.*>#iusU", $page, $links);
не смог обработать файл корректно.
Убрал ключ u, стало все ОК.
Спустя 2 минуты, 44 секунды (27.02.2012 - 15:23) Игорь_Vasinsky написал(а):
))) ну епт.. смотреть нужно с какой кодировкой работаешь.
одно дело поставить или убрать модификатор -u
другое написать обработку принятых данных и выявление кодировки, перекодирование и т.д.
одно дело поставить или убрать модификатор -u
другое написать обработку принятых данных и выявление кодировки, перекодирование и т.д.
Спустя 1 минута, 48 секунд (27.02.2012 - 15:25) bob marley написал(а):
Игорь_Vasinsky
Я сказал нет времени.Я не обязан тут решать вопрос.Я показал "ПРИМЕР".А там самому врубиться можно!
Я сказал нет времени.Я не обязан тут решать вопрос.Я показал "ПРИМЕР".А там самому врубиться можно!
Спустя 52 секунды (27.02.2012 - 15:26) Игорь_Vasinsky написал(а):
да ты его не решишь с explode() занятой ты наш)))
Спустя 2 минуты, 54 секунды (27.02.2012 - 15:29) bob marley написал(а):
Игорь_Vasinsky
С чего вдруг?Отсортировать сначала открывающийся тег,потом закрывающийся.
И даже если брать первый мой пример.Код верстает ТС и ему после открывающегося тега поставит | и перед закрывающемся тяжко чтоли?
С чего вдруг?Отсортировать сначала открывающийся тег,потом закрывающийся.
И даже если брать первый мой пример.Код верстает ТС и ему после открывающегося тега поставит | и перед закрывающемся тяжко чтоли?
Спустя 2 минуты, 13 секунд (27.02.2012 - 15:31) Игорь_Vasinsky написал(а):
ты как эти теги ловить будешь?
<noindex>
<noindex >
<NOINDEX>
<NOINDEX >
400 строчками говнокода?
а потом появиться <noindex class="yandex_no_index">
и усё. кончалось программирование.
<noindex>
<noindex >
<NOINDEX>
<NOINDEX >
400 строчками говнокода?
а потом появиться <noindex class="yandex_no_index">
и усё. кончалось программирование.
Спустя 4 минуты, 43 секунды (27.02.2012 - 15:36) bob marley написал(а):
Игорь_Vasinsky
Я не понимаю вообще о чем разговор ты ведешь.
ТС может следить за этим?!Может.И вообще если надо скрывать блок с ссылками и открывать когда надо,сделайте,ТС,так и не занимайтесь сексом с мозгом!
<div style="display:none;">
Скрытый текст
</div>
<div style="display:block;">
Не скрытый текст
</div>
А там if-else прописать сам-то сможешь?!
Я не понимаю вообще о чем разговор ты ведешь.
ТС может следить за этим?!Может.И вообще если надо скрывать блок с ссылками и открывать когда надо,сделайте,ТС,так и не занимайтесь сексом с мозгом!
<div style="display:none;">
Скрытый текст
</div>
<div style="display:block;">
Не скрытый текст
</div>
А там if-else прописать сам-то сможешь?!
Спустя 3 минуты, 24 секунды (27.02.2012 - 15:39) bob marley написал(а):
Пример:
Свернутый текст
index.php
<a href="index.php?look=menu">Отобразить меню</a>
<div style="display:<?php if($_GET['look'] == 'menu'){echo 'block';}else{echo 'none';} ?>;">
ссылки
</div>
Спустя 2 минуты, 23 секунды (27.02.2012 - 15:42) Игорь_Vasinsky написал(а):
чё за фокус? какой блок? какое меню?
название топика ссылки в <noindex>
название топика ссылки в <noindex>
Спустя 32 секунды (27.02.2012 - 15:42) bob marley написал(а):
Игорь_Vasinsky
Ой все короче,я ушел.
Ой все короче,я ушел.
Спустя 1 минута, 22 секунды (27.02.2012 - 15:44) Игорь_Vasinsky написал(а):
это как? пустослов? не хорошо такую репутацию у нас получать или код или не прав.
Спустя 2 минуты, 57 секунд (27.02.2012 - 15:47) bob marley написал(а):
Игорь_Vasinsky
Я не видел в правилах форума,что я обязан писать готовый код!Я написал как это реализовать.
Я не видел в правилах форума,что я обязан писать готовый код!Я написал как это реализовать.
Спустя 40 секунд (27.02.2012 - 15:47) bob marley написал(а):
На вкус и цвет фломастеры разные,а если вам нечем заняться и хочет поспорить..Купите попугайчика!
Спустя 1 минута, 41 секунда (27.02.2012 - 15:49) Игорь_Vasinsky написал(а):
ты не написал как это реализовать - в том то и дело.
пошёл на google скоро запостю картинку лыжника
пошёл на google скоро запостю картинку лыжника
Спустя 2 минуты, 22 секунды (27.02.2012 - 15:51) bob marley написал(а):
Игорь_Vasinsky
Я написал,сначала убрать отр. тег,а потом закр.
И следить за ними в полне не сложно.А ещё лучше первый мой пример.Я так делал.
Я написал,сначала убрать отр. тег,а потом закр.
И следить за ними в полне не сложно.А ещё лучше первый мой пример.Я так делал.
Спустя 1 минута, 29 секунд (27.02.2012 - 15:53) Игорь_Vasinsky написал(а):
с тобой всё ясно.
Свернутый текст