$html=file_get_contents (`http://www.site.net`);Подскажите почему не работает скрипт
$url=`site.net`;
$vnut=array();
$vnech=array();
preg_match_all(`~<a [^<>]*href=[`"]([^`"]+)[`"][^<>]*>(((?!~si`,$html, $matches);
foreach ($matches[1] as $val) {
if (!preg_match("~^[^=]+://~", $val) || preg_match("~^[^://]+://(www.)?".$url."~i", $val)) { $vnut[]=$val; }
else $vnech[]=$val;
}
$vnut=array_unique ($vnut);
$vnech=array_unique ($vnech);
print_r ($vnut);
print_r ($vnech);
Спустя 7 минут, 58 секунд (28.09.2011 - 13:16) linker написал(а):
Воо, как только я стилизовал код сразу стали видны ошибки, что это за хрень такая preg_match_all(``)? Что это за $url = `site.net`;? Кто вас вообще надоумил использовать апострофы вместо кавычек?
Спустя 5 минут, 28 секунд (28.09.2011 - 13:21) alex12060 написал(а):
linker
На некоторых блогах так делают, чтобы копипастерам жить было плохо
На некоторых блогах так делают, чтобы копипастерам жить было плохо

Спустя 1 минута, 48 секунд (28.09.2011 - 13:23) alex12060 написал(а):
А вот я нарыл когда-то код для парса ссылок)
Я его для себя адаптировал)
Работает, кстати хорошо.
$i = "";
echo "<pre>";
// качаем страницу в переменную $buf
$buf=implode("",file("http://www.mysql.ru/docs/man/"));
// получем ссылки в массив
preg_match_all
("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/",
$buf,$url);
// выводим массив на экран
while($i<count($url[1])) { echo '<a href="http://www.mysql.ru/docs/man/'.@$url[1][$i++].'">'.@$url[1][$i++].'</a>'."\n"; }
echo "</pre>";
Я его для себя адаптировал)
Работает, кстати хорошо.
Спустя 6 минут, 5 секунд (28.09.2011 - 13:29) Winston написал(а):
Цитата (alex12060 @ 28.09.2011 - 13:23) |
preg_match_all ("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/", $buf,$url); |
Как-бэ сократить можно
preg_match_all
("#<a\s[^>]*href\s*=[\s'\"]*([^\"']+)[^>]*>#isuU",
$buf,$url);
Спустя 1 минута, 12 секунд (28.09.2011 - 13:30) alex12060 написал(а):
Winston
Можн конечно, можно
Можн конечно, можно

Спустя 7 часов, 48 минут, 32 секунды (28.09.2011 - 21:19) Guest написал(а):
спасибо большое) а как можно адаптировать этот код для парса java-скриптов на странице?
Спустя 2 минуты (28.09.2011 - 21:21) Игорь_Vasinsky написал(а):
Цитата |
спасибо большое) а как можно адаптировать этот код для парса java-скриптов на странице? |
с помощью 400 руб. - точно можно.