К примеру загружаю yandex.ru и нужно переделат ссылки автоматом http://site.ru/get.php?url=www.maps.yandex.ru как это сделать ?
Спустя 1 минута, 48 секунд (12.12.2011 - 16:42) T1grOK написал(а):
Классные, мощные, регулярные выражения

Спустя 11 секунд (12.12.2011 - 16:42) Winston написал(а):
Откуда ты ссылки берешь для подгружения ?
Спустя 2 минуты, 51 секунда (12.12.2011 - 16:45) 10ozoz написал(а):
В сысле откуда ?
Вот скрипт когда грузит страницу нужно чтобы на яндексе замели ссылки .
Вот скрипт когда грузит страницу нужно чтобы на яндексе замели ссылки .
<?php
$homepage = file_get_contents('http://www.yandex.ru/');
echo $homepage;
?>
Спустя 2 минуты, 11 секунд (12.12.2011 - 16:47) Winston написал(а):
То есть, ты загружаешь страницу, и тебе нужно в начало всех ссылок добавить свой адрес ?
Спустя 52 секунды (12.12.2011 - 16:48) 10ozoz написал(а):
Всё верно .
Спустя 4 минуты, 37 секунд (12.12.2011 - 16:53) Winston написал(а):
Ну всего пара строк :)
$homepage = file_get_contents('http://phpforum.ru');
$homepage = preg_replace("#(http://[^'\"]+)#U", 'http://site.ru/get.php?url=\\1', $homepage);
echo '<pre>'.htmlspecialchars(print_r($homepage, 1)).'</pre>';
Спустя 2 минуты, 12 секунд (12.12.2011 - 16:55) 10ozoz написал(а):
То что нужно только вот чёт в HTML всё ..

Спустя 1 минута, 12 секунд (12.12.2011 - 16:56) 10ozoz написал(а):
Всё разобрался .
Спустя 1 минута, 21 секунда (12.12.2011 - 16:57) 10ozoz написал(а):
Winston
Я так понял что крокозябры выходят изза кирилицы ? яндекс нормально некторые не аёс .
Я так понял что крокозябры выходят изза кирилицы ? яндекс нормально некторые не аёс .
Спустя 4 минуты, 55 секунд (12.12.2011 - 17:02) Winston написал(а):
Цитата (10ozoz @ 12.12.2011 - 15:57) |
Я так понял что крокозябры выходят изза кирилицы |
Да.
Цитата (10ozoz @ 12.12.2011 - 15:57) |
яндекс нормально некторые не аёс |
Если сайт в юникоде то нужно добавлять модификатор u
Спустя 1 час, 43 минуты, 28 секунд (12.12.2011 - 18:46) 10ozoz написал(а):
Не могу понять почему не срабатывает загрузка по URL ?
Эко выводит название сайта , а вот URL не грузит .
<form method=get >
<input class="input" type="name" name="url" value="" placeholder="Какой сайт вы хотите загрузить ?"/>
<input type="submit"/> <br />
</form>
<?php
$url =(isset($_GET['url']))?$_GET['url']:false;
echo $url ;
$homepage = file_get_contents($url);
echo $homepage ;
$homepage = preg_replace("#(http://[^'\"]+)#U", 'http://localhost/test/url.php?url=\\1', $homepage);
echo '<pre>'.(print_r($homepage, 1)).'</pre>';
?>
Эко выводит название сайта , а вот URL не грузит .
Спустя 4 минуты, 59 секунд (12.12.2011 - 18:51) bulgakov написал(а):
попробуйте в form action="" прописать
Спустя 4 секунды (12.12.2011 - 18:51) Игорь_Vasinsky написал(а):
грузит. исходный код глян.
полученный контент прогоняй через iconv();
яша видимо на windows-1251 написан.
полученный контент прогоняй через iconv();
яша видимо на windows-1251 написан.
Спустя 5 минут, 21 секунда (12.12.2011 - 18:56) 10ozoz написал(а):
Сейчас всё сработало на ура .. у меня только одна большая проблема что с кодером windows-1251 крокозыбры выдаёт иной раз , яша и рамблер нормально себя ведут .
Спустя 18 минут, 21 секунда (12.12.2011 - 19:14) Игорь_Vasinsky написал(а):
нужно смотреть в какой кодировке донор и сопастовлять свой парсер