[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: file_get_content через прокси...
Tread
Всем привет!
Имеется проблемка: есть забаненый определенным сервером ip (этот ip принадлежит серверу, где лежит скрипт), т.е. при обращении на прямую file_get_content выдает мол невозможно загрузить контент...
Подскажите, пожалуйста, каким образом можно обойти такую систему блокировки?
Может использовать анонимные прокси? И если все таки можно их использовать, то можно ли пример такого действа?

З.Ы. читал я инфу о curl и о fsockopen, пытался писать скрипты, правльно строил запросы от сервака, но толкового ничего из этого не выходило...

Вот один из скриптов...

$proxy = "60.217.227.136";
$port = 8080;
$url = "http://xyz.ru";

$fp = fsockopen($proxy, $port, $errno, $errstr, 30);
if (!$fp) {
echo "ERROR: $errno - $errstr<br />\n";
} else {

$out = "GET / HTTP/1.1\r\n";
$out .= "Host: ".$url."\r\n";
$out .= "Connection: Close\r\n\r\n";

fwrite($fp, $out);

while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);

}

Но результат, даже при точно работающих прокси - пустая траница...

Может в коде ошибка?




Спустя 4 дня, 10 часов, 59 минут, 30 секунд (7.02.2007 - 00:00) md5 написал(а):
я сделал зеркало нужного сайта на другом серваке :)

Спустя 1 день, 17 часов, 28 минут, 57 секунд (8.02.2007 - 17:29) lenich написал(а):
1. Нах гет_контент сразу - юзай курл.
2. Я такую проблему обошел через анонимайзер. (www.anonimaizer.ru) - через него контент забирал.
Ну или можно еще свои прокси написать. Через всякие там типа списки прокси которые в нете нешел - у меня не прокатило.

Спустя 5 часов, 37 минут, 15 секунд (8.02.2007 - 23:06) Tread написал(а):
Цитата(lenich @ 8.2.2007, 14:29) [snapback]12573[/snapback]

1. Нах гет_контент сразу - юзай курл.
2. Я такую проблему обошел через анонимайзер. (www.anonimaizer.ru) - через него контент забирал.
Ну или можно еще свои прокси написать. Через всякие там типа списки прокси которые в нете нешел - у меня не прокатило.


Хм... чтобы юзать курл надо быть админом серва, как я понял... К сожалению, я не админ...

А можно поподробнее на счет www.anonimaizer.ru?
Можно как-нибудь брать контент с использую разные прокси, а не только один (http://www.seenoip.com/)?

Спустя 10 часов, 48 минут, 8 секунд (9.02.2007 - 09:55) lenich написал(а):
Админом сервака быть не надо - но курл может быть и не установлен - тогда надо его там поставить.Использовть 2 такие системы смысла нет если только одна из них каким либо образом не забанена уже на нужном сервере что маловероятно.Анонимайзер как я понимаю на то и анонимайзер чтобы каждый раз создавать новые http-заголовки(ну я не знаю просто точно откуда они йп вытаскивают).

Спустя 4 часа, 48 минут, 24 секунды (9.02.2007 - 14:43) larin написал(а):
Цитата
Но результат, даже при точно работающих прокси - пустая траница...

Может в коде ошибка?

Да у тебя ошибка в коде - ты не указываешь, что "идешь" через проксик. Посмотри реализацию, например, здесь: http://ru2.php.net/manual/ru/function.fsockopen.php#58196 и далее на этой странице много хороших примеров. И вообще запомните этот адрес PHP.NET - тут много интересного ))))

Спустя 2 года, 6 месяцев, 14 дней, 22 часа, 28 минут, 52 секунды (24.08.2009 - 12:12) Jackkum написал(а):
У меня почти такая же проблема, парсю один популярный сайт, сначала использовал file_get_contents(); но где то на 150-ом запросе - 403 ошибка и каптча "с вашего ip слишком много запросов, подтвердите что вы не бот" sad.gif Попробовал курл он не полноценно загружает страницу не хватает главного куска в центре сайта... sad.gif что делать не знаю...

Спустя 2 месяца, 11 дней, 11 часов, 55 минут, 43 секунды (6.11.2009 - 01:08) HT написал(а):
Ошибка в коде, попробуй это
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.