Хочу получить содержимое страницы сайта с помощью curl ,но мне выдает постоянно какие-то иероглифы.Кодировка сайта utf8.Пытался менять header на cp1251 ничего не дает.
При парсинге других сайтов - все нормально, а конкретно этого itar-tass.com - выдает иероглифы.
Если запрашивать данную страницу через браузер и посмотреть ее исходный код ,то там все нормально.
код:
<?php
header("Content-type: text/html; charset=UTF-8");
$url = "http://www.itar-tass.com/"; //адрес страницы
$ch = curl_init(); // инициализация curl
curl_setopt ($ch , CURLOPT_URL , $url);
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows; U; Windows NT 5.1; ru-RU; rv:1.7.12) Gecko/20050919 Firefox/1.0.7 link");
curl_setopt ($ch , CURLOPT_RETURNTRANSFER , 1 );
$page = curl_exec($ch);
curl_close($ch);
echo $page;
?>
выдает:
��������}is[Ǖ��_сk, 5533;X���M�+Y�3z/q<��ySSS,��Iᦙ 3; �@J�$Ue[rIѮ��D���8S�$Dp��/��>�t߭o_��eq"����>}�鳞�ə_�>�o �e.....
Спустя 5 минут, 4 секунды (3.05.2011 - 13:07) Nikitian написал(а):
curl_setopt($ch, CURLOPT_ENCODING, 'gzip,deflate');
Спустя 5 минут, 28 секунд (3.05.2011 - 13:12) promo написал(а):
Большое спасибо!!!