[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: неправильная кодировка при парсинге
titans
Привет всем. Нужна ваша помощь. Есть такой код.
<?php

include 'simple_html_dom.php';
$html = file_get_html('http://rutor.org/');
echo $html;
$html->clear(); // подчищаем за собой
unset($html);


?>

В результате сохраненный код в UTF-8 без BOM показывает такие кракозябрины. Что делать?



Спустя 4 минуты, 9 секунд (9.03.2012 - 11:40) Visman написал(а):
Там, откуда берешь контент и там, где его отображаешь, должна быть одна кодировка.
Либо перекодируй данные.

Спустя 37 минут, 19 секунд (9.03.2012 - 12:18) titans написал(а):
ну у меня стоит utf-8, и у них на сайте стоит utf-8 чего же не правильно? Может есть способо в php узнать кодировку сайта?

Спустя 12 минут, 13 секунд (9.03.2012 - 12:30) titans написал(а):
сам спросил, сам ответил. Вот такой код рабочий.
<?php
header("Content-type: text/html; charset=UTF-8");

$url = "http://rutor.org/torrent/177688/mass-effect-3-2012-pc-repack/"; //адрес страницы

$ch = curl_init(); // инициализация curl

curl_setopt ($ch , CURLOPT_URL , $url);

curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows; U; Windows NT 5.1; ru-RU; rv:1.7.12) Gecko/20050919 Firefox/1.0.7 link");
curl_setopt ($ch, CURLOPT_ENCODING, 'gzip,deflate');
curl_setopt ($ch , CURLOPT_RETURNTRANSFER , 1 );

$page = curl_exec($ch);

curl_close($ch);

echo $page;
?>
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.