[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Проблемы с кодировкой при парсинге
Nicholas
Здравствуйте. Написал свой первый парсер.
<?php
if($curl=curl_init() )
{
curl_setopt($curl,CURLOPT_URL,'http://yandex.ru');
curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);
curl_setopt($curl,CURLOPT_FOLLOWLOCATION,true);


$out=curl_exec($curl);
echo $out;
curl_close($curl);
}
?>

Возникла такая проблема:при скачивании некоторых страниц вместо кириллицы получаются крякозябы. Подскажите,пожалуйста,что делать?



Спустя 1 час, 4 минуты, 9 секунд (7.11.2011 - 20:05) redreem написал(а):
проверять на кракозяблость и конвертить из кракозяблости в кириллицу (iconv).

Спустя 30 минут, 7 секунд (7.11.2011 - 20:35) Nicholas написал(а):
Цитата (redreem @ 7.11.2011 - 17:05)
проверять на кракозяблость и конвертить из кракозяблости в кириллицу (iconv).

если не трудно,можно чуть по подробнее? Как именно можно проверить на крякозяблость?

Спустя 2 часа, 50 минут, 52 секунды (7.11.2011 - 23:26) walerus написал(а):
Яндекс в UTF-8 отдает страницу, у Вас скрипт в какой кодировке ??

Спустя 1 час, 15 минут, 49 секунд (8.11.2011 - 00:41) imbalance_hero написал(а):
Nicholas
iconv из UTF8 в win1251, либо тоже самое, только наоборот. В зависимости от кодировки твоего сайта и сайта, откуда парсишь.

Спустя 15 часов, 19 минут, 32 секунды (8.11.2011 - 16:01) Nicholas написал(а):
Цитата (walerus @ 7.11.2011 - 20:26)
Яндекс в UTF-8 отдает страницу, у Вас скрипт в какой кодировке ??

Пробовал запускать и в UTF-8 и в ASCII результат один и тот же.

Спустя 1 минута, 10 секунд (8.11.2011 - 16:02) Nicholas написал(а):
Цитата (imbalance_hero @ 7.11.2011 - 21:41)
Nicholas
iconv из UTF8 в win1251, либо тоже самое, только наоборот. В зависимости от кодировки твоего сайта и сайта, откуда парсишь.

Спасибо.Сегодня вечером попробую

Спустя 47 секунд (8.11.2011 - 16:03) Winston написал(а):
А ты напиши так
header("Content-Type: text/html; charset=utf-8");
if($curl=curl_init() )
{
curl_setopt($curl,CURLOPT_URL,'http://yandex.ru');
curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);
curl_setopt($curl,CURLOPT_FOLLOWLOCATION,true);


$out=curl_exec($curl);
echo $out;
curl_close($curl);
}

Или вместо charset=utf-8 напиши charset=windows-1251
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.