Спустя 9 минут, 19 секунд (3.10.2010 - 18:13) twin написал(а):
По заголовкам, которые сайт отдает.
Воровать нехорошо.
Воровать нехорошо.
Спустя 7 часов, 31 минута, 9 секунд (4.10.2010 - 01:44) FatCat написал(а):
Цитата (twin @ 3.10.2010 - 19:13) |
По заголовкам, которые сайт отдает. |
А я ленюсь.
function get_text_from_url($url){
// Забираем страницу
$ch = curl_init();
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Accept-Language: ru,en-us;q=0.7,en;q=0.3'));
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_URL, str_replace("& amp","&",$url)); // что чекаем
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_REFERER, $url);
curl_setopt($ch, CURLINFO_HEADER_OUT, true);
curl_setopt($ch, CURLOPT_USERAGENT, "coda-analitics.bot (coda.su/index.php) php.5");
$txt=curl_exec($ch);// загрузка страницы
$status = curl_getinfo($ch,CURLINFO_HTTP_CODE);
curl_close($ch);
if($status>=400)$txt = $status;
$unicode=array(chr(208).chr(144),chr(208).chr(145),chr(208).chr(146),chr(208).chr(147),chr(208).chr(148),chr(208).chr(149),chr(208).chr(150),chr(208).chr(151),chr(208).chr(152),chr(208).chr(153),chr(208).chr(154),chr(208).chr(155),chr(208).chr(156),chr(208).chr(157),chr(208).chr(158),chr(208).chr(159),chr(208).chr(160),chr(208).chr(161),chr(208).chr(162),chr(208).chr(163),chr(208).chr(164),chr(208).chr(165),chr(208).chr(166),chr(208).chr(167),chr(208).chr(168),chr(208).chr(169),chr(208).chr(170),chr(208).chr(171),chr(208).chr(172),chr(208).chr(173),chr(208).chr(174),chr(208).chr(175),chr(208).chr(176),chr(208).chr(177),chr(208).chr(178),chr(208).chr(179),chr(208).chr(180),chr(208).chr(181),chr(208).chr(182),chr(208).chr(183),chr(208).chr(184),chr(208).chr(185),chr(208).chr(186),chr(208).chr(187),chr(208).chr(188),chr(208).chr(189),chr(208).chr(190),chr(208).chr(191),chr(209).chr(128),chr(209).chr(129),chr(209).chr(130),chr(209).chr(131),chr(209).chr(132),chr(209).chr(133),chr(209).chr(134),chr(209).chr(135),chr(209).chr(136),chr(209).chr(137),chr(209).chr(138),chr(209).chr(139),chr(209).chr(140),chr(209).chr(141),chr(209).chr(142),chr(209).chr(143),chr(209).chr(145),chr(208).chr(129));
$win=array(chr(192),chr(193),chr(194),chr(195),chr(196),chr(197),chr(198),chr(199),chr(200),chr(201),chr(202),chr(203),chr(204),chr(205),chr(206),chr(207),chr(208),chr(209),chr(210),chr(211),chr(212),chr(213),chr(214),chr(215),chr(216),chr(217),chr(218),chr(219),chr(220),chr(221),chr(222),chr(223),chr(224),chr(225),chr(226),chr(227),chr(228),chr(229),chr(230),chr(231),chr(232),chr(233),chr(234),chr(235),chr(236),chr(237),chr(238),chr(239),chr(240),chr(241),chr(242),chr(243),chr(244),chr(245),chr(246),chr(247),chr(248),chr(249),chr(250),chr(251),chr(252),chr(253),chr(254),chr(255),chr(184),chr(168));
$txt = str_replace($unicode,$win,$txt);
return $txt;
}
И пофигу, винкириллица или юникод.
КОИ8 не перекодируется, но я на сегодня кроме либры сайтов в этой кодировке больше не видел.
А всяких 866 или мак-кириллицу и вовсе не встречал в инете.
Спустя 6 минут, 34 секунды (4.10.2010 - 01:51) arvitaly написал(а):
ужс
Спустя 25 минут, 10 секунд (4.10.2010 - 02:16) FatCat написал(а):
Цитата (arvitaly @ 4.10.2010 - 02:51) |
ужс |
Ага. Но работает. В отличие от айконверта, который иногда такие косяки выдаёт, что хоть стой хоть падай.
Попробуй спарсить выдачу вордстата яндекса по любому популярному запросу и айконвертнуть в винкириллицу - куда-то пропадет половина страницы...
Спустя 1 час, 42 минуты, 23 секунды (4.10.2010 - 03:59) arvitaly написал(а):
Там все просто) Надо документацию читать почаще)
echo iconv("UTF-8","WINDOWS-1251//IGNORE",$str);
Спустя 4 дня, 17 часов, 1 минута, 25 секунд (8.10.2010 - 21:00) snegas написал(а):
Спасибо Вам большое)