Правила     Закладки     Карма    Календарь    Журналы    Помощь    Поиск    PDA    Чат   
        СМС-ки
   
Пейджер выключен!
 
Фильтр авторов:    показать 
  скрыть
  Ответ в темуСоздание новой темыСоздание опроса

> preg_match и русские символы
forza  
 ۩  Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 396
Пользователь №: 23841
На форуме: 6 лет, 3 месяца, 3 дня
Карма: 22




Пытаюсь выдернуть тайтл у страницы через функ-ию preg_match, но сталкиваюсь с чудесами кодировки в HTML коде с русскими буквами.
Приведенный сайт беру как пример.
Пусть мы имеем ХТМЛ код сайта bn.ru. Заголовок у страницы: "Портал БН.ру - Бюллетень недвижимости Петербурга. Первичное и вторичное жилье Петербурга и Ленинградской области - Бюллетень Недвижимости"

Кусок кода отвечающий за вырезку тайтла:

$pattern = "<title.*?>(.*?)</title>";
preg_match("#{$pattern}#ius", $this->html, $matches);
echo '<pre>';
var_dump($matches);
die();


Результат:
array(0) {
}


Если убрать модификатор u, то тайтл получаю, но в не понятной кодировки.

Ïîðòàë ÁÍ.ðó - Áþëëåòåíü íåäâèæèìîñòè Ïåòåðáóðãà. Ïåðâè÷íîå è âòîðè÷íîå æèëüå Ïåòåðáóðãà è Ëåíèíãðàäñêîé îáëàñòè - Áþëëåòåíü Íåäâèæèìîñòè


--------------------
Заработок для веб-разработчиков: CodeCanyon
Мое Портфолио
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Winston  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме




******

Профиль
Группа: Эксперт
Группа переписки
Сообщений: 9509
Пользователь №: 18161
На форуме: 7 лет, 5 месяцев, 17 дней
Карма: 552




Здесь http://2cyr.com/decode/?lang=ru можно определить кодировку
PMСайт пользователя
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
forza  
 ۩  Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 396
Пользователь №: 23841
На форуме: 6 лет, 3 месяца, 3 дня
Карма: 22




Цитата (Winston @ 25.07.2013 - 09:29)
Здесь http://2cyr.com/decode/?lang=ru можно определить кодировку

Кодировку я знаю , но если делаю
var_dump(iconv("windows-1251", "utf-8", $matches[1]));

то получаю вот такую бороду
РŸРѕС€С‚Р°Р» БН.С€Сƒ - Р‘СŽР»Р»РµС‚РµРЅСŒ недвижимости РŸРµС‚РµС€Р±СƒС€РіР°. РŸРµС€РІРё
чное Рё втошичное Р¶РёР»СŒРµ РŸРµС‚РµС€Р±СƒС€РіР° Рё Ленингшадской РѕР
±Р»Р°СЃС‚Рё - Р‘СŽР»Р»РµС‚РµРЅСŒ Недвижимости

Как то все печально


--------------------
Заработок для веб-разработчиков: CodeCanyon
Мое Портфолио
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
forza  
 ۩  Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 396
Пользователь №: 23841
На форуме: 6 лет, 3 месяца, 3 дня
Карма: 22




Ай дурак, заработался, все норм... эт я на прямую в файле тестирую, а заголовков то нет...


--------------------
Заработок для веб-разработчиков: CodeCanyon
Мое Портфолио
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
  Быстрый ответ
Информация о Госте
Введите Ваше имя
Кнопки кодов
Для вставки цитаты, выделите нужный текст и
НАЖМИТЕ СЮДА
Введите сообщение
Смайлики
:huh:  :o  ;) 
:P  :D  :lol: 
B)  :rolleyes:  <_< 
:)  :angry:  :( 
:unsure:  :blink:  :ph34r: 
     
Показать всё

Опции сообщения  Включить смайлики?
 Включить подпись?
 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темы Ответ в темуСоздание новой темыСоздание опроса