Приведенный сайт беру как пример.
Пусть мы имеем ХТМЛ код сайта bn.ru. Заголовок у страницы: "Портал БН.ру - Бюллетень недвижимости Петербурга. Первичное и вторичное жилье Петербурга и Ленинградской области - Бюллетень Недвижимости"
Кусок кода отвечающий за вырезку тайтла:
$pattern = "<title.*?>(.*?)</title>";
preg_match("#{$pattern}#ius", $this->html, $matches);
echo '<pre>';
var_dump($matches);
die();
Результат:
array(0) {
}
Если убрать модификатор u, то тайтл получаю, но в не понятной кодировки.
Ïîðòàë ÁÍ.ðó - Áþëëåòåíü íåäâèæèìîñòè Ïåòåðáóðãà. Ïåðâè÷íîå è âòîðè÷íîå æèëüå Ïåòåðáóðãà è Ëåíèíãðàäñêîé îáëàñòè - Áþëëåòåíü Íåäâèæèìîñòè
_____________
Заработок для веб-разработчиков: CodeCanyon
Мое Портфолио