[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Парсинг с библиотекой PHP Simple HTML DOM
anaraida
Добрый день. Проблема состоит в том, что в результате парсинга страницы выводятся пустой массив. Никак не могу понять в чем ошибка.
<?php
include('simple_html_dom.php');
$text = file_get_html('http://www.job.ru/resume/2074293');
foreach ($text -> find('body [class=""]') as $temp){
$item['specialty']=$temp-> find('div [class="ri_specialty"]',0);
$item['salary']=$temp->find('div [class="font_16 ri_salary"]',0);
$item['previous work']=$temp->find('div[class="companyInfo"]',0);
$item['post']=$temp->find('p [class="branchInfo margin_5_top"]',0);
}
echo"<pre>";
print_r($item);
echo"</pre>";
?>




Спустя 7 минут, 45 секунд (11.05.2012 - 15:09) Игорь_Vasinsky написал(а):
следите за мыслью мадам ;)

<?php
$page = file_get_contents('http://www.job.ru/resume/2074293');

preg_match_all("#<div class=\"ri_specialty\">(.*)</div>#iusU", $page, $ru_specialty);

echo '<pre>' . print_r($ru_specialty, 1) . '</pre>';

preg_match_all("#<div class=\"font_16 ri_salary\">(.*)</div>#iusU", $page, $ri_salary);

echo '<pre>' . print_r($ri_salary, 1) . '</pre>';

?>


это я к тому что контент валидный там и шарится без напряг с SHD

Спустя 1 минута, 1 секунда (11.05.2012 - 15:10) Игорь_Vasinsky написал(а):
ну ест-но с

 header("Content-type: text/html; charset=utf-8");


смотрится красивей и понятней.

Спустя 18 минут, 53 секунды (11.05.2012 - 15:29) anaraida написал(а):
Спасибо.
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.