[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Помогите, пожалуйста, с парсингом
valery
Здравствуйте!
Сразу скажу, что я дилетант в PHP, но по необходимости связался с PHP Simple HTML DOM Parser.
Во время работы парсера требуется к ссылке добавить URL:

Надо найти строку
...<a class="old" href="/example/12345/" >...

и добавить к ней URL, например, http://domen.ru:

...<a class="old" href="http://domen.ru/example/12345/" >...

Подскажите, пожалуйста, как это можно сделать?
Спасибо.
bestxp
можно не добавляя url сделать переход

meta baseurl тебе поможет wink.gif
Bolik

$html=file_get_html($url);
$link=$html->find('a.old', 0);
echo 'http://domen.ru'.$link->href;


должно сработать, если линк класса old на страничке один.
valery
Спасибо за советы.
Уточняю!
Программа:
<?php
include('simple_html_dom.php');
$html = file_get_html('http://domen.ru/');
$all = $html->find('div[class=old]');
for ($i = 0; $i <= count($all); $i++)
{
echo $all[$i]." ";
}

?>
Примерный результат (часть):
<div class="p" >
<h2 title="t1" >
<a class="t2" href="/old/12345/" >Example1</a>
</h2>
</div>
...
<div class="p" >
<h2 title="t1" >
<a class="t2" href="/old/56789/" >Example1</a>
</h2>
</div>
...
<div class="p" >
<h2 title="t1" >
<a class="t2" href="/old/654321/" >Example3</a>
</h2>
</div>
...

Мне надо добавить http://domen.ru к href=" , чтобы на выходе было:

<div class="p" >
<h2 title="t1" >
<a class="t2" href="http://domen.ru/old/12345/" >Example1</a>
</h2>
</div>
...
<div class="p" >
<h2 title="t1" >
<a class="t2" href="http://domen.ru/old/56789/" >Example1</a>
</h2>
</div>
...
<div class="p" >
<h2 title="t1" >
<a class="t2" href="http://domen.ru/old/654321/" >Example3</a>
</h2>
</div>
Bolik

<?php
include('simple_html_dom.php');
$html = file_get_html('http://domen.ru/');
$all = $html->find('div.old');
for ($i = 0; $i <= count($all); $i++)
{
$link=$all[$i]->find['a.t2',0]->href;
echo '<div class="p" >'.'<br/>'.'<h2 title="t1" >'.'<br/>'.'<a class="t2" href="http://domen.ru'.$link.
'".'>Example'.$i.'</a><br/></h2></div>';
}


где-то так. только я не понимаю зачем тащить весь хтмл, если занимаешься парсингом. тебе только линки нужны?
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.