Форум PHP программистов > почтовые адреса и телефоны

[ Поиск ] - [ Пользователи ] - [ Календарь ]

Полная Версия: почтовые адреса и телефоны

ckjet

16.11.2010 - 14:00

я уже пару дней думаю над этой проблемкой. У меня есть список сайтов, нужно с них вытаскивать телефоны и почтовые адреса. Думаю это в этот раздел.

Спустя 25 минут, 43 секунды (16.11.2010 - 13:26) waldicom написал(а):

Цитата (ckjet @ 16.11.2010 - 12:00)

Думаю это в этот раздел.

Судя по Вашему посту лучше вот в этот раздел.

Спустя 2 часа, 44 минуты, 46 секунд (16.11.2010 - 16:11) ckjet написал(а):

а решение предложить ктот может?

Спустя 20 минут, 27 секунд (16.11.2010 - 16:31) linker написал(а):

Вот в том разделе вам за $ и дадут готовое решение. Бесплатные советы и правки, но при условии что вы сами хоть что-то наработали.

Спустя 8 минут, 19 секунд (16.11.2010 - 16:40) ckjet написал(а):

наработал, те ссылки и появляются с помощью скрипта, а вот в анализ я уперся, я вот и хочу тот самый бесплатный совет ))

Спустя 1 минута, 53 секунды (16.11.2010 - 16:41) linker написал(а):

Тогда код или куски кода в студию и конкретизируйте в чем затык.

Спустя 1 час, 26 минут, 42 секунды (16.11.2010 - 18:08) ckjet написал(а):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
<head>
<title>Парсер</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</head>

<body>

<?php
include 'func.php';
//$region=$_POST['reg'];

$i=0;
while($i!=4){
$url="yandex.ua/yandsearch?p=$i&date=&text=Недвижимость&numdoc=50&lr=11470";
$agent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; ru-RU; rv:1.7.12) Gecko/20050919 Firefox/1.0.7';
$header[] = "Accept: text/html;q=0.9, text/plain;q=0.8, image/png, */*;q=0.5" ;
$header[] = "Accept_charset: windows-1251, utf-8, utf-16;q=0.6, *;q=0.1";
$header[] = "Accept_encoding: identity";
$header[] = "Accept_language: en-us,en;q=0.5";
$header[] = "Connection: close";
$header[] = "Cache-Control: no-store, no-cache, must-revalidate";
$header[] = "Keep_alive: 300";
$header[] = "Expires: Thu, 01 Jan 1970 00:00:01 GMT";
$ch = curl_init();
$return = array();
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
$r=rand(1,rand(2,30));
curl_setopt($ch, CURLOPT_TIMEOUT, $r);
curl_setopt ($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt ( $ch , CURLOPT_USERAGENT , $agent);
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $header);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HTTPPROXYTUNNEL, 1);
curl_setopt ($ch, CURLOPT_COOKIE, '4cd700240f81e1e3.dHyizSxjbQQzxsrPOh5ZZCnq8H22i26dVksG0qSHNqXj5SBpcXN_UI434m6iTPscQ0h3vm1ubCT4YY_McUKa5WNZ4dGGrW8P4-jtBqEyfdS6s2eFrY013ayUW_LIeX5O');
$text = curl_exec($ch);
curl_close($ch);
//print_r($text);
preg_match_all('|<a class="b-serp-item__title__link" tabindex="2" href="(.*)" onmousedown=|mi',$text,$cont);
foreach($cont as $k => $v) {
$cont=$v;
}
?><hr><?php
foreach($cont as $l => $v){
$arg=parse_url($cont[$l]);
$cont[$l]=$arg['host'];
}
$res[]=$cont;
$i++;}
foreach($res as $k => $v) {
foreach($v as $k2 => $v2) {
$result[$i]=$v2;
$i++;
}
}
echo '<table border="3"><tr><td>№</td><td>Сайт</td><td>e-mail< /td><td>Номер телефона</td></tr>';
foreach($result as $k => $v) {
$n=$k-3;
echo "<tr><td>$n</td><td>$v</td><td></td><td></td></tr>";

}
echo "</table>";
// print_r($res);
?>
</body>
</html>

Спустя 1 минута, 1 секунда (16.11.2010 - 18:09) ckjet написал(а):

вот собственно код, мне нужно что б ссылки которые спарсил анализировал и находил имеил и телефоны, думаю это регулярным выражением, но вот как незнаю.

Спустя 8 минут (16.11.2010 - 18:17) inpost написал(а):

http://irbis-team.com/15/20

Спустя 33 минуты, 40 секунд (16.11.2010 - 18:51) ckjet написал(а):

там не того что мне нужно.

Спустя 2 минуты, 56 секунд (16.11.2010 - 18:54) inpost написал(а):

ckjet
Ну да, ирбис учит думать, а не копи-пастить! Там полностью дотошно рассказано, как работать с регулярками. Изучив регулярки на 100% по тому курсу, ты сам напишешь регулярку по поиску необходимого тебе значения! И только в том случае, если регулярка будет не так работать как надо - тогда к нам.
Или ты хочешь халявы, чтобы мы за тебя написали?

Спустя 16 секунд (16.11.2010 - 18:54) ckjet написал(а):

к примеру рег выражение (?:8|\+7)? ?$?(\d{3})$? ?(\d{3})[ -]?(\d{2})[ -]?(\d{2}) как мне при совпадении вытягивать это совпадение?

Спустя 38 секунд (16.11.2010 - 18:55) ckjet написал(а):

там такого не написано

Спустя 1 минута, 53 секунды (16.11.2010 - 18:57) Basili4 написал(а):

preg_math

Спустя 2 минуты, 53 секунды (16.11.2010 - 18:59) inpost написал(а):

ckjet
ну вот, правильно задал вопрос - получил ответ.

Спустя 17 часов, 30 минут, 43 секунды (17.11.2010 - 12:30) ckjet написал(а):

Цитата

preg_math

preg_match возвращает массив и насколько знаю третий номер элемента это то самое совпадение моему выражению. Верно?

Быстрый ответ:

Здесь расположена полная версия этой страницы.