[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: PHP парсинг
RockerMisha
Здравствуйте, решил начать изучать парсинг, но понятия не имею откуда копать и куда, в гугле ничего толкового не нашел, хочу написать простенький парсер , который бы логинился на мю страницу ВК и записывал в табличку посещения моего аккаунта, не знаю, но мне почему-то кажется что это не очень сложно, но я вообще не имею представления о парсинге и как он делается, какие функции при этом берут участие, даже как залогиниться через свой скрипт не понимаю, у кого есть свободная минутка, разьясните чайнику пожалуйста!



Спустя 17 минут, 53 секунды (25.07.2012 - 18:30) Winston написал(а):
Цитата (RockerMisha @ 25.07.2012 - 18:12)
хочу написать простенький парсер , который бы логинился на мю страницу ВК

Так это уже не парсер, а на подобии бота smile.gif
Вот пример авторизации на сайтах http://phpforum.ru/index.php?showtopic=50868

Цитата (RockerMisha @ 25.07.2012 - 18:12)
как он делается, какие функции при этом берут участие

file_get_contents(), CURL, regexp.

Спустя 3 минуты, 14 секунд (25.07.2012 - 18:34) RockerMisha написал(а):
Цитата (Winston @ 25.07.2012 - 15:30)
Цитата (RockerMisha @ 25.07.2012 - 18:12)
хочу написать простенький парсер , который бы логинился на мю страницу ВК

Так это уже не парсер, а на подобии бота smile.gif
Вот пример авторизации на сайтах http://phpforum.ru/index.php?showtopic=50868

Цитата (RockerMisha @ 25.07.2012 - 18:12)
как он делается, какие функции при этом берут участие

file_get_contents(), CURL, regexp.

парсер со смесью бота)
не спарсить же входы на твой аккаунт без входа на аккаунт)

Спустя 11 минут, 53 секунды (25.07.2012 - 18:45) Winston написал(а):
Цитата (RockerMisha @ 25.07.2012 - 18:34)
не спарсить же входы на твой аккаунт без входа на аккаунт)

wacko.gif

Спустя 26 минут, 30 секунд (25.07.2012 - 19:12) RockerMisha написал(а):
Цитата (Winston @ 25.07.2012 - 15:45)
Цитата (RockerMisha @ 25.07.2012 - 18:34)
не спарсить же входы на твой аккаунт без входа на аккаунт)

:wacko:

удалось авторизироваться таким образом


<?php
$user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 6.0; ru; rv:1.9.2.13) ' .
'Gecko/20101203 Firefox/3.6.13 ( .NET CLR 3.5.30729)';

$cookie = '';

$login = '';
$password = '';

$ch = curl_init();

// true т.к. мы будем отправлять post запрос:
curl_setopt($ch, CURLOPT_POST, true);

// чтобы сайт думал, что мы - браузер:
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);

// ответ сервера будем записывать в переменную
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_TIMEOUT, 10);

// по редиректам будем переходить автоматически.
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

curl_setopt($ch, CURLOPT_URL, 'http://login.vk.com/?act=login');

//Формирование запроса таким образом, я счел более наглядным
$post = array(
'act' => 'login',
'q' => '',
'al_frame' => '1',
'expire' => '',
'captcha_sid' => '',
'captcha_key' => '',
'from_host' => 'vkontakte.ru',
'email' => $login,
'pass' => $password
);

curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($post));

$answer = curl_exec($ch);

/* В $answer нам приходит javascript, который и устанавливает куки
с названием: remixsid Нам нужно cпарсить эти 60 символов,
идентификатора сессии. с помощью них vkontakte поймет,
что мы авторизировались.*/


$sid = substr($answer, strpos($answer, "setCookieEx('sid', '") + 20, 60);
$cookie = 'remixsid=' . $sid;

curl_setopt($ch, CURLOPT_POST, false);
curl_setopt($ch, CURLOPT_COOKIE, $cookie);

// укажем страницу, с которой мы получим данные для проверки
curl_setopt($ch, CURLOPT_URL, 'http://vk.com/');

$answer = curl_exec($ch);

echo $answer;

curl_close($ch);


а дальше как мне перейти в настройки, открыть всплывающее окно и спарсить инфу о заходах в аккаунт?

Спустя 14 часов, 41 минута, 40 секунд (26.07.2012 - 09:54) RockerMisha написал(а):
ребят ну научите воровать=)
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.