[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Граббер контента
MatrixGod
Всем привет!

Хочу создать граббер контента.
Основная проблема в том что структура страницы все время меняется (добавляют / удаляют фичеры).

Думал использоваться класс DOMDocument, для того чтоб сохранить DOM и каждый раз его сравнивать прежде чем приступать к работе.

По какой-то непонятной причине мне этот подход не кажется элегантным.

Хотел бы у вас спросить кто что думает по этому поводу? Как по вашему мнению лучше подойти к решению этой проблемы? А может вам известны какие-то готовые имплементации (я лично не нашел).

Заранее спасибо!
Игорь_Vasinsky
если постоянно меняется верстка. забей. тут думать нечего.

_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
MatrixGod
Игорь_Vasinsky, я понимаю, это не просто, но все же.
хотя бы дойти до такого уровня что скрипт берет контент и как только он обнаружил что структура страницы изменилась он перестает работать и посылает скажем мыло.

мне не нужно чтоб он автоматически подстраивался под изменения. я понимаю что это не вариант.

и все же, как лучше к этому подойти?
sergeiss
Цитата (MatrixGod @ 8.08.2015 - 15:15)
Думал использоваться класс DOMDocument, для того чтоб сохранить DOM и каждый раз его сравнивать прежде чем приступать к работе.

А какие еще варианты могут быть? По-моему только так, хотя и не буду категоричен в этом утверждении.

_____________
* Хэлп по PHP
* Описалово по JavaScript
* Хэлп и СУБД для PostgreSQL

* Обучаю PHP, JS, вёрстке. Интерактивно и качественно. За разумные деньги.

* "накапливаю умение телепатии" (С) и "гуглю за ваш счет" (С)

user posted image
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.