DragomirTheSorrow
6.12.2015 - 14:09
Доброго времени суток, Господа.
Создавал парсер для сайта - все хорошо проходило и срегуляркой, пока не понял, что парсит он не то, оказалось, что код того, что действительно надо парсить генерируется ява-скриптом, не совсем соображу в какую сторону рыть и чем. Регулярки явно здесь бессильны, проще говоря, вопрос в том как подгрузить таки содержание этого скрипта, то есть его результат, потом он уже будет обрабатываться регуляркой, если это логично и вноситься в базу. Сам скрипт находится вне самого сайта, то есть он не пользовательский, хотя это тут не при чем.
Заранее спасибр за помощь.
Игорь_Vasinsky
6.12.2015 - 14:26
подгружать страницу парсером вместе с JS скриптами - а далее JS скриптом лови что нужно и аяксом передавай на сохранение.
5 000 деревянных - будет всё в лучшем виде.
_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
DragomirTheSorrow
7.12.2015 - 13:24
Спасибо, конечно, за цену, но вопрос на самом деле прост, чем подгружать этот ява скрипт? простым файл гет контентс он не подгружается...
Игорь_Vasinsky
7.12.2015 - 13:37
Цитата |
но вопрос на самом деле прост |
канеш нет. я написал как сделать.
1)подгружать страницу парсером вместе с JS скриптами
2) JS скриптом лови что нужно
3) аяксом передавай на сохранение.
всё ещё считаешь - что просто?
дай адрес жертвы и скажи что спарсить.
_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
DragomirTheSorrow
7.12.2015 - 14:21
Ок, согласен... не слишком просто, но дело того стоит:) Пока попробую сам разобраться, там посмотрим, собственно для того и занимаюсь этой фигней(чтобы самому разобраться). Одно но выдал мне запрет на доступ к сайту, если через джэс грузить...
Пойду перекурю:)
Игорь_Vasinsky
7.12.2015 - 14:23
Цитата |
если через джэс грузить... |
не надо через JS грузить)
дай говорю жертву и цель
_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
Игорь_Vasinsky, он боиться что ты сам выйдешь на клиента и заберёшь "его" работу
_____________
Стимулятор ~yoomoney - 41001303250491
Игорь_Vasinsky
7.12.2015 - 14:39
Valickпусть не боиться - я на клиентов не хожу, это они меня находят
_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
Быстрый ответ:
Powered by dgreen
Здесь расположена полная версия этой страницы.