[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Защита от парсинга
Страницы: 1, 2, 3, 4
inpost
FatCat
Поделишься этими трюками для определения пользователя от бота? Если часть держишь в тайне, напиши в ЛС, если не секрет.

_____________
Обучаю веб-программированию качественно и не дорого: http://school-php.com
Фрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
depp
Цитата (Медведь @ 14.03.2016 - 15:33)
Можешь время в сессию писать или таблицу (timestamp), каждого пользователя нужно идентифицировать.

а если робот не принимает куку, то получается каждый раз новый посетитель. опять же не работает.
оценивать надо поведенческие факторы. а это каждый раз индивидуальный случай.
Миша
Цитата (depp @ 14.03.2016 - 16:03)
Цитата (Медведь @ 14.03.2016 - 15:33)
Можешь время в сессию писать или таблицу (timestamp), каждого пользователя нужно идентифицировать.

а если робот не принимает куку, то получается каждый раз новый посетитель. опять же не работает.
оценивать надо поведенческие факторы. а это каждый раз индивидуальный случай.

IP

_____________
Принимаю заказы, писать в ЛС
depp
Цитата (Медведь @ 14.03.2016 - 16:03)
IP

А если это офис сидит какой-нить в 100 человек, и все на вашем сайте сидят? (редко, но имеет место быть)
Миша
Цитата (depp @ 14.03.2016 - 16:07)
А если это офис сидит какой-нить в 100 человек, и все на вашем сайте сидят? (редко, но имеет место быть)

Согласен, читайте выше, отдаём капчу.

_____________
Принимаю заказы, писать в ЛС
casper - gg
мехнизм подписи формы
FatCat
Цитата (inpost @ 14.03.2016 - 14:50)
Поделишься этими трюками для определения пользователя от бота?

Сейчас напишу в личку. smile.gif

_____________
Бесплатному сыру в дырки не заглядывают...
depp
Цитата (FatCat @ 14.03.2016 - 16:28)
Цитата (inpost @ 14.03.2016 - 14:50)
Поделишься этими трюками для определения пользователя от бота?

Сейчас напишу в личку. smile.gif

мне тоже интересно. скините?
icedfox
arbuzmaster. Давайте зададимся вопросом , чего в итоге Вы боитесь после того как ваш контент спарсили ?
Если не уникального контента, то это рано или поздно произойдет. Решается довольно тривиально.
1. Создаем страницу.
2. Размещаем на нее несколько ссылок с обзоров, которые являются логическими по отношению к странице.
3. Кормим все это поисковикам.
4. После этого, любые дубли (копии) страницы, которые появились позже, будут учитываться поисковиками как цитирование первоисточника, т.е. вашей страницы. И вашей странице это будет только в плюс.
Bolik
если уж так боитесь парсинга, то зачем выкладывать инфу в интернет вообще? что мешает юзеру сохранить страничку или несколько и потом уже парсить?
Invis1ble
Цитата (Bolik @ 14.03.2016 - 17:31)
если уж так боитесь парсинга, то зачем выкладывать инфу в интернет вообще? что мешает юзеру сохранить страничку или несколько и потом уже парсить?

Люди просто не понимают, как работает web.

_____________

Профессиональная разработка на заказ

Я на GitHub | второй профиль

twin
Последнее время особенно часто появляются такие темы
1. Как спарсить
2. Как защититься.
biggrin.gif

Природа обоих практически одинакова - лень. Первый сам не хочет делать контент. Второй хочет сделать один раз и всю жизнь пожинать плоды.

Если ты отдал контент, он уже не твой. Он в браузере юзера. Или в парсере конкурента. Не важно. Защитьиться от этого нельзя, да и думать на эту тему не стоит. Только живой работой с контентом можно быть на шаг впереди конкурентов и в топах выдачи.

_____________
Если вам недостаточно собственных заблуждений, можно расширить их мнениями экспертов.

Нужно уважать мнение оппонета. Ведь заблуждаться - его святое право.

Настаивал, настаиваю и буду настаивать на своем. На кедровых орешках.

user posted image
arbuzmaster
Дело даже не в самом контенте, а в том, что выдают скрипты, по сути сам контент не важен(там особо ничего нет). Привожу пример - есть скрипт который получает прямые ссылки на видео ролики с Youtube, так вот если например пользователь скопировал ссылку на
контент - ничего страшного в этом нет через 24 часа она уже будет не ликвидна. А другое дело когда ты можешь отправлять запросы напрямую скрипту и получать от него ликвидные ссылки постоянно. Вот собственно о чем речь, как от этого защититься!

_____________
Мой первый сайтик

Посмотри на свой XBMC под другим углом
icedfox
arbuzmaster, это называется защита от хотлинка. Реализаций масса различных. Самое простое, генерируй CSRF token , вставляй его в ссылку, на стороне сервера проверяй валидность токена.
Генерировать можно на базе любых параметров, начиная от IP юзера и его браузера
arbuzmaster
Цитата (icedfox @ 14.03.2016 - 19:49)
arbuzmaster, это называется защита от хотлинка. Реализаций масса различных. Самое простое, генерируй CSRF token , вставляй его в ссылку, на стороне сервера проверяй валидность токена.
Генерировать можно на базе любых параметров, начиная от IP юзера и его браузера

Спасибо - буду изучать этого зверя! cool.gif

_____________
Мой первый сайтик

Посмотри на свой XBMC под другим углом
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.