Правила     Закладки     Карма    Календарь    Журналы    Помощь    Поиск    PDA    Чат   
        СМС-ки
   
Пейджер выключен!
Страницы: (4) 1 [2] 3 4  ( Перейти к первому непрочитанному сообщению )  
Фильтр авторов:    показать 
  скрыть
  Ответ в темуСоздание новой темыСоздание опроса

> Защита от парсинга, капча, куки, cron
inpost  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Помагите Здесь живу!!!
******

Профиль
Группа: Эксперт
Группа переписки
Сообщений: 22691
Пользователь №: 20039
На форуме: 6 лет, 11 месяцев, 28 дней
Карма: 599




FatCat
Поделишься этими трюками для определения пользователя от бота? Если часть держишь в тайне, напиши в ЛС, если не секрет.


--------------------
Обучаю веб-программированию качественно и не дорого: http://school-php.com
Фрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
PMПисьмо на e-mail пользователюICQ
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
depp  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 293
Пользователь №: 40589
На форуме: 2 года, 2 дня
Карма: 19




Цитата (Медведь @ 14.03.2016 - 15:33)
Можешь время в сессию писать или таблицу (timestamp), каждого пользователя нужно идентифицировать.

а если робот не принимает куку, то получается каждый раз новый посетитель. опять же не работает.
оценивать надо поведенческие факторы. а это каждый раз индивидуальный случай.
PMПисьмо на e-mail пользователю
    1   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Медведь  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: ★ЛжеЭксперт★
Завсегдатай форума
Сообщений: 2482
Пользователь №: 37963
На форуме: 3 года, 3 месяца, 25 дней
Карма: 27




Цитата (depp @ 14.03.2016 - 16:03)
Цитата (Медведь @ 14.03.2016 - 15:33)
Можешь время в сессию писать или таблицу (timestamp), каждого пользователя нужно идентифицировать.

а если робот не принимает куку, то получается каждый раз новый посетитель. опять же не работает.
оценивать надо поведенческие факторы. а это каждый раз индивидуальный случай.

IP


--------------------

Заходил 29.09.2016
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
depp  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 293
Пользователь №: 40589
На форуме: 2 года, 2 дня
Карма: 19




Цитата (Медведь @ 14.03.2016 - 16:03)
IP

А если это офис сидит какой-нить в 100 человек, и все на вашем сайте сидят? (редко, но имеет место быть)
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Медведь  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: ★ЛжеЭксперт★
Завсегдатай форума
Сообщений: 2482
Пользователь №: 37963
На форуме: 3 года, 3 месяца, 25 дней
Карма: 27




Цитата (depp @ 14.03.2016 - 16:07)
А если это офис сидит какой-нить в 100 человек, и все на вашем сайте сидят? (редко, но имеет место быть)

Согласен, читайте выше, отдаём капчу.


--------------------

Заходил 29.09.2016
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
casper - gg  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Абориген
*****

Профиль
Группа: Пользователь
Сообщений: 216
Пользователь №: 42190
На форуме: 1 год, 1 день
Карма: 10




PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
FatCat  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Чеширский кот
******

Профиль
Журнал
Группа: Администратор
Почтальон группы
Сообщений: 5907
Пользователь №: 1
На форуме: 10 лет, 9 месяцев, 26 дней
Карма: 125

Не пью :
22 года, 2 месяца, 29 дней


Цитата (inpost @ 14.03.2016 - 14:50)
Поделишься этими трюками для определения пользователя от бота?

Сейчас напишу в личку. smile.gif


--------------------
Бесплатному сыру в дырки не заглядывают...
PMПисьмо на e-mail пользователюICQ
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
depp  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 293
Пользователь №: 40589
На форуме: 2 года, 2 дня
Карма: 19




Цитата (FatCat @ 14.03.2016 - 16:28)
Цитата (inpost @ 14.03.2016 - 14:50)
Поделишься этими трюками для определения пользователя от бота?

Сейчас напишу в личку. smile.gif

мне тоже интересно. скините?
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
icedfox  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 395
Пользователь №: 41702
На форуме: 1 год, 3 месяца, 22 дня
Карма: 13




arbuzmaster. Давайте зададимся вопросом , чего в итоге Вы боитесь после того как ваш контент спарсили ?
Если не уникального контента, то это рано или поздно произойдет. Решается довольно тривиально.
1. Создаем страницу.
2. Размещаем на нее несколько ссылок с обзоров, которые являются логическими по отношению к странице.
3. Кормим все это поисковикам.
4. После этого, любые дубли (копии) страницы, которые появились позже, будут учитываться поисковиками как цитирование первоисточника, т.е. вашей страницы. И вашей странице это будет только в плюс.
PM
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Bolik  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 352
Пользователь №: 35724
На форуме: 4 года, 16 дней
Карма: 4




если уж так боитесь парсинга, то зачем выкладывать инфу в интернет вообще? что мешает юзеру сохранить страничку или несколько и потом уже парсить?
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Invis1ble  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме




******

Профиль
Группа: Эксперт
Группа переписки
Сообщений: 11786
Пользователь №: 23195
На форуме: 6 лет, 4 месяца, 12 дней
Карма: 429

Трезвый :
7 лет, 3 месяца, 12 дней


Цитата (Bolik @ 14.03.2016 - 17:31)
если уж так боитесь парсинга, то зачем выкладывать инфу в интернет вообще? что мешает юзеру сохранить страничку или несколько и потом уже парсить?

Люди просто не понимают, как работает web.


--------------------
PMПисьмо на e-mail пользователюСайт пользователя
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
twin  
Дата
Цитировать сообщение

Пользователь сейчас на форуме



Глухой нуб
******

Профиль
Группа: Администратор
Почтальон группы
Сообщений: 15561
Пользователь №: 6543
На форуме: 8 лет, 2 месяца, 2 дня
Карма: 299

Трезвый :
5 лет, 11 месяцев, 12 дней


Последнее время особенно часто появляются такие темы
1. Как спарсить
2. Как защититься.
biggrin.gif

Природа обоих практически одинакова - лень. Первый сам не хочет делать контент. Второй хочет сделать один раз и всю жизнь пожинать плоды.

Если ты отдал контент, он уже не твой. Он в браузере юзера. Или в парсере конкурента. Не важно. Защитьиться от этого нельзя, да и думать на эту тему не стоит. Только живой работой с контентом можно быть на шаг впереди конкурентов и в топах выдачи.


--------------------
Если вам недостаточно собственных заблуждений, можно расширить их мнениями экспертов.

Нужно уважать мнение оппонета. Ведь заблуждаться - его святое право.

Зачем ворошить старое, когда можно наворотить новое?

user posted image
PMСайт пользователяICQ
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
arbuzmaster  
 ۩  Дата
Цитировать сообщение

Пользователь сейчас на форуме



Новичок
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 720
Пользователь №: 37872
На форуме: 3 года, 4 месяца, 10 дней
Карма: 21




Дело даже не в самом контенте, а в том, что выдают скрипты, по сути сам контент не важен(там особо ничего нет). Привожу пример - есть скрипт который получает прямые ссылки на видео ролики с Youtube, так вот если например пользователь скопировал ссылку на
контент - ничего страшного в этом нет через 24 часа она уже будет не ликвидна. А другое дело когда ты можешь отправлять запросы напрямую скрипту и получать от него ликвидные ссылки постоянно. Вот собственно о чем речь, как от этого защититься!


--------------------
PMПисьмо на e-mail пользователюСайт пользователя
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
icedfox  
Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 395
Пользователь №: 41702
На форуме: 1 год, 3 месяца, 22 дня
Карма: 13




arbuzmaster, это называется защита от хотлинка. Реализаций масса различных. Самое простое, генерируй CSRF token , вставляй его в ссылку, на стороне сервера проверяй валидность токена.
Генерировать можно на базе любых параметров, начиная от IP юзера и его браузера
PM
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
arbuzmaster  
 ۩  Дата
Цитировать сообщение

Пользователь сейчас на форуме



Новичок
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 720
Пользователь №: 37872
На форуме: 3 года, 4 месяца, 10 дней
Карма: 21




Цитата (icedfox @ 14.03.2016 - 19:49)
arbuzmaster, это называется защита от хотлинка. Реализаций масса различных. Самое простое, генерируй CSRF token , вставляй его в ссылку, на стороне сервера проверяй валидность токена.
Генерировать можно на базе любых параметров, начиная от IP юзера и его браузера

Спасибо - буду изучать этого зверя! cool.gif


--------------------
PMПисьмо на e-mail пользователюСайт пользователя
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
  Быстрый ответ
Информация о Госте
Введите Ваше имя
Кнопки кодов
Для вставки цитаты, выделите нужный текст и
НАЖМИТЕ СЮДА
Введите сообщение
Смайлики
:huh:  :o  ;) 
:P  :D  :lol: 
B)  :rolleyes:  <_< 
:)  :angry:  :( 
:unsure:  :blink:  :ph34r: 
     
Показать всё

Опции сообщения  Включить смайлики?
 Включить подпись?
 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темыСтраницы: (4) 1 [2] 3 4  Ответ в темуСоздание новой темыСоздание опроса