Как защитить сайт от воровства статей (копипастеров)

0
Как защитить сайт от воровства статей (копипастеров)

Вряд ли кому-то понравится видеть свои статьи на чужих блогах, особенно если они популярнее. Чаще всего проблема незаконного копирования возникает на блоговых платформах, где проще находить чужие блоги, ввиду того, что такой деятельностью занимаются в основном ТП (надеюсь вы знаете кто это . Иногда приходится сталкиваться с промышленным копипастом, когда этим занимается с виду приличный сайт, владелец которого хочет рубить бабло ничего не делая.

Корень зла

Приходилось сталкиваться и с тем и с другим. Если от первой категории защитится просто, то со второй хуже — эти копипастеры обладают достаточным уровнем интеллекта, чтобы залезть в исходный код или использовать автоматическое наполнение своих говноресурсов через скрипты.

Особенно охотится любят на молодые блоги/сайты, которые еще не проиндексированы. Да даже если проиндексированы, это тоже не страшно, потому что они далеко за несколько сотен в выдаче, т.е. совсем не конкуренты. Скопипащенная статья в таком случае гарантированно занимает какие-то позиции, при условии что ГС продвигается.

А при особом везении копипаст засчитается как «уникальный». И есть вероятность того, что источник может схлопотать фильтр.

Ушлые СЕОшники придумали такую хитрость — обратную ссылку на источник. Тогда для ПС это вроде как чисти и для источника не плохо — кому лишняя ссылка повредит.
Способы борьбы

Если поискать на эту тему, окажется, что чаще всего предлагают отключить правую кнопку мыши или буфер обмена. Обычно это делается через JavaScript или css.

Следующая хитрость — использовать оригинальные тексты в Яндекс Вебмастере и авторство Google. Чтобы они сразу знали, кто настоящий автор.

Не менее часто советуют ставить больше ссылок на свои страницы, чтобы в случае воровства хотя бы получить какую-то пользу. Но скорее всего текст скопируют без них, а скрипты можно научить удалять их, либо выставлять rel=»nofollow».

Некоторые умельцы пишут такие скрипты, которые превращают скопированный текст в кашу. Особенно меня бесит, когда так делают блоги про линукс, где выкладываются длинные команды. Какого черта они делают гайды, если это все нельзя скопировать?!

В общем, для блога это не вариант. Поэтому я написал свой скрипт.
Ограничение выделения

В моем случае он дает выделять не больше 100 символов. Их вполне достаточно для того, чтобы скопировать команду, название или еще что-то короткое.

<script type=’text/javascript’>
setInterval(«copyblock(window.getSelection().toString())», 10);
function copyblock(a) {if (a.length > 100) {window.getSelection().removeAllRanges();} else {document.selection.empty();}}
</script>

Кстати блоки с кодом этот скрипт не затрагивает. Для их вывода я использую плагин SyntaxHighlighter, он самый функциональный из подобных, поддерживает много языков.
Блокировка подозрительных агентов

Для этого подойдет любой плагин, способный это осуществить. В моем случае — Better WP Security.

Как-то однажды я заметил странное посещение. User-agent — это параметр, содержащий название программы, которая запрашивает загрузку страницы. Так вот, это был URLGrabber.

Зная о любви некоторых СЕОшников в новым блогам, я тут же его забанил. Прямо перед началом попытки закачать кучу страниц моего блога.
Больше внимания статистике

Если бы я туда не заглядывал, то не предотвратил бы вовремя пиратство. Но чтобы знать такие подробности, сторонние сервисы не подойдут. Нужна встроенная статистика.

Для WordPress есть несколько таких плагинов, заслуживающих внимания: StatPress, WP-stats, WP SlimStat, mySTAT.

LEAVE A REPLY