hostinfo.ru | 27.07.2007

На сегодняшний день WordPress является самым популярным блоговым движком с открытым исходным кодом – его использует более 70% пользователей, ведущих автономные блоги. Движок очень просто устанавливается и настраивается, поддерживает XHTML и CSS, позволяет выбрать тему оформления, поддерживает использование подключаемых модулей (плагинов). Разработано огромное количество плагинов, способных удовлетворить все мыслимые и немыслимые потребности пользователей. Сегодня речь пойдет о плагинах для фильтрации спама различного происхождения. Наиболее полный список этих плагинов приведен здесь, а мы рассмотрим самые интересные.

Можно выделить три основных типа спама, возможных в WordPress.

Спам в комментариях. Самый распространенный и весьма неприятный тип спама. Для борьбы с ним используются средства автоматической фильтрации сообщений на основе их лексического анализа или CAPTCHA. Оба способа не лишены недостатков. Плагины для автоматической фильтрации часто отсеивают довольно большую часть полезных сообщений, а ручная проверка очереди сообщений на спам на крупных сайтах может стать настоящей головной болью. А для CAPTCHA любого уровня сложности при желании можно написать скрипт распознавания проверочного изображения.

Спам в трекбэках (trackback). Трекбэк представляет собой способ дистанционного взаимодействия между различными сайтами. Один из сайтов, поддерживающих эту технологию, может уведомить другой о связи между некоторыми их частями. Для этого первый сайт посылает второму сообщение – так называемый трекбэк-пинг (Trackback Ping). Получивший сообщение сайт отправляет подтверждение в виде XML-сообщения. Возможны массовые нежелательные рассылки трекбэк-пинга. Проще говоря, спам. Для борьбы с ним разработан ряд плагинов, большинство из которых проверяют сайт-источник на наличие ссылки на ваш блог. Если такой ссылки нет, трекбэк-пинг помещается в очередь на модерирование.

Спам в реферерах. Большинство пользователей получают статистику блога с помощью одного из стандартных сервисов, например LiveInternet.Ru. Многие оставляют эту статистику (в том числе список рефереров сайта) в открытом доступе. Этим могут воспользоваться спамеры, которым достаточно запустить на сайт пару роботов для размещения спама в комментариях, чтобы попасть в список ваших рефереров. Следовательно, для борьбы с такого рода спамом необходимо нейтрализовать спам в комментариях. Для этого также разработан ряд плагинов.

Далее сосредоточим свое внимание на фильтрации спама в комментариях.

Начнем с пары универсальных плагинов, фильтрующих все виды спама.

Плагин Bad Behavior производит фильтрацию спама всех основных типов. На основе анализа HTTP-запросов роботов и сравнения их с типичными HTTP-запросами пользователей сайта блокируются большинство сообщений нежелательного характера. Сравнение может осуществляться как непосредственно по строкам запроса, так и с использованием регулярных выражений.

Плагин Bad Behavior

Подробное описание плагина можно найти здесь, а загрузить его – отсюда.

Проанализировать статистику работы плагина и задать его настройки можно на странице «Настройки – Bad Behavior».

Плагин Akismet использует более сложный и эффективный механизм. После добавления нового комментария или трекбэка он перенаправляется веб-сервису Akismet, который проверяет сообщение с помощью множества специальных тестов и выносит вердикт о его принадлежности к спаму. Распознанные как спам сообщения сохраняются на вкладке «Комментарии – Akismet spam» (фильтруется только спам на английском языке).

Подробное описание Akismet можно найти на странице плагина, а загрузить его – отсюда. После загрузки и активации плагина потребуется ввести код активации (API Key). Для его получения необходимо зарегистрироваться на сайте WordPress.com, после чего код будет выслан по почте. Использование плагина бесплатно для обычных пользователей, не размещающих рекламу в своем блоге.

Для работы этого плагина на вашем хостинге должны быть разрешены функции PHP, отвечающие за создание удаленного соединения.

Если же по каким-то причинам использовать этот плагин не удается, то для него есть вполне достойная замена. По словам разработчика, плагин Simple Spam Filter успешно определяет более 90% нежелательных сообщений в комментариях. Подробное описание плагина приведено на странице плагина, а загрузить его можно отсюда. Блокируются комментарии, соответствующие одному из следующих условий:

  • текст комментария содержит пять или более ссылок на другие сайты;
  • текст комментария содержит одно или несколько слов из «черного» списка.

Содержимое списка можно посмотреть в исходном файле плагина.

Плагин Peter’s Custom Anti-Spam Image

Этот плагин может использоваться вместе с другими для предварительной фильтрации комментариев. Еще одним достоинством Simple Spam Filter являются низкие требования этого плагина к ресурсам, что позволяет эффективно использовать его в связке с другими плагинами.

В завершение обзора поговорим о паре плагинов для реализации CAPTCHA.
Первый из них, Peter’s Custom Anti-Spam Image, формирует проверочное изображение с некоторым словарным словом на белом фоне (набор слов может изменяться администратором ресурса).

Согласитесь, пользователям гораздо проще и приятнее разбирать слова, чем пытаться распознать неудобоваримые сочетания перевернутых букв и цифр на пестром фоне.

Шрифт надписи, его размер, цвет надписи и угол наклона текста варьируются в широких пределах. Плагин не использует cookies. Его подробное описание можно найти здесь, а загрузить плагин – отсюда.

А за идею следующего плагина его разработчикам можно смело ставить памятник. В основу reCaptcha положена восхитительная и в то же время очень полезная идея. Пользователю предлагается разобрать фрагмент отсканированного из настоящей книги текста, состоящий из двух слов. Отсканированный текст в силу своей природы очень плохо распознается компьютером. Поэтому разработчики плагина и решили возложить эту нелегкую задачу на плечи пользователя.

Плагин reCaptcha

Но как же проверить правильность введенного пользователям ответа? Очень просто. Одно из двух слов заранее подбирается таким образом, чтобы оно хорошо распознавалось компьютером, второе – нет. Если пользователь правильно распознает первое слово, его ответ считается правильным и результат распознавания второго слова передается на сервер. После этого второе слово повторно передается для распознавания нескольким пользователям, и по общему результату всех проверок принимается решение о правильном варианте для второго слова. Таким образом пользователи вносят свой вклад в распознавание книг электронного архива Internet Archive.

Подробное описание плагина приведено здесь, а загрузить его можно отсюда. После установки и активации плагина его необходимо зарегистрировать. Для получения регистрационного кода воспользуйтесь ссылкой, которая появится в окне управления плагинами после активации reCaptcha.

На этом обзор плагинов для борьбы со спамом завершен. В одной из следующих статей мы поговорим о плагинах для монетизации блога.

Ссылки по теме

Понравился или оказался полезным этот пост?

Подпишитесь на обновления блога по RSS или читайте его в своей френдленте ЖЖ

Читайте также


Оставить комментарий

Вы можете использовать теги <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>