Контентная фильтрация — это способ распознавания и ограничения нежелательного контента. Часто о контентной фильтрации можно слышать в контексте обеспечения информационной безопасности школ и ВУЗов.
В учебных заведениях распространена практика предоставлять учащимся возможность доступа в интернет с общественных компьютеров, к примеру, в библиотеках. При этом нужно обеспечить защиту сети от нежелательного контента, к которому могут иметь доступ студенты.
Для обеспечения такой защиты используются специальные инструменты, которые осуществляют контентную фильтрацию. Такие инструменты могут быть посвящены только контентной фильтрации или выполнять ее в рамках более широкого функционала, например, системы предотвращения утечки данных (DLP-системы).
Фильтрации могут подвергаться различные сущности — содержимое веб-страниц, по ключевым словам, URL-адреса по спискам разрешенных или запрещенных сайтов, или целые ресурсы по IP-адресам или доменным именам. Однако, последний способ относится к цензуре или блокировке, а не к контентной фильтрации.
Принцип работы любого контент-фильтра прост. Это программа, которая пропускает через себя текст и сравнивает последовательности символов с образцами, хранящимися в базе программы. База может быть предустановлена разработчиком, либо создается службой безопасности под конкретные нужды.
Если в процессе сравнения появляется совпадение, система выполняет предписанные ей действия: она может заблокировать отправку сообщения, сделать скриншот, записать информацию о событии в специальную базу данных, отправить сообщение офицеру безопасности.
У разных программ есть разные возможности. Одни срабатывают только при строгом совпадении слов или последовательностей символов. Другие умеют работать со словоформами, словами, написанными транслитом, и даже с ошибками. Наша DLP-система Falcongaze SecureTower относится ко второму типу. Такой инструмент будет надежнее защищать от трафика нежелательного контента.
Также некоторые программы могут позволять создавать группы пользователей и для каждой группы устанавливать особые правила и разрешения. К примеру, можно заблокировать соцсети для всех сотрудников, но специалистам SMM-отдела разрешить доступ к ним.
DLP-системы сканируют контент на предмет наличия конфиденциальных документов или употребления слов, которые могут свидетельствовать о вредоносной деятельности сотрудников. К примеру, о ведении переговоров с третьим сторонами, заключении сделок в обход компании, поиске новой работы, разглашении корпоративной информации. Лучшим вариантом ДЛП-системы в России и СНГ является Falcongaze SecureTower.
Базу контента, на который ДЛП-система должна обращать внимание, офицеры безопасности, как правило, создают сами. Хотя при установке системы уже с самого начала в ней есть преднастроенные словари, которые можно использовать для создания собственных политик безопасности.
Отечественная DLP программа от Фалконгейз проводит анализ поведения сотрудника на рабочем месте и при обнаружении подозрительной активности отправляет сообщение офицеру службы безопасности, а также в зависимости от настроек, может блокировать отправку сообщения или копирование текста, распечатку документа. Кроме того, происходит запись информации об инциденте в базу данных для дальнейшего проведения расследования.
Также стоит упомянуть, что DLP-система Falcongaze SecureTower может проверять не только текстовое содержимое файла, но и графическое. К примеру, в базу можно занести образцы печатей, и система будет срабатывать при обнаружении попыток отправки сканов документов с соответствующими печатями.
Можно попробовать бесплатно в течение 30-ти дней! — защититесь от утечек.
Как было сказано в самом начале, контентная фильтрация широко применяется в сфере образования. Помимо этого, инструменты контентной фильтрации применяются в промышленности, государственном секторе, организациях охраны правопорядка, не говоря об органах обеспечения государственной безопасности.
Следует отметить, что фильтрация применяется как для ограничения доступа к «внешнему контенту», так и для защиты от утечек «внутреннего контента». Принципиальных различий на низком уровне в работе фильтра в обоих случаях нет. Разница в том, что для ограничения доступа сканируются запросы, а также содержание поступающих ответов, а для защиты от утечек сканируется контент пересылаемых сообщений (в мессенджерах, по почте, через протоколы передачи файлов и т.д.). Однако анализ запросов и изучение посещаемых ресурсов имеет важное значение в обоих случаях.