author

    Владимир Кадыко

    Технический директор компании Falcongaze

    Обновлено: 
    12 мин.

    Сбор, хранение и анализ больших массивов данных в DLP-системе SecureTower

    Сегодня мы можем наблюдать среди компаний значительное увеличение спроса на сбор, анализ и длительное хранение больших объемов данных, которые генерируют пользователи и устройства.

    Рост заинтересованности легко объяснить: информация — это «новая нефть». Крупные корпорации, вроде Coca-Cola, Netflix и Procter & Gamble, собирают и обрабатывают огромные массивы данных, чтобы предсказывать потребительский спрос и создавать прогностические модели для новых продуктов или услуг — и делают это достаточно эффективно.

    В контексте обеспечения информационной безопасности сбор и анализ больших объемов данных являются неотъемлемыми составляющими процесса. Анализ позволяет выявлять закономерности, которые могут указывать на подозрительную активность и неочевидные на первый взгляд взаимосвязи, прогнозировать и предотвращать угрозы, выявлять уязвимости внутри информационной системы организации и так далее.

    Очевидно, что данные, необходимые для такого анализа, будут чрезвычайно объемны, разнообразны и поступают слишком быстро, чтобы получилось обрабатывать их вручную. Для автоматизации процесса необходимо использовать специальные инструменты, такие как DLP-системы.

    Далее мы рассмотрим сбор, анализ и хранение больших объемов данных на примере DLP-системы Falcongaze SecureTower.


    DLP SecureTower и сбор больших данных в организациях

    Сразу после установки SecureTower выполняется дистанционная установка агентов на рабочие станции интересующих сотрудников — и система начинает перехватывать данные практически по всем каналам, в том числе:

    • веб-активность, посещенные сайты, время, проведенное на них;
    • email-переписки по всем протоколам и их зашифрованным аналогам;
    • переписки в мессенджерах, социальных сетях;
    • время запуска и выключения компьютера, время простоя и активности;
    • используемые в течение рабочего дня приложения;
    • файлы, отправляемые на печать на локальных и сетевых принтерах и проч.
    Пример интерфейса SecureTower с отчётом по пользовательской активности

    Вся перехваченная с компьютеров информация передается на Прокси-сервер агентов, а затем — на Центральный сервер. Помимо перехвата данных, получаемых с агентов, система может работать централизованно: перехватывать сетевой трафик, данные почтового и прокси-сервера.

    Схема потока данных: агенты — прокси сервер — центральный сервер SecureTower

    Центральный сервер отвечает за хранение и обработку данных, а также за настройку поисковых словарей, банков контрольных сумм и цифровых отпечатков. Для хранения данных сервер позволяет подключать следующие популярные СУБД: Microsoft SQL Server, Oracle, PostgreSQL, MySQL, SQLite.


    Какой объем данных собирает DLP-система и как долго хранит?

    SecureTower — это решение, оптимизированное для обработки больших объемов информации. Это особенно важно для крупных организаций.

    В системе SecureTower предусмотрены гибкие правила распределения данных, которые позволяют Центральному серверу осуществлять изолированное хранение и параллельную обработку перехваченных данных.

    Все данные сохраняются на серверах клиента. Это значит, что никто не имеет к ним доступа, кроме правообладателя.


    Как рассчитать объем хранилища для перехваченных данных?

    В среднем, организация с двумястами сотрудников за один месяц генерирует около 300 ГБ данных, куда входят «сырые» данные и индексы для поиска. Это среднее значение, которое зависит от сферы деятельности организации и от требований безопасности.

    Рассчитать приблизительный объем необходимого дискового пространства можно по формуле 1,5 ГБ данных на 1 пользователя в месяц.

    Например: 1,5 ГБ × 200 сотрудников × 6 месяцев = 1800 ГБ. Ориентировочно такой объем хранилища потребуется для данных, полученных от двухсот пользователей за полгода работы.

    Оценка дискового пространства для хранения данных
    Параметр Значение Комментарий
    Норма на 1 пользователя ≈ 1,5 ГБ/мес Включает «сырые» данные и индексы
    Пример расчёта 1,5 × 200 × 6 = 1800 ГБ 200 сотрудников, глубина хранения 6 месяцев
    Факторы роста +30–100% Медиа-контент, высокая интенсивность переписки, расширенные политики

    Как долго система хранит данные?

    Срок хранения данных определяется не только объемом хранилища, но и вычислительной мощностью, необходимой для поиска по всему архиву.

    В системе предусмотрен инструмент для автоматизированного управления объемом перехваченных данных и глубиной хранения. При достижении лимита система автоматически удалит старые данные и освободит место для новых.

    • Где управлять глубиной хранения?
       

      В настройках Центрального сервера задаются лимиты и политика автоочистки; поддерживается раздельная глубина для типов данных.

    • Можно ли хранить раздельно «сырые» данные и индексы?
       

      Да, для оптимизации стоимости и быстродействия возможна раздельная конфигурация хранилищ и разные SLA хранения.

    Чем могут быть полезны большие данные?

    Сегодня наши клиенты все чаще обращаются с запросом на длительное хранение больших объемов данных с возможностью поиска за интересующий период. Это открывает следующие возможности.

    Возможность проводить ретроспективный анализ

    Благодаря накопленным данным можно не только уточнить и скорректировать существующие политики безопасности, но и разработать новые. ИБ-специалисты набираются опыта и лучше узнают возможности системы — таким образом в компании совершенствуются подходы к обеспечению безопасности.

    Обратная ситуация, когда правила настроены один раз и не изменяются с момента установки системы, может указывать на формализованный, неэффективный подход — «для галочки» — и в конечном итоге привести к утечке информации.

    В SecureTower можно применить новое или изменить существующее правило безопасности, чтобы осуществить поиск по данным, которые система перехватила с момента установки. Для этого нужно активировать всего один переключатель.

    Модули Поиск и Комбинированный поиск позволяют искать конкретную информацию об инцидентах, пользователях, событиях во всем массиве данных. Для ускорения поиска рекомендуется ограничивать условия запроса диапазоном времени, областью и группой пользователей.

    Факты нарушений, инцидентов и подозрительной активности сотрудников можно собирать в модуле Расследования и использовать как доказательную базу.

    Оптимизация бизнес-процессов

    Информацию, которую собирает и обрабатывает система, можно использовать для анализа бизнес-процессов и их оптимизации. SecureTower визуализирует данные в отчётах и диаграммах за любой период, помогает отслеживать соблюдение трудового распорядка, нагрузку, вовлечённость, используемое ПО и т. д.

    Данные за 12–24 месяца позволяют выявлять закономерности, перераспределять нагрузку, находить узкие места коммуникаций, определять продуктивных и непродуктивных специалистов.

    Соблюдение требований регуляторов

    Некоторые законодательные акты обязывают хранить данные заданный срок (в РФ: 374-ФЗ, 375-ФЗ, 152-ФЗ). В ЕС принцип подотчётности GDPR требует доказуемости соблюдения принципов обработки данных.

    Управление рисками

    Сбор и анализ больших данных выявляет неочевидные взаимосвязи, указывающие на возможные угрозы ИБ. Это позволяет действовать превентивно: проводить беседы, привлекать к ответственности, планировать закупки ПО/оборудования для защиты активов.


    Вызовы и перспективы использования больших данных в ИБ

    Чем больше объём, тем сложнее защита. Большие данные ценны и для компаний, и для злоумышленников — владельцам информации нужны дополнительные меры сохранности.

    В крупных организациях защита от внешних угроз обычно развита лучше, чем от внутренних. Сотрудники с доступом к конфиденциальной информации могут попытаться её продать, подставив компанию под санкции и штрафы.

    Из последних случаев: 53-летний житель Калининграда создал нелегальный агрегатор персональных данных и продавал доступ к сведениям о гражданах и юрлицах, похищая данные с 2013 года, используя связи в правоохранительных органах.

    Различные примеры продажи данных внутренними сотрудниками организаций мы приводили в этой статье.

    Дефицит навыков в сфере ИБ. Наблюдается острый дефицит специалистов: число открытых ИБ-вакансий растёт, а число резюме сокращается. Это повышает зарплатные ожидания и бьёт по бюджету небольших компаний. DLP автоматизирует многие процессы ИБ и помогает работать с меньшим штатом.

    Мощность оборудования. Сбор, хранение и обработка больших данных — дорого. После «закона Яровой» крупные игроки оценивали расходы в миллиарды. Требования к оборудованию для SecureTower описаны здесь; для больших объёмов потребуется более мощная конфигурация. Важно соблюдать принцип экономической целесообразности: стоимость защиты не должна превышать стоимость охраняемой информации.

    Бесконтрольное накопление чувствительной информации. Сбор данных должен иметь цель и не нарушать законодательство. При перехвате данных учитывайте, что сотрудники могут использовать личные аккаунты. Обычно внедряется допсоглашение к трудовому договору о контроле активности. Система должна позволять удалять персональные данные, не относящиеся к инцидентам.

    Ключевые риски и практичные контрмеры
    Риск Контрмера
    Инсайдерские утечки Политики по каналам, поведенческий анализ, расследования, сегрегация прав
    Переполнение хранилища Политики ретенции, раздельные хранилища для «сырых» данных и индексов, компрессия
    Рост стоимости владения Тиринг хранения, приоритизация типов данных, оптимизация индексации
    Несоответствие требованиям Реестр обработок, отчётность, журналирование, регламент удаления ПДн
    Важно!

    DLP-система Falcongaze SecureTower доступна в бесплатном тестовом режиме на протяжении 30-ти дней. Исследуйте возможности применения программного комплекса для защиты вашего бизнеса.


    В заключение

    Формирование больших объемов данных — неизбежный результат деятельности крупных и средних организаций. С одной стороны это риск, но с другой — анализ таких данных позволяет эффективнее настраивать бизнес-процессы, совершенствовать работу компании, предсказывать угрозы безопасности и предотвращать их.

    При этом чрезвычайно важно обеспечить надежную защиту данных: утечки и компрометация могут привести к серьёзным материальным и репутационным рискам, санкциям со стороны ИБ-регуляторов. Поэтому важно защищать компанию не только от угроз снаружи, но и от угроз изнутри.

    Важные публикации