VSHUFFLE. Простое решение сложной задачи защиты персональных данных

- КиТ :: Будь в СЕТИ!

Мир вступил в эпоху Big Data, которая коренным образом изменила наше представление об информации. Данные используются компаниями для улучшения текущих процессов и создания новых бизнес-моделей и становятся все более значимым ресурсом. В то же время утечки персональных данных становятся серьезной проблемой, которая затрагивает как частных лиц, так и бизнес в целом.

Неутешительная статистика

В последние годы было зарегистрировано множество случаев раскрытия личной информации, включая утечки из банков, государственных учреждений, медицинских организаций и других компаний.

Согласно сведениям, представленным в отчете экспертно-аналитического центра ГК InfoWatch, за первое полугодие 2023 г. в России количество утечек персональных данных выросло на 72% (по сравнению с аналогичным периодом 2022 г.). Объем скомпрометированных данных составил 705 млн записей, более трети утечек связаны с попаданием в открытый доступ крупных баз данных.

За первое полугодие 2023 г. в России количество утечек персональных данных выросло на 72% (по сравнению с аналогичным периодом 2022 г.). Объем скомпрометированных данных составил 705 млн записей

Деперсонализация как одно из решений

Одной из причин утечек данных является недостаточная защита информации. Организации не уделяют должного внимания безопасности данных, что приводит к несанкционированному доступу к персональным данным. Для предотвращения массовых утечек и обеспечения безопасности информации, компании должны принимать меры по защите своих баз данных.

В России требования регуляторов по защите персональных данных определяются Федеральным законом №152-ФЗ «О персональных данных» и другими нормативными актами. Обеспечение безопасности, ограничение доступа к данным, а также хранение персональных данных - это лишь некоторые из основных требований регуляторов по защите личной информации в России. Одним из способов защиты является обезличивание (деперсонализация, анонимизация) данных.

Базы данных - важный бизнес-актив, они имеют множество применений: аналитика и улучшение качества услуг, проверка гипотез и разработка новых продуктов, персонализированная реклама, машинное обучение и развитие новых технологий, таких как IoT.

Вот некоторые отрасли, где деперсонализация данных наиболее востребована: финансы и банковское дело, телеком, медицина и здравоохранение, маркетинг и реклама и т.д. Обезличивание данных является важной практикой для защиты конфиденциальности и безопасности личной информации, позволяет организациям собирать и анализировать данные, а также позволяет разработчикам использовать тестовые среды с данными, схожими с реальными, не нарушая при этом требования к конфиденциальности и информационной безопасности.

Принципы деперсонализации

Любые подходы к анонимизации данных направлены на сокрытие личности, т. е. любого вида идентификаторов. Идентификаторы могут быть применены к любому человеку: фамилии, имена, отчества, даты рождения, почтовые и электронные адреса, номера телефонов, номера социального страхования, номера кредитных карт и банковских счетов и т. д. должны быть удалены или заменены перед использованием разработчиками, тестировщиками или любой третьей стороной.

Существуют различные методы обезличивания (анонимизации деперсонализации) данных: удаление прямых идентификаторов, замена, скремблирование, маскировка, размытие, шифрование и др. Некоторые из этих методов могут быть обратимыми, другие же могут нарушить целостность структурированных данных.

Уход с российского рынка глобальных вендоров, а также ужесточение государственных регуляторов в области хранения и обработки персональной информации привели к росту инвестиций в нишу продуктов по обезличиванию данных. На сегодняшний день на рынке представлено несколько решений, которые успешно справляются с задачами по анонимизации персональных данных.

Преимущества VSHUFFLE

VSHUFFLE - это полноценное российское ETL-решение для обезличивания персональной информации. Программное обеспечение извлекает данные из исходной базы данных, выполняет алгоритмы деперсонализации данных для обеспечения конфиденциальности, затем и обезличенные данные загружаются в целевую базу данных.

Этот процесс может быть полностью автоматизирован или настроен вручную в зависимости от потребностей пользователя. Решение может быть использовано в виртуальных средах или на физических машинах и легко интегрируется со сторонними системами за счет развитого API.

Программное обеспечение использует микросервисную архитектуру, что позволяет масштабировать его как вертикально, так и горизонтально. Это означает, что вы можете добавлять или удалять ресурсы (например, процессоры или память) для увеличения производительности или уменьшения затрат на инфраструктуру.

Все необходимые преобразования информации выполняются в оперативной памяти, промежуточные значения не сохраняются, что обеспечивает высокую скорость работы и эффективность использования ресурсов, а также безопасность и конфиденциальность данных.

Адаптация под российскую специфику

VSHUFFLE имеет набор преднастроенных алгоритмов анонимизации данных, которые учитывают российскую специфику. Кроме того, можно создавать и использовать собственные алгоритмы для более точной настройки процесса обезличивания и поиска данных, используя JavaScript.

Алгоритмы обезличивания, используемые в решении VSHUFFLE, обеспечивают уникальность преобразованных значений, сохраняя изначальную бизнес-логику и повторяемость результатов. Это позволяет получить данные, максимально сходные с реальными, но при этом защищенные с учетом всех требований регуляторов и информационной безопасности, что важно в отраслях, где тестирование, обработка и анализ данных являются регулярными практиками.

Персональные данные заменяются на обезличенные значения, сохраняя при этом целостность и согласованность с исходными данными, что позволяет проводить более качественное тестирование. Это особенно значимо для тех компаний, где строгие требования и внутренние политики безопасности ограничивают возможности разработчиков.

Использование обезличенных данных также делает возможным привлечение сторонних специалистов на подряд и использования облачных ресурсов без риска нарушить требования информационной безопасности. Такие данные подходят для функционального, нагрузочного и интеграционного тестирования. Это позволяет разработчикам более гибко управлять ресурсами и повышать эффективность процесса разработки и тестирования.

VSHUFFLE для обработки больших массивов персональных данных

В промышленных информационных системах количество таблиц в базах данных может исчисляться тысячами. В организациях зачастую отсутствуют единые стандарты сбора, записи и хранения информации, что может привести к сложной структуре базы данных и затрудняет отслеживание, в каких таблицах и полях могут находиться персональные данные.

Алгоритмы автоматического поиска персональных данных, реализованных в программном обеспечении VSHUFFLE, позволяют просканировать все поля баз данных на предмет содержания в них персональной информации. Это упрощает процесс поиска различных типов персональных данных, делает возможным принятие решения о дальнейшей работе с ними, а также обеспечивает соответствие требованиям информационной безопасности.

Защита персональных данных является важной задачей для любой организации. Основной потребностью в области защиты персональных данных является защита конфиденциальности (соответствие этическим и юридическим нормам), непосредственно безопасность данных и управление рисками, так как массовые утечки персональных данных могут привести к серьезным последствиям, таким как финансовые потери, репутационный ущерб и юридические санкции.

Компании обязаны принимать меры для обеспечения безопасности своих данных, предотвращать случайную потерю, распространение или несанкционированный доступ к персональным данным клиентов, проводить регулярные аудиты и мониторинг систем и процессов обработки персональных данных, чтобы обнаруживать и предотвращать возможные утечки данных.

ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
 
Группы: ВК | OK | Tg