В своем докладе я расскажу о том, что такое обезличенные данные и где они используются, а также какие подходы к обезличиванию персональных данных существуют, включая методы подстановки и агрегирования, выделив их плюсы и минусы в контексте реальных примеров.
Покажу на конкретных примерах, почему синтетические данные часто непригодны для тестирования. Рассмотрим ключевые показатели, такие как соответствие распределению исходных данных, которые необходимо учитывать при обезличивании, чтобы не потерять качество.
Расскажу о результатах эксперимента по количественной оценке безопасности демаскированных данных при сохранении достаточного уровня полезности.
Этот доклад поможет слушателям понять важность тестирования на обезличенных, а не синтетических данных, и сформировать подход к подготовке таких данных на своих тестовых контурах, что повысит качество тестирования.
Для кого?
Доклад будет интересен QA, работающим с персональными данными и их качеством. А также всем IT-специалистам, кто интересуется темой обезличивания, информационной безопасности и следит за трендами в этой сфере.
QA-engineer.
Any level.
Бывший инженер аэрокосмической отрасли — почти 10 лет разрабатывал детали из высокотемпературных композитов для ракетных двигателей. А потом захотелось делать что-то живое, гибкое и видимое здесь и сейчас. Так оказался в HFLabs, где уже 6 лет тестирует продукты для крупных компаний, ковыряется в сложных системах, ищет уязвимости и кайфует от логики, структуры и чисто инженерного подхода к качеству.
Любит научную фантастику, анимацию и моушн-дизайн, увлекается видеомонтажом и 3D-моделированием.