четверг, 7 ноября 2013 г.

Мешать ПДн не вредно

Пост навеян сегодняшним посещением конференции «Защита персональных данных», на которой в т.ч. подробно обсуждался вопрос обезличивания ПДн. Да, уже есть свежий Приказ №996 Роскомнадзора, в котором перечислены наиболее удобные методы обезличивания: введение идентификатора, изменение семантики, декомпозиция, перемешивание. Подробно было остановлено внимание операторов на последнем.

Итак, перемешивание это метод, при котором значения полей таблицы практически хаотически меняются местами, без изменения содержания самих данных. В общем случае такое обезличивание предлагается делать в два шага, повторяя их более десятка раз.
1. Разбиваем таблицу на сегменты
2. Циклически сдвигаем записи в каждом сегменте
При повторах меняются только параметры: на сколько сегментов разбить и на сколько шагов сдвинуть записи. Если выбор параметров рандомизировать, восстановление ПДн становится невозможным! Достоинства метода в том, что вычислительные трудозатраты низкие, а стойкость растет от количества записей в таблице.
Напомню, в каких случаях желательно иметь обезличенные данные:
- для статистических и/или аналитических нужд
- при передаче баз к разработчикам
- при работе с базами в тестовых средах
Я задумался, а можно ли использовать данный метод, если в базах используются номера кредитных карт. Можно и, например, вот так:
Фамилия
Имя
Отчество
№ символы 1-6
№ символы 7-16



константа
уникальные
По другому «бить» номер не имеет большого смысла, т.к. первые цифры это код банка-эмитента, а последняя - контрольная сумма.


Комментариев нет:

Отправить комментарий