Когда вам нужно хранить пользовательские данные для машинного обучения, ваши основные требования GDPR заключаются в следующем:

  • Личная информация должна использоваться только в целях, на которые дает согласие пользователь.
  • Согласие должно быть дано в ясной и доступной форме.
  • Иметь возможность удалять данные по запросу пользователя

Традиционный метод «грубой силы» для анализа данных заключается в том, чтобы собрать данные из вашего приложения и поместить их в хранилище данных, провести анализ, построить модели машинного обучения и использовать модели машинного обучения в своем приложении.

Для соблюдения GDPR вам необходимо определить, какие типы личной информации о пользователе вы передаете в хранилище данных для анализа. Затем вам нужно попросить пользователей дать согласие на цель вашего анализа данных.

Большая часть личной информации является личной только до тех пор, пока она связана с пользователем, поэтому все данные должны быть переданы в хранилище данных после сопоставления пользователя с сгенерированным идентификатором.

Другие типы информации, такие как номера телефонов или домашний адрес, которые напрямую связаны с пользователем, не должны передаваться для хранения данных, альтернативно сопоставляемых с сгенерированным идентификатором, если он представляет какую-либо ценность для анализа. Данные о местоположении могут быть обобщены, если они могут быть связаны с пользователем и при этом быть полезными в качестве географической информации.

Если вы уже используете пользовательские данные для машинного обучения, а пользователи не знают об этом, вам, вероятно, следует попросить пользователя продолжать это делать или удалить его данные из хранилища данных.

Когда пользователи покидают вашу службу и хотят удалить свои учетные записи, вы несете ответственность за удаление всех личных данных в вашем хранилище данных, связанных с пользователями.

В новой модели есть уровень сопоставления, где идентификатор/имя пользователя и другие идентификаторы преобразуются в сгенерированный идентификатор. Таким образом, вы можете разделить данные своего приложения и хранилище данных, а связь между личной информацией пользователя можно легко удалить, не влияя на анализ ваших данных.

Вывод. Добавляя слой сопоставления и четко определяя использование данных, вы уважаете конфиденциальность своих пользователей, соблюдаете GDPR и по-прежнему можете использовать данные для улучшения своих услуг.