sexta-feira, 26 de julho de 2019

Pesquisadores destacam a ‘mentira’ dos dados anônimos


Na Europa, a revista Nature Communications publicou uma pesquisa elaborada em conjunto com o Imperial College London e a Université Catholique de Louvain, da Bélgica, na qual os estudiosos encontraram um método capaz de identificar dados registrados como confidenciais a partir de 15 caracteres, demonstrando a fragilidade dos sistemas de informações.

"Nossos resultados sugerem que mesmo conjuntos de dados anônimos provavelmente não satisfazem os padrões modernos de anonimização estabelecidos pelo GDPR (Lei Geral de Proteção de Dados da Europa) e desafiam seriamente a adequação técnica e legal do modelo de desatenção", afirmou o relatório.

A falta de segurança de dados e o anonimato nas redes já foi abordado em estudo anterior, no qual Yves-Alexandre de Montjoye, do Imperial College, demonstrou que a partir da análise de quatro caracteres aleatórios era possível identificar 90% dos compradores que utilizaram cartões de crédito. Também, mesmo com a privacidade de dados de localização dos smartphones, Yves provou a possibilidade de identificação espaço-temporal com 95% de precisão.

Estudiosos alertam que, através do Alteryx, que registra 248 atributos por domicílio, nenhum dentre os 120 milhões de americanos estão seguros a se manterem no anonimato. Sobre o assunto, a Cambridge Analytica, que revelou a seleção de eleitores norte-americanos obtida por dados clandestinos, foi licenciada por corretores de dados, tais como a Acxiom, Experian e Infogroup. Especificamente, a companhia afirmou ter obtido legalmente "milhões de pontos de dados de indivíduos americanos" de "agregadores de dados e fornecedores de dados respeitáveis".

"Nós validamos nossa abordagem em 210 conjuntos de informações a partir de dados demográficos e de pesquisas, e mostramos que mesmo frações de amostragem extremamente pequenas não são suficientes para impedir a reidentificação e proteger seus dados. Nós mostramos que 99,98% dos americanos foram corretamente reidentificados em qualquer conjunto de dados 'anônimos' disponíveis usando apenas 15 características, incluindo idade, sexo e estado civil", revelou o estudo.

Os pesquisadores disponibilizaram o código que construíram para suas descobertas e criaram uma interface na web para os interessados "brincarem" de se reidentificarem. Num simples teste com apenas três atributos aleatórios (sexo, data de nascimento e CEP), a reidentificação do indivíduo passou de 54% para 95%. Quanto mais atributos, maior a possibilidade de uma correspondência ser correta e, portanto, menos provável que os dados possam ser protegidos por "anonimização".

"Nossos resultados rejeitam as alegações de que, primeiro, a reidentificação não é um risco prático e, segundo, a armostragem ou a liberação de conjuntos de dados parciais fornecem uma negação plausível. Nossos resultados, em primeiro lugar, mostram que poucos atributos são suficientes para se reidentificar indivíduos com confiança em conjuntos de dados incompletos", defenderam os pesquisadores. Dessa forma, muitas pessoas ainda correm o risco de serem reidentificadas com sucesso.

Diante das ameaças, especialistas defendem que as vulnerabilidades devem ser observadas pelos legisladores e órgãos reguladores, que devem investir na privacidade e no controle de acesso às informações.

"Como os padrões de anonimização estão sendo redefinidos pelas autoridades nacionais e regionais de proteção de dados na UE, é essencial que sejam robustas e respondam a novas ameaças como a que apresentamos neste documento. Eles precisam levar em conta o risco individual de reidentificação - mesmo se o conjunto de dados estiver incompleto -, bem como reconhecer legalmente a ampla gama de sistemas prováveis de aprimoramento da privacidade e medidas de segurança que permitiriam os dados serem usados preservando efetivamente a privacidade das pessoas", completaram os cientistas.

Nenhum comentário:

Postar um comentário