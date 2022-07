Na internet, a tela do computador parece preservar a identidade dos usuários, mas em uma época em que cada vez mais dados pessoais - e os dos nossos amigos e familiares - são publicados online, o anonimato prometido cada vez é mais enganoso, demonstrou um novo estudo publicado esta quinta-feira na revista americana Science.

Foi isto o que descobriram pesquisadores ao bancar os detetives tendo em mãos um punhado de dados genéticos publicados na internet para uso científico.

Os dados eram anônimos, ou seja, os nomes dos participantes não foram publicados.

Mas usando as informações fornecidas, inclusive idade e local de residência, juntamente com fontes livremente disponíveis na internet, os cientistas conseguiram identificar cerca de 50 dos indivíduos do banco de dados genético.

"É um resultado importante que aponta para o potencial de vazamentos de dados privativos em estudos genéticos", afirmou Yaniv Erliche, do Instituto Whitehead Fellow, que chefiou a equipe de pesquisas.

Os cientistas começaram analisando alguns marcadores genéticos, denominados "repetições curtas consecutivas" em cromossomos Y (Y-STRs) que tendem a ser transmitidas de pai para filho.

Devido a que o sobrenome dos pais também costumam passar de pai para filho, haveria um forte vínculo entre estas repetições e os nomes das famílias.

Esta informação é utilizada por sites genealógicos para ajudar as pessoas a encontrar ancestrais comuns e outras informações sobre a família. Os homens inserem informações sobre seus Y-STRs para encontrar outros com cromossomos similares, deixando aberta à consulta pública a base de dados sobre o cromossomo Y vinculada a árvores genealógicas.

Comparando os Y-STRs dos participantes do estudo, os cientistas descobriram os últimos nomes de vários deles. Os estudiosos acreditam que seria possível identificar desta forma os sobrenomes de cerca de 12% dos homens caucasianos.

Cruzando estas referências com o registros de motores de busca na internet, obituários, sites genealógicos e dados demográficos públicos, os cientistas conseguiram identificar totalmente cerca de 50 participantes do estudo genético e inclusive alguns familiares destes.

"Nós demonstramos que se, por exemplo, seu tio submeter o DNA a uma base de dados genealógica genética, você poderia ser identificado", explicou Melissa Gymrek, integrante do laboratório Erlich e principal autora do artigo publicado na Science.

"De fato, até mesmo um primo distante, que você nunca conheceu, poderia identificá-lo se o DNA dele está na base de dados, desde que o parentesco entre vocês seja do lado paterno", acrescentou.

Quando a equipe de pesquisadores informou aos serviços de saúde o que tinham conseguido fazer, as autoridades retiraram as idades dos participantes da base de dados para dificultar sua identificação.

A privacidade sobre a informação genética, que pode revelar predisposições para algumas doenças, é uma das grandes preocupações para a comunidade científica e o público em geral nos Estados Unidos, que temem que esta informação possa ser mal-utilizada por companhias de seguro ou empregadores.