Notícias
QUERO-QUERO CIÊNCIA: Segurança e Privacidade em Big Data
A preocupação com a segurança e privacidade de dados tem impulsionado a inovação no desenvolvimento de tecnologias e práticas de segurança mais avançadas. Investimentos em segurança cibernética e privacidade de dados impulsionam o avanço tecnológico e promovem a confiança na economia digital, por exemplo, sendo fundamentais em qualquer contexto em que informações pessoais ou confidenciais são manipuladas.
Com relação à proteção dos indivíduos, a segurança e privacidade de dados protegem os indivíduos contra o roubo de identidade, fraudes financeiras e outras formas de abuso. Isso é essencial para garantir a integridade, a precisão e a confiabilidade das informações e a dignidade das pessoas.
A segurança e privacidade de dados têm impactos abrangentes na sociedade, desde a confiança do consumidor até a proteção dos direitos individuais. É crucial que empresas, governos e indivíduos reconheçam a importância desses aspectos e adotem medidas proativas para proteger os dados pessoais e sensíveis.
No campo do desenvolvimento científico e tecnológico a área da segurança e privacidade de dados está em constante evolução, impulsionado pela necessidade de proteger informações sensíveis em um mundo cada vez mais digitalizado e interconectado. Esses avanços desempenham um papel crucial na proteção dos dados dos indivíduos, garantindo a confidencialidade, integridade e disponibilidade das informações.
Sobre a temática, o Serviço de Comunicação Institucional conversou com o Prof. Fábio Borges de Oliveira, tecnologista e atual diretor do LNCC, um dos autores do estudo Secure Aggregation Protocol Based on DC-Nets and Secret Sharing for Decentralized Federated Learning publicado em 17 de fevereiro de 2024 na revista científica Sensors – MPDI.
Vem com a gente!
Objetivo e Importância da Pesquisa
A influência crescente dos algoritmos de Inteligência Artificial (IA) na vida cotidiana é notável, estando estes presentes em redes sociais, mecanismos de busca, sistemas bancários e outras áreas. Essa presença foi fortemente ampliada com a popularização dos smartphones e o aumento contínuo de sua capacidade computacional. Hoje, muitas pessoas carregam no bolso um dispositivo capaz de coletar diversos tipos de dados, processá-los e fornecer respostas aos usuários. Esse cenário marca a era do Big Data.
Nesse contexto, dados sensíveis também são coletados, tornando essencial pensar em estratégias para garantir a segurança e privacidade dos usuários, especialmente ao lidar com o aumento da influência da IA em áreas como saúde, meio ambiente, educação e segurança.
O Aprendizado Federado (Federated Learning) é uma técnica promissora que permite que modelos de Aprendizado de Máquina sejam treinados a partir de vários clientes, de forma distribuída e privada. Esta técnica permite a um servidor central se comunicar com e aprender a partir de vários dispositivos distribuídos por uma rede sem, contudo, dispor dos dados brutos de cada nó da rede. A peça-chave desta técnica é o processo de agregação, no qual os diversos resultados dos treinamentos em cada cliente são combinados para formar um único modelo global.
Nesta pesquisa, objetivamos introduzir um novo protocolo de agregação de dados para o treinamento de redes neurais artificiais com segurança e privacidade. Para isso, utilizamos de duas técnicas criptográficas conhecidas, DC-Nets e Segredo Compartilhado, aplicando-se em uma abordagem descentralizada, isto é, sem a necessidade de um servidor central coordenando a operação. O protocolo proposto foi avaliado e comparado a outras técnicas em termos de custo computacional, de comunicação, segurança e privacidade.
Desafios Encontrados no Estudo
O principal desafio deste estudo foi encontrar um equilíbrio entre a segurança e privacidade proporcionada pelas técnicas criptográficas e a eficiência computacional e de comunicação.
Métodos criptográficos tendem a ser computacionalmente intensivos, o que pode impactar significativamente o desempenho do sistema, especialmente em ambientes distribuídos onde os recursos computacionais podem ser limitados.
Além disso, para garantir a segurança e privacidade, os métodos criptográficos fazem com que o volume de dados processados tenha o seu tamanho aumentado consideravelmente, o que impacta diretamente no volume de dados enviados e recebidos entre os participantes do Aprendizado Federado. Isso ocorre, pois, a criptografia adiciona informações extras (como chaves criptográficas ou assinaturas) aos dados originais.
Portanto, o desenvolvimento de métodos e protocolos seguros para Aprendizado Federado envolve a consideração cuidadosa do impacto computacional e de comunicação.
Benefícios para a sociedade
Os impactos do Aprendizado Federado na sociedade são mais bem percebidos em áreas de grande preocupação com a sensibilidade dos dados e onde há escassez de dados disponíveis para treinamento, visto que permite que modelos de Aprendizado de Máquina sejam treinados de forma distribuída sem a necessidade de compartilhamento de dados.
Exemplos relevantes são os setores de saúde e financeiro. Hospitais e centros de pesquisa podem colaborar usando o Aprendizado Federado para melhorar ferramentas de diagnóstico e planos de tratamento. Ao analisar dados diversos de pacientes mantendo-os no local, os provedores de cuidados de saúde podem aprimorar modelos de previsão de doenças, sem a necessidade de revelar prontuários médicos a terceiros. Bancos e instituições financeiras podem empregar o Aprendizado Federado para coletivamente aprimorar seus mecanismos de detecção de fraudes. Compartilhando insights de padrões de transações sem expor dados individuais de clientes, os bancos podem identificar e prevenir fraudes com maior eficácia.
Outras áreas beneficiam-se pelas garantias de segurança e privacidade fornecidas, como na otimização de tráfego, onde sistemas de gerenciamento de tráfego urbano podem analisar dados de vários sensores e câmeras em toda uma cidade para ajustar os tempos dos sinais de trânsito, reduzindo o congestionamento e melhorando a mobilidade urbana.
Para saber mais, acesse https://www.mdpi.com/1424-8220/24/4/1299
Créditos
Anmily Paula Martins (SECIN-LNCC), Graziele Soares (SECIN-LNCC), Tathiana Tapajóz (SECIN-LNCC), Diogo Pereira (PPG-LNCC), Paulo Ricardo Reis (PPG-LNCC) e Fábio Borges (LNCC)
Imagem
Freepik
O Quero-Quero Ciência é um ciclo de entrevistas que faz parte das ações de divulgação científica do LNCC
Curiosidade: O pássaro Quero-Quero, ave da família dos Charadriidae, tem os gramados do campus do LNCC como habitat natural
Serviço de Comunicação Institucional
secin@lncc.br