Data Profiling - Uma retrospectiva e uma visão para o futuro.
-
Palestrantes
Eduardo Pena, Professor Adjunto na Universidade Tecnológica Federal do Paraná (UTFPR) e pesquisador de pós-doutorado no LNCC
-
Informações úteis
Resumo:
Data profiling envolve a extração de metadados (informações descritivas) de conjunto de dados. Metadados são utilizados por usuários e aplicações, de variadas áreas de conhecimento, em diversas tarefas, como, por exemplo: preparação e limpeza de dados; exploração de dados; engenharia e seleção de atributos; otimização de consultas; e projeto de banco de dados. Nesta apresentação, abordaremos alguns problemas tradicionais da área de data profiling, bem como casos de uso derivados das soluções desses problemas. Discutiremos brevemente as intuições algorítmicas de algumas soluções recentes. Finalmente, discutiremos problemas em aberto e direções de pesquisa promissoras em data profiling e seus casos de uso.
Breve Bio:
Eduardo is a adjunct professor at the Federal University of Technology- Paraná (UTFPR) and is a Postdoctoral Fellow at LNCC (DEXL). His main research focuses on data science and management, particularly in data quality and integration, data profiling, machine learning for structured data, and information extraction. He graduated in Computer Science (2011) and obtained a master's degree (2014), both from the State University of Londrina (UEL). He obtained his Ph.D. in Informatics, with emphasis on Databases, from the Federal University of Paraná (UFPR) in 2020. He has received the Capes Ph.D. Thesis Award (2021).
Eduardo é professor adjunto da Universidade Tecnológica Federal do Paraná (UTFPR) e pós-doutorando do LNCC (DEXL). Sua pesquisa principal se concentra em ciência e gerenciamento de dados, particularmente em qualidade e integração de dados, criação de perfil de dados, aprendizado de máquina para dados estruturados e extração de informações. Possui graduação em Ciência da Computação (2011) e mestrado (2014), ambos pela Universidade Estadual de Londrina (UEL). Ele obteve seu Ph.D. em Informática, com ênfase em Bancos de Dados, pela Universidade Federal do Paraná (UFPR) em 2020. É Ph.D. Capes. Prêmio Tese (2021).
-
Mais informações
Pós-graduação do LNCCcopga@lncc.br