Exame de Qualificação: Data-driven Model Selection: A Strategy for Subset Models Trainnig
-
Palestrantes
Aluno: Victor de Paula Dornellas Ribeiro
-
Informações úteis
Hora: 10h
Orientadores:
Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC
Banca Examinadora:
Pablo Javier Blanco - Laboratório Nacional de Computação Científica - LNCC (presidente)
Gilson Antônio Giraldi - Laboratório Nacional de Computação Científica - LNCC
Patrick Valduriez - INRIA - FRA
Suplentes:
Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC
Resumo:TRADICIONALMENTE, ASSUME-SE QUE A PRECISÃO DE UM MODELO DE APRENDIZADO DE MÁQUINA AUMENTA, NA MEDIDA QUE O TREINAMOS COM MAIS INFORMAÇÃO O QUE EXIGE O USO DE ESTRUTURA DE COMPUTAÇÃO DE ALTO DESEMPENHO. A CAPACIDADE COMPUTACIONAL EXIGIDA PARA CONSTRUÇÃO E ESTUDO DE MODELOS SOBRE GRANDES CONJUNTOS DE DADO S FICA ASSIM RESTRITA SOMENTE A ALGUMAS ORGANIZAÇÕES. MESMO QUE A QUALIDADE PREDITIVA GERAL DE UM MODELO SEJA BOA, SUA PERFORMANCE NÃO É HOMOGÊNEA SOBRE TODO O ESPAÇO DE DADOS. POR EXEMPLO, A LITERATURA SOBRE A JUSTIÇA ALGORÍTMICA DE MODELOS ABORDA COMUMENTE DIFERENÇAS DE PRECISÃO EM DIFERENTES GRUPOS DEMOGRÁFICOS. O TRABALHO PROPOSTO OBJETIVA APRESENTAR UMA ESTRATÉGIA DE CONSTRUÇÃO DE MODELOS TREINADOS SOBRE SUBCONJUNTOS DE DADOS. COM ISSO, ESPERAMOS QUE O TREINAMENTO SEJA MENOS CUSTOSO, SEM A PERDA DE QUALIDADE. ESPERAMOS AINDA O COMPORTAMENTO DO ERRO DE PREDIÇÃO SEJA HOMOGÊNEO AO LONGO DO ESPAÇO DE DADOS. PARA TANTO, ASSUMIMOS A HIPÓTESE DE QUE É POSSÍVEL ESTABELECER UM PROCESSO BASEADO EM CARACTERÍSTICAS DO DADO, QUE PERMITA A CONSTRUÇÃO DE UM CONJUNTO DE MODELOS. ASSUMIMOS AINDA QUE O CONJUNTO DE MODELOS É CAPAZ DE SUBSTITUIR UM MODELO QUE SEJA TREINADO SOBRE O CONJUNTO DE DADOS.
-
Mais informações
Pós-graduação do LNCCcopga@lncc.br