Notícias
Confira como foi a live ‘Ciência de Dados e Biblioteconomia: um estudo de caso com o Catálogo Coletivo Nacional de Publicações Seriadas (CCN)’
Confira como foi a live ‘Ciência de Dados e Biblioteconomia: um estudo de caso com o Catálogo Coletivo Nacional de Publicações Seriadas (CCN)’.
Com o intuito de apresentar as técnicas da Ciência de Dados adotadas no âmbito do projeto de reestruturação do Catálogo Coletivo Nacional de Publicações Seriadas (CCN), o Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict) promoveu, no dia 28 de março, a live ‘Ciência de Dados e Biblioteconomia: um estudo de caso com o Catálogo Coletivo Nacional de Publicações Seriadas (CCN)’.
Antes de demonstrar as etapas seguidas no processo da Ciência de Dados, o professor Bruno Costa explicou que tal ciência se inspira na metodologia científica para definir as perguntas ou hipóteses de forma a dar início ao processo de investigação, sendo que as principais categorias de perguntas que a Ciência de Dados busca responder são descritivas, preditivas/correlacionais e prescritivas.
A pesquisadora Tainá de Assis falou sobre o projeto Pinakes, conduzido pelo Ibict e que consiste na reestruturação dos serviços bibliográficos tradicionais, o CCN, o Bibliodata e o Programa de Comutação Bibliográfica (Comut), amplamente conhecidos pela comunidade da Biblioteconomia. De acordo com a pesquisadora, o Pinakes está desenvolvendo outros dois novos produtos, o Catálogo Integrado Brasileiro de Registros Bibliográficos (catálogo Pinakes) e a Base Integrada das Bibliotecas participantes.
Em seguida, a estudante Gabrielle Santos abordou aspectos relacionados ao problema de pesquisa da transcrição como, por exemplo, erros de pontuação, abreviações, espaços, repetição de fascículos e volumes, entre outros. Já o estudante João Gabriel Viana demonstrou possíveis soluções para tais erros, a partir de uma forma determinística (Regex) e probabilística (Modelo Supervisionado). Por fim, a pesquisadora Greicy Santos falou sobre as possibilidades de ajuste do modelo e Aprendizado de Máquina para dados não rotulados da base de dados e formas de utilizar os resultados previstos, como aplicar o conhecimento produzido no tratamento de dados de outros serviços bibliográficos.
O vídeo completo com o debate realizado pelos pesquisadores pode ser visto no canal do Ibict no YouTube, disponível neste link.