Notícias
Open Data Day: AN debate produção, acesso e preservação de dados abertos
O Arquivo Nacional recebeu especialistas e cidadãos para celebrar, pela segunda vez consecutiva* , o dia internacional dos dados abertos – Open Data Day . Neste ano, a comemoração da data (6 de março) foi realizada totalmente on-line, por meio das apresentações de John Sheridan, do Arquivo Nacional do Reino Unido (com tradução simultânea para o português), e de Caroline Burle, do chapter de São Paulo do World Wide Web Consortium (W3C), que puderam interagir e responder às perguntas do público participante.
* veja aqui o relato do usuário Augusto Herrmann sobre o Open Data Day do ano passado
Na abertura, a Diretora-Geral do AN Neide De Sordi ressaltou a participação da instituição em iniciativas de dados abertos no Brasil, como a proposta de compromisso “Gestão de dados governamentais abertos para a preservação, interoperabilidade, acesso e reúso” para compor o 5º Plano de Ação Nacional de Governo Aberto. Paralelamente, como custodiador da documentação da administração pública federal e órgão central do Sistema de Gestão de Documentos e Arquivos (Siga), o AN está participando do processo de avaliação de governo aberto da Organização para a Cooperação e Desenvolvimento Econômico (OCDE) , no âmbito do acordo de cooperação em integridade pública firmado entre o governo federal e a entidade internacional.
Diretor digital do The National Archives UK – TNA UK, John Sheridan falou sobre o papel e a importância de um arquivo público no que diz respeito a dados abertos, uma vez que eles traduzem uma forma de se enxergar o governo e o Estado, suas decisões e suas ações. Segundo ele, é possível entender como um governo entende um país por meio dos dados que seu arquivo nacional disponibiliza para o público.
Em sua apresentação, Sheridan recorreu a registros datados do século XI, para falar sobre como a produção de documentos com uma determinada função primária pode possibilitar outros usos ao longo tempo. O exemplo dado foi o livro ( Domesday ), com dados coletados pelos povos normandos para resolver questões relacionadas à propriedade de terras, para fins de tributação, que assumiu uma função secundária no auxílio aos pesquisadores para o entendimento da organização social na época.
Ao falar de representação de dados, o diretor do TNA fez uso da famosa “alegoria da caverna”, proposta pelo filósofo grego Platão, segundo a qual homens acorrentados em uma caverna enxergam a realidade por meio de sombras projetadas na parede. Da mesma forma, modelos de dados abertos são uma representação da realidade e, se a visão dos dados for muito limitada, a visão da realidade também será. Sheridan apontou que, sendo assim, alguns modelos de dados, especialmente os estatísticos e os que já passaram por curadoria, tendem a ser mais úteis que outros, apesar de todos serem representações limitadasda realidade.
Outro ponto fundamental seria a qualidade desses dados abertos. Para o palestrante, a análise de big data permitiu trabalhar com grupos de dados muito grandes, e profissionais de arquivos podem contribuir para o aprimoramento desses dados, por conhecerem suas características (produção, contexto, manutenção etc.), o que é importante para o processamento em larga escala. Em outro exemplo advindo de sua experiência profissional, Sheridan abordou o gerenciamento das leis do Reino Unido, que é atribuição do TNA. Em decorrência da saída do país da União Europeia ( Brexit ), o arquivo nacional britânico teve que capturar atos legislativos e decisões judiciais, fornecidos como dados abertos pela Comissão Europeia, para sua base de dados de legislação, o que possibilitou a substituição por leis e jurisprudência nacionais a partir de então. O diretor digital frisou que, sem obter dados descritivos (ou metadados) precisos e de boa qualidade, seria difícil dizer quais dados estariam relacionados com os atos legislativos que deveriam ser capturados.
Em sua conclusão, Sheridan enfatizou a participação do TNA UK no estabelecimento de princípios para a padronização de dados abertos governamentais, de maneira a possibilitar o compartilhamento de informações, internamente e com outros governos, assim como o consumo dos dados pelos usuários-cidadãos. Além disso, a preservação digital, segundo Sheridan, modificou os paradigmas para o armazenamento dos dados a serem disponibilizados de forma aberta, devido ao desafio da evolução do mercado que produz novas tecnologias e torna outras obsoletas, ao mesmo tempo em que oferece opções para resguardar a integridade dos dados, como a criptografia.
A segunda palestrante da manhã, Caroline Burle, é responsável pelas relações institucionais do Centro de Estudos sobre Tecnologias Web (Ceweb.br) e do W3C no Brasil, e uma das editoras do padrão “Data on the Web Best Practices” (“Boas práticas para dados na web ”).
No evento, ela iniciou sua apresentação, falando sobre o ciclo de dados na web , desde sua criação, passando por sua extração das fontes originais e pela transformação para acesso posterior.
Como a íntegra de seu trabalho na elaboração e descrição de boas práticas para dados abertos excederia o tempo da apresentação, Burle destacou algumas recomendações para ilustrar o que foi desenvolvido.
Dentre as práticas citadas, estavam:
- fornecer os metadados dos dados abertos;
- dar informações sobre a procedência dos dados;
- indicar a versão dos dados;
- publicar os dados em múltiplos formatos de arquivo;
- dar preferência a vocabulários padronizados;
- oferecer o download em massa dos dados;
- preservar os indicadores fornecidos; e
- coletar feedback dos consumidores dos dados.
São, ao todo, 35 boas práticas, que, segundo a palestrante, geram diversos benefícios, tais como: compreensão e processabilidade de melhor qualidade; facilidade de descoberta, acesso e reúso dos dados; maiores confiança, conectividade e interoperabilidade em relação aos dados abertos.
Para assistir às apresentações do Open Data Day no AN, acesse nosso YouTube .