Notícias
Artigo - Documentos sem papel
Pouco a pouco as pessoas começam a se dar conta que um documento eletrônico não é em absoluto um documento digitalizado. O último caso é, por exemplo, o magistral trabalho da Hemeroteca de nossa Biblioteca Nacional. Trata-se da digitalização do acervo jornalístico do país. Ou seja: trata-se de um legado outrora gerado em papel e que agora o geramos em forma digital, — o que é infinitamente melhor para o pesquisador-usuário e para a conservação deste patrimônio histórico-cultural, evitando o seu acesso direto. Ressalte-se a aplicação da técnica de OCR ( Optical Character Recognition ) ¹ a este acervo ele possibilita um acesso mais qualificado ao acervo e pesquisas acuradas. De forma muito objetiva: pode-se procurar por uma palavra qualquer, uma expressão, em todos os jornais da Corte no século XIX.
Um documento eletrônico nasce digitalmente e realiza todo seu ciclo de vida desta forma, se impresso, por algum razão, o impresso a bem da verdade é cópia, o original é o digital. O legado que a sociedade produziu nasceu com suporte em papel, a digitalização é cópia deste documento físico, e seu descarte — ainda que todas as técnicas possam ajudar neste processo — ainda é um "tabu", e de difícil superação a curto prazo. Todas mudanças são difíceis, não tenhamos ilusão, e o uso do papel é milenar. A escrita em si é uma "tecnologia da inteligência", para usar uma expressão de Pierre Lévy, a impressão de Gutemberg e também a máquina de escrever igualmente, e nenhuma delas desumanizou o homem. Como disse sutilmente Richard Sennett: "technique has a bad name; it can seem soulless" ² .
Fato irrecusável que nossa sociedade já produz gicantesca quantidade de documentos que nascem digitalmente. Fiquemos por hora com exemplo da Nota Fiscal Eletrônica (NFe), já validamos e autorizamos 7.5 Bilhões de NFes. Passados digamos uns 100 anos, será parcela da memória econômica de nosso país nestes documentos eletrônicos, assinados digitalmente. O mesmo se passa com o sistema para recolhimento e declaração do FGTS, o chamado "Conectividade Social" , que também se insere em nossa memória econômico-social. As escolhas tecnológicas de hoje decidirão no futuro as condições de legibilidade e acesso a este acervo. O XML como padrão e formato tem sido a decisão mais adequada (que é uma tendência global e não somente local). Além de ser um documento em "texto-puro", como qualquer linguagem de "marcação", e é tremendamente interoperável, aderente a Web. Igualmente poderosa ferramenta de intercâmbio de dados . Por isso o Governo Federal, em seus padrões de interoperabilidade assevera:
"Serão considerados preferenciais aqueles tipos de arquivo que têm como padrão de representação o formato XML, de forma a facilitar a interoperabilidade entre os serviços de governo eletrônico." ³
Assim, é o formato de nossas NFes e também a comunicação eletrônica do Fundo de Garantia brasileiro segue o padrão XML Manifest . Ele descreve o conteúdo do pacote ".zip" enviado, especificando como o conteúdo é mapeado numa estrutura de diretório e de informação. Outro aspecto importante é que ele deve ser agnóstico ao estabelecer os metadados do pacote, isto é, neutro quanto a linguagem e o sistema operacional, o que garantirá longevidade ao documento e sua informação. O esquema XML manifest é largamente utilizado pelos SOs atuais ⁴ , como o MS Windows. Também no mundo da mobilidade, como o Android, aí toda a aplicação do SO Android deve ter na sua raiz um arquivo "manifest.xml".
- Consulte-se: "Optical Character Recognition (OCR) – How it works" e "How Good Can It Get? Analysing and Improving OCR Accuracy in Large Scale Historic Newspaper Digitisation Programs" [ ↩ ]
- The Craftsman. New York: Allen Lane, 2008, p. 149. [↩]
- Cf.: http://www.governoeletronico.gov.br/biblioteca/arquivos/documento-da-e-ping-versao-2013/ [ ↩ ]
- Ver para o Android: http://developer.android.com/guide/topics/manifest/manifest-intro.html ; e para o Windows: http://msdn.microsoft.com/en-us/library/windowsazure/jj151525.aspx ; por fim, para o Google: https://developers.google.com/google-apps/marketplace/manifest [ ↩ ]
Renato Martini é diretor-presidente do Instituto Nacional de Tecnologia da Informação – ITI e Secretário Executivo do Comitê Gestor da Infraestrutura de Chaves Públicas Brasileira CG ICP-Brasil, é também membro titular do Comitê de Segurança da Informação do Gabinete de Segurança Institucional da Presidência da República, do Comitê Gestor do Registro de Identidade Civil e do Comitê Gestor da Internet do Brasil – CGIbr, na condição de representante da Casa Civil da Presidência da República. Completou o seu doutorado, em 1998, na Pontifícia Universidade Católica do Rio de Janeiro, tendo como áreas de especialização a Filosofia da Ciência e a Lógica.