Digital ou digitalizado?

Jornal digitalizado

Jornal digitalizadopela biblioteca Nacional

Normalmente as pessoas apresentam dúvidas em relação a materiais que se guarda no computador: uma foto em papel que escaneamos é digital? Qual o original: o papel ou o arquivo no computador? Qual a qualidade máxima possível? Pode-se melhorar o cópia digital? E qual a validade jurídica de um documento digital?

São muitas perguntas, e cada uma tem um arrazoado distinto na resposta, embora a origem da dúvida seja simples: no papel ou no micro?

Uma parte da resposta foi dada pelo interessante artigo de Renato Martini, presidente do Instituto de Tecnologia da Informação (ITI http://www.iti.gov.br/), órgão do governo federal que trata de manter a Infraestrutura de Chaves Públicas Brasileira - ICP-Brasil, sendo a primeira autoridade da cadeia de certificação - AC Raiz além de estimular e articular projetos de pesquisa científica e de desenvolvimento tecnológico voltados à ampliação da cidadania digital. Sua principal linha de ação é a popularização da certificação digital ICP-Brasil e a inclusão digital, atuando sobre questões como sistemas criptográficos, hardware compatíveis com padrões abertos e universais, convergência digital de mídias, desmaterialização de processos, entre outras.

Complicou mais? Vamos tentar descomplicar: pegue sua certidão de nascimento original e você terá um documento oficial original. Escaneie essa certidão e você terá uma CÓPIA DIGITALIZADA do seu documento, porém sem valor legal. Equivale a uma xerox simples, sem autenticação. Mas dependendo da forma como foi digitalizada, essa cópia pode ter muitas aplicações.

Usei muito cópias digitalizadas de jornais antigos ao fazer minhas pesquisas sobre Ilha das Caieiras e sobre antepassados familiares. Essas cópias foram realizadas pela Biblioteca Nacional, exatamento como Renato Martini explica em seu artigo.

Manifesto Marco CivilMas como produzir um documento digital original? Por exemplo, uma Certidão Negativa de Débitos? Vamos ao artigo de Renato Martini.

“Pouco a pouco as pessoas começam a se dar conta que um documento eletrônico não é em absoluto um documento digitalizado. O último caso é, por exemplo, o magistral trabalho da Hemeroteca (http://hemeroteca.bn.br/) de nossa Biblioteca Nacional. Trata-se da digitalização do acervo jornalístico do país. Ou seja: trata-se de um legado outrora gerado em papel e que agora o geramos em forma digital, — o que é infinitamente melhor para o pesquisador-usuário e para a conservação deste patrimônio histórico-cultural, evitando o seu acesso direto. Ressalte-se a aplicação da técnica de OCR (Optical Character Recognition)¹ a este acervo ele possibilita um acesso mais qualificado ao acervo e pesquisas acuradas. De forma muito objetiva: pode-se procurar por uma palavra qualquer, uma expressão, em todos os jornais da Corte no século XIX.

Um documento eletrônico nasce digitalmente e realiza todo seu ciclo de vida desta forma, se impresso, por algum razão, o impresso a bem da verdade é cópia, o original é o digital. O legado que a sociedade produziu nasceu com suporte em papel, a digitalização é cópia deste documento físico, e seu descarte — ainda que todas as técnicas possam ajudar neste processo — ainda é um "tabu", e de difícil superação a curto prazo. Todas mudanças são difíceis, não tenhamos ilusão, e o uso do papel é milenar. A escrita em si é uma "tecnologia da inteligência", para usar uma expressão de Pierre Lévy, a impressão de Gutemberg e também a máquina de escrever igualmente, e nenhuma delas desumanizou o homem. Como disse sutilmente Richard Sennett:"technique has a bad name; it can seem soulless"².

Fato irrecusável que nossa sociedade já produz gicantesca quantidade de documentos que nascem digitalmente. Fiquemos por hora com exemplo da Nota Fiscal Eletrônica (NFe), já validamos e autorizamos 7.5 Bilhões de NFes. Passados digamos uns 100 anos, será parcela da memória econômica de nosso país nestes documentos eletrônicos, assinados digitalmente. O mesmo se passa com o sistema para recolhimento e declaração do FGTS, o chamado"Conectividade Social", que também se insere em nossa memória econômico-social. As escolhas tecnológicas de hoje decidirão no futuro as condições de legibilidade e acesso a este acervo. O XML como padrão e formato tem sido a decisão mais adequada (que é uma tendência global e não somente local). Além de ser um documento em "texto-puro", como qualquer linguagem de "marcação", e é tremendamente interoperável, aderente a Web. Igualmente poderosa ferramenta de intercâmbio de dados. Por isso o Governo Federal, em seus padrões de interoperabilidade assevera:

"Serão considerados preferenciais aqueles tipos de arquivo que têm como padrão de representação o formato XML, de forma a facilitar a interoperabilidade entre os serviços de governo eletrônico."³

Assim, é o formato de nossas NFes e também a comunicação eletrônica do Fundo de Garantia brasileiro segue o padrão XML Manifest. Ele descreve o conteúdo do pacote ".zip" enviado, especificando como o conteúdo é mapeado numa estrutura de diretório e de informação. Outro aspecto importante é que ele deve ser agnóstico ao estabelecer os metadados do pacote, isto é, neutro quanto a linguagem e o sistema operacional, o que garantirá longevidade ao documento e sua informação. O esquema XML manifest é largamente utilizado pelos SOs atuais⁴ , como o MS Windows. Também no mundo da mobilidade, como o Android, aí toda a aplicação do SO Android deve ter na sua raiz um arquivo "manifest.xml".Internet livre

1. Consulte-se: "Optical Character Recognition (OCR) – How it works" e "How Good Can It Get? Analysing and Improving OCR Accuracy in Large Scale Historic Newspaper Digitisation Programs" (http://renatomartini.net/?p=1532#identifier_0_1532)

2. The Craftsman. New York: Allen Lane, 2008, p. 149.

3. Cf.: http://www.governoeletronico.gov.br/biblioteca/arquivos/documento-da-e-ping-versao-2013/

http://renatomartini.net/?p=1532#identifier_2_1532

4. Ver para o Android:

http://developer.android.com/guide/topics/manifest/manifest-intro.html ;

        e para o Windows:

http://msdn.microsoft.com/en-us/library/windowsazure/jj151525.aspx ;

        por fim, para o Google:

https://developers.google.com/google-apps/marketplace/manifest

http://renatomartini.net/?p=1532#identifier_3_1532”

Renato Martini é diretor-presidente do Instituto Nacional de Tecnologia da Informação – ITI e Secretário Executivo do Comitê Gestor da Infraestrutura de Chaves Públicas Brasileira CG ICP-Brasil, é também membro titular do Comitê de Segurança da Informação do Gabinete de Segurança Institucional da Presidência da República, do Comitê Gestor do Registro de Identidade Civil e do Comitê Gestor da Internet do Brasil – CGIbr, na condição de representante da Casa Civil da Presidência da República. Completou o seu doutorado, em 1998, na Pontifícia Universidade Católica do Rio de Janeiro, tendo como áreas de especialização a Filosofia da Ciência e a Lógica.

Pesquisas na Hemeroteca Digital

Abaixo passo a vocês como pesquiso um assunto na Hemeroteca Digital da Biblioteca Nacional:

Digite o endereço da Hemeroteca no seu navegador: http://memoria.bn.br/hdb/uf.aspx

Hemeroteca Digital da Bibliotea NacionalNa página que segue (conforme figura ao lado), selecione:

1 - Escolha um local

Selecione ES (para periódicos do Espírito Santo, obviamente).

2 - Escolha um período

Selecione a década que deseja pesquisar.

3 - Escolha um periódico

Embora se possa optar por somente um periódico, é interessante selecionar TODOS.

4 - Digite para pesquisar

Coloque a palavra desejada, por exemplo Caieiras

Clique no botão pesquisar e aguarde. Rapidamente abre-se uma nova janela com a relação de ocorrências da palavra apresentada em cada periódico. Coloque o mouse no sinal de + (aparece à direita) e selecione "ir para a primeira ocorrência". Daí vem nova janela com a cópia do periódico.

Até a próxima!