Pesquisar neste blog

Comunicado

Comunico a todos que tiverem interesse de compartilhar meus artigos, textos, ensaios, monografias, etc., por favor, coloquem as devidas referências e a fonte de origem do material usado. Caso contrário, você estará cometendo plágio ou uso não autorizado de produção científica, o que consiste em crime de acordo com a Lei 9.610/98.

Desde já deixo esse alerta, pois embora o meu blog seja de acesso livre e gratuito, o material aqui postado pode ser compartilhado, copiado, impresso, etc., mas desde que seja devidamente dentro da lei.

Atenciosamente
Leandro Vilar

domingo, 9 de outubro de 2016

O historiador e as fontes digitais

O historiador e as fontes digitais: uma visão acerca da internet como fonte primária para pesquisas históricas1


Fábio Chang de Almeida2


A Internet3 configura-se como uma nova categoria de fontes documentais para pesquisas históricas. Em especial os pesquisadores do Tempo Presente, após o advento da Internet, passaram a contar com um aporte quase inesgotável de novas fontes. Contudo, já na segunda década do século XXI, ainda são poucas as pesquisas históricas que utilizam a Internet como fonte primária. Por que os historiadores ainda relutam em aproveitar a Rede como fonte de pesquisa, especialmente enquanto fonte primária para pesquisas históricas?

Uma primeira explicação para este comportamento é de caráter histórico. Durante séculos, a historiografia baseou suas regras de validação de fontes e metodologia de análise em um suporte documental específico: o papel. Para a Escola Metódica, dita Positivista, do final do século XIX, o historiador deveria trabalhar, sobretudo, com documentos oficiais. Estes documentos eram, em última análise, textos registrados em papel: atos governamentais, tratados internacionais, códigos de leis, etc. Outras formas de registro das atividades humanas eram desprezadas ou relegadas às chamadas “ciências auxiliares”, como a Arqueologia e a Numismática.

Mesmo atualmente, a grande maioria das fontes documentais consagradas no ofício do historiador ainda encontra sua materialidade no papel: correspondências, ofícios, requerimentos, atas, inventários, testamentos, processos, registros paroquiais, periódicos... Existe toda uma tradição historiográfica baseada nesse suporte específico. Até mesmo o estereótipo do historiador como “rato de arquivo” não dispensa a alegoria de um cenário de penumbra, onde um personagem com a postura arqueada e os óculos na ponta do nariz, analisa papéis amarelados em meio à poeira e ao mofo.

Entretanto, o “reinado do papel” começou a ruir com a concepção histórica difundida a partir da Escola dos Annales. O texto de Lucien Febvre citado a seguir pode ser considerado emblemático na defesa de uma ampliação na noção de documento. Para o autor, o conhecimento histórico deveria ser produzido utilizando-se uma ampla gama de fontes, relacionadas com uma variedade de manifestações do ser humano:

“A história faz-se com documentos escritos, sem dúvida. Quando estes existem. Mas pode fazer-se, deve fazer-se sem documentos escritos, quando não existem. Com tudo o que a habilidade do historiador lhe permite utilizar para fabricar o seu mel, na falta das flores habituais. Logo, com palavras. Signos. Paisagens e telhas. Com as formas do campo e das ervas daninhas. Com os eclipses da lua e a atrelagem dos cavalos de tiro. Com os exames de pedras feitos pelos geólogos e com as análises de metais feitas pelos químicos. Numa palavra, com tudo o que, pertencendo ao homem, depende do homem, serve o homem, exprime o homem, demonstra a presença, a atividade, os gostos e as maneiras de ser do homem. Toda uma parte, e sem dúvida a mais apaixonante do nosso trabalho de historiadores, não consistirá num esforço constante para fazer falar as coisas mudas, para fazê-las dizer o que elas por si próprias não dizem sobre os homens, sobre as sociedades que as produziram, e para constituir, finalmente, entre elas, aquela vasta rede de solidariedade e de entreajuda que supre a ausência do documento escrito?” (FEBVRE apud LE GOFF, 1992, p. 540).

As palavras do mestre francês, escritas na década de 1950, ajudam a entender a incorporação das fontes digitais no ofício dos historiadores, décadas depois. “Tudo o que, pertencendo ao homem, depende do homem, serve o homem, exprime o homem, demonstra a presença, a atividade, os gostos e as maneiras de ser do homem.” Especialmente no século XX, outras fontes passaram a figurar (sempre encontrando alguma resistência) no cotidiano do historiador. Contudo, a desconfiança em relação à incorporação de novas categorias documentais ainda é visível. No Brasil, a quantidade de pesquisas de mestrado e doutorado em História que utilizam as fontes digitais ainda está muito aquém do potencial oferecido por este suporte documental. Certamente tal resistência está relacionada, em parte, com a herança metodológica positivista que privilegiava os “papéis” oficiais.

Outra explicação para que a utilização das fontes digitais ainda seja ínfima diz respeito à ausência de uma ampla discussão teórico-metodológica acerca do assunto. Os primeiros trabalhos que utilizam documentos digitais são muito recentes e, de uma maneira geral, não realizam esta tarefa. Para que os historiadores aceitem definitivamente os documentos digitais enquanto fontes primárias, é necessária a sistematização teórica e metodológica que vai pautar esta prática. Isto só será concretizado quando houver um número significativo de pesquisas que utilizem fontes digitais. O método será construído analisando os erros e acertos efetuados nesse processo. Entretanto, a escassez de referenciais não pode justificar uma falta de preocupação com o método. Por exemplo, no artigo em que analisa sites dos Ministérios de Relações Exteriores de vários países, Denis Rolland (2004) não reservou nenhuma linha para reflexões metodológicas. O leitor não é informado sobre qual critério foi utilizado para selecionar os sites utilizados na pesquisa. Como foi analisado o material? De que forma foi preservado (supondo que tenha sido preservado) o seu conteúdo? O artigo não se preocupa em fornecer respostas para estas questões.

A palavra de ordem é adaptação. É compreensível que a historiografia não acompanhe imediatamente todas as evoluções tecnológicas da sociedade contemporânea. Todavia, tratando-se de informática, as evoluções são muito rápidas, os impactos sociais são extremamente significativos e a necessidade de adaptação torna-se mais urgente. A tecnologia atualiza-se a partir das demandas da sociedade (e do mercado), e simultaneamente a sociedade altera-se a partir das evoluções tecnológicas, em um processo dinâmico. Pierre Levy chama de “cibercultura” ao “conjunto de técnicas (materiais e intelectuais), de práticas, de atitudes, de modos de pensamento e de valores que se desenvolvem juntamente com o crescimento do ciberespaço.” (LÉVY, 1999-b, p. 17).

A historiografia não pode se isolar da realidade que pretende estudar. Especificamente a História do Tempo Presente (HTP) deve adaptar-se mais rapidamente às novas tecnologias da informação. Para a HTP, não se trata apenas de aproveitar as facilidades técnicas proporcionadas pelas fontes digitais. Para os historiadores que buscam compreender o presente, negligenciar as fontes digitais e a Internet significa fechar os olhos para todo um novo conjunto de práticas, de atitudes, de modos de pensamento e de valores que vêm se desenvolvendo juntamente com o crescimento e popularização da rede mundial de computadores.

A Internet vem crescendo significativamente desde os anos 1990.4 De acordo com os censos realizados sistematicamente pela empresa Netcraft5, o número total de hostnames na Internet era de aproximadamente 19 mil em 1995. Em 1997, o número atingiu um milhão de hostnames. Em 2000 eram 20 milhões; em 2003, 40 milhões; em 2005, 70 milhões; em 2006 alcançou-se a cifra de 100 milhões; em fevereiro de 2008 mais de 158 milhões; e em julho de 2010 foram contabilizados mais de 205 milhões de hostnames na Internet.6

Imagem 1: A linha superior representa o número de hostnames na Internet, de outubro de 1995 a julho de 2010. 
A rede mundial de computadores tornou-se uma ferramenta de comunicação poderosa, devido à facilidade de acesso e à amplitude de cobertura da nova tecnologia. Um computador conectado à Internet é um eficiente instrumento para a troca de informações em escala global. Com a popularização em escala mundial, criou-se um novo espaço de sociabilidade: o ciberespaço. De acordo com Pierre Lévy, o ciberespaço engloba a infra-estrutura material da Internet, as informações disponíveis através dela e as pessoas que a mantém e a utilizam:

“O ciberespaço (...) é o novo meio de comunicação que surge da interconexão mundial dos computadores. O termo especifica não apenas a infra-estrutura material da comunicação digital, mas também o universo oceânico de informações que ela abriga, assim como os seres humanos que navegam e alimentam esse universo”. (LÈVY, 1999-b, p.17).

Lévy aponta uma característica essencial da Internet, que acaba por modificar a visão de mundo dos seus usuários: a aparente redução das distâncias. De certa maneira, o ciberespaço aboliu o território geográfico no âmbito das comunicações, tornando possível a circulação praticamente instantânea de informações em escala mundial:

“Um computador e uma conexão telefônica dão acesso a quase todas as informações do mundo, imediatamente ou recorrendo a redes de pessoas capazes de remeter a informação desejada. (...) Meditemos um instante sobre uma frase de Fernand Braudel: “Medida pela velocidade dos transportes da época, a Borgonha de Luís XI é várias centenas de vezes a França inteira de hoje.” (...) Cada dispositivo de transporte e de comunicação modifica o espaço prático, isto é, as proximidades efetivas”. (LÈVY, 1999-a, p. 199).

Na história da Internet, é possível identificar dois momentos importantes que alavancaram o crescimento da rede. Estes dois momentos estão relacionados com dois conceitos fundamentais: “web” e “web 2.0”. Em 1990, foi criada pelo inglês Tim Berners-Lee a World Wide Web (www, ou simplesmente web), um modelo de gerenciamento de arquivos que tornou-se padrão na Internet. A web baseia-se em uma interface gráfica que possibilita o acesso a dados variados de maneira simples. Antes dela, eram necessários complexos conhecimentos do sistema operacional UNIX para utilizar a Internet. Na segunda metade da década de 1990, com a interface da World Wide Web, a Internet popularizou-se, atingindo os usuários domésticos. A web é construída a partir do princípio de hipertexto. Este pode ser considerado como um documento digital composto por diferentes blocos de informações conectadas (ou lexias). A conexão entre os blocos de informações é realizada através de vínculos eletrônicos denominados links,7 que permitem o avanço para outras seções dentro do mesmo site, ou o redirecionamento para sites diferentes (LEÂO, 2001, pp. 15-16). O hipertexto maximizou o caráter rizomático8 da Internet:

“A construção da teia mundial envolve o trabalho de diversas mentes, distribuídas em diversas páginas. Seu crescimento e sua vitalidade não se encontram localizados em um ponto central e específico. Ao contrário, é no caráter de autogeração e autopoiésis que a Internet se desenvolve. Sem dúvida alguma, o que faz da Web uma teia, uma rede na qual uma complexa malha de informações se interligam, é a própria tecnologia hipertextual que permite os elos entre os pontos diversos. Cada página, cada site, traz em si o potencial de se intercomunicar com todos os outros pontos da rede. (...) de um ponto da rede pode-se alcançar outros, que também possibilitam outros”. (LEÂO, 2001, p. 24).

O outro momento importante para o crescimento da Internet ocorreu na primeira metade dos anos 2000. Em 2004 foi criado o termo “web 2.0” para caracterizar uma suposta segunda geração da world wide web. Há muita polêmica em torno do conceito de web 2.0, sendo que na realidade não existe uma definição aceita de maneira consensual. Na prática, a web 2.0 significou uma mudança de mentalidade dos desenvolvedores de sites da Internet. A partir da aplicação de conhecimentos técnicos preexistentes, passou-se a valorizar a interatividade entre os usuários e os sites. Com base nesta interatividade, os usuários passaram a colaborar de forma ativa com a melhoria das páginas, ou mesmo com a construção de novas páginas. Ferramentas mais simples para a criação de sites foram disponibilizadas, aumentando drasticamente o número de pessoas que se aventuram na construção de páginas na Internet. Conforme Ian Davis (2005), web 2.0 é uma atitude, não uma tecnologia, e diz respeito a possibilitar e encorajar a participação dos internautas através de aplicativos e serviços abertos.

Um bom exemplo das conseqüências desta “mudança de atitude” foi a popularização dos blogs.9 Um blog é um site da Internet atualizado com certa regularidade, onde as atualizações são dispostas em ordem cronológica inversa (iniciando pelas mais recentes). Inicialmente, a maioria dos blogs funcionava como “diários virtuais”, onde as pessoas escreviam sobre suas vidas pessoais. Segundo alguns pesquisadores da Internet, o primeiro blog foi criado por Tim Berners-Lee (o mesmo criador da web), em 1992. (EIRAS, 2007, p. 76).

O formato blog se popularizou a partir de 1999, e mais ainda com o advento da web 2.0. Os blogs passaram a abordar todo tipo de conteúdo e agora suas atualizações incluíam textos, imagens, vídeos, músicas, etc. Os blogs podem ser escritos por uma ou mais pessoas. Em geral possuem sistemas de comentários através dos quais os leitores podem interagir, deixando registradas suas opiniões acerca dos assuntos tratados. Não são necessários conhecimentos de programação para criar um blog. As diversas ferramentas disponíveis para a publicação de blogs (Blogger, Blogspot, Wordpress, Weblog, etc.) tornam extremamente fácil esta tarefa. Diversas instituições apostam nos blogs como uma ferramenta mais dinâmica, a complementar os sites tradicionais. A Presidência da República Federativa do Brasil é um exemplo de instituição que mantém um blog na Internet.10

Como uma derivação do conceito blog, surgiu em 2006 uma ferramenta de uso ainda mais simples. O Twitter, chamado por alguns de microblog, possibilita aos seus usuários o envio e recebimento de mensagens curtas. Esta é a principal diferença entre o Twitter e os blogs tradicionais: no Twitter o tamanho das mensagens é limitado a 140 caracteres. A ferramenta tornou-se um sucesso mundial, não só entre usuários “domésticos”, mas também entre instituições. Por exemplo, a Presidência da República Portuguesa11 possui página no Twitter, assim como o Arquivo Público do Estado de São Paulo.12

Outro produto derivado da web 2.0 é a enciclopédia de construção coletiva, cujo exemplo de maior sucesso é a Wikipedia.13 Criada em 2001, a proposta da Wikipedia é a de uma “enciclopédia livre”, construída por milhares de colaboradores em várias partes do mundo. O princípio de construção da Wikipedia baseia-se no conceito de “inteligência coletiva”. Conforme Pierre Lèvy, O que é inteligência coletiva? É uma inteligência distribuída por toda parte, constantemente avaliada, coordenada em tempo real, levando à mobilização efetiva das competências. Nós adicionamos à nossa definição essa idéia essencial: o fundamento e o objetivo da inteligência coletiva é o reconhecimento e o enriquecimento mútuo das pessoas, não o culto de comunidades fetichizadas ou hipostasiadas. (LÈVY, 2004, p. 20).

Contudo, o modelo ideal de Lèvy mostra-se utópico quando aplicado na prática do ciberespaço. A idéia de uma inteligência coletiva fundamentada no princípio do “enriquecimento múto” esbarra nos conflitos políticos e nos embates ideológicos característicos da sociedade humana, que naturalmente são reproduzidos nas comunidades “virtuais”. Inclusive, a popularidade do formato de “construção coletiva” fez com que surgissem enciclopédias eletrônicas com orientação ideológica voltada à extrema-direita. Usando formato semelhante ao inaugurado pela Wikipedia, podemos citar o exemplo a Metapedia, um site de extrema-direita de inspiração negacionista14 publicado em 16 idiomas, que aproveita os recursos disponibilizados pela web 2.0, onde os usuários podem editar o conteúdo dos verbetes.15

Também deve ser incluída nesse contexto a expansão dos chamados “sites de relacionamento”, criados a partir de teorias de redes sociais, ou “social networking”. São exemplos desta categoria sites como o Friendster,16 Facebook,17 Orkut,18 Hi5,19 MySpace,20 e o próprio Twitter. De maneira geral, estes sites possibilitam que os seus usuários criem um perfil onde divulgam informações pessoais, revelam interesses específicos, compartilham fotografias e vídeos, mandam e recebem mensagens, etc. Os usuários podem também criar redes de relacionamento com outras pessoas, além de construir ou participar de comunidades voltadas para um determinado assunto.

Outro fenômeno da Internet, relacionado com as mudanças advindas da web 2.0, são os sites de compartilhamento de imagens (image sharing), e compartilhamento de vídeos (video sharing).

Como exemplos do primeiro tipo temos o Flickr,21 o ImageShack,22 e o Panoramio.23 São exemplos do segundo tipo o Metacafe24 e o Dailymotion,25 mas sendo o caso de maior sucesso o do Youtube.26 Os sites de compartilhamento, em sua grande maioria, são gratuitos e permitem que seus usuários coloquem imagens ou vídeos na Internet para que sejam assistidos por um grupo restrito de pessoas (mediante a utilização de uma senha), ou em caráter público, sem nenhuma restrição. O Youtube acaba funcionando como uma plataforma de propaganda política. Por exemplo, o site é um grande sucesso entre os simpatizantes da extrema-direita de inspiração nazi-fascista. No Youtube é possível encontrar milhares de vídeos relacionados ao assunto, sendo muitos de apologia ideológica. Há vários canais no Youtube criados por usuários que se dedicam a colocar na Internet vídeos de caráter neofascista.27

O advento da web 2.0 possibilitou a curva ascendente quase exponencial no número de hostnames na Internet a partir da segunda metade dos anos 2000, como é visível na Imagem 1. Em função dessa significativa ampliação do espectro de usuários que colaboram com a construção da Internet, fica evidente que os historiadores do tempo presente não podem negligenciar o potencial da rede como fonte de pesquisa. O caráter efêmero da Internet torna ainda mais importante a tomada de consciência dos historiadores perante esta nova categoria de fontes. Muitos sites são retirados do ar sem aviso prévio e seu conteúdo pode ser perdido, visto à sua inexistência em outro suporte.28 Dessa forma, o pesquisador do Tempo Presente tem acesso exclusivo a esse material, pois ele só é acessível em uma restrita janela temporal.

Como se estivesse em um trabalho de “arqueologia de salvamento”, o historiador torna-se responsável pela análise e também pela preservação da informação. Não fosse a sua intervenção, o documento poderia ser perdido em caráter definitivo.

Os documentos digitais têm como característica a dissociação entre o suporte físico e o seu conteúdo informacional. Sendo assim, é possível o descarte do suporte físico e a manutenção de seu conteúdo em um novo suporte. A evolução extremamente rápida da tecnologia informática torna os suportes físicos de informação obsoletos em um curto espaço de tempo. Em pouco tempo o disquete de 1,44 Mb de capacidade de armazenamento tornou-se obsoleto, sendo substituído pelo CD de 700 Mb (equivalente a 487 disquetes). Atualmente, a preservação pode ser realizada utilizando como suporte físico DVDs com 4,7 Gb de capacidade (equivalente a quase 7 CDs).

No caso das pesquisas históricas que utilizam fontes digitais, uma solução viável para a questão do armazenamento da documentação é o salvamento dos arquivos pesquisados em formato PDF,29 construindo assim um banco de dados digital. No caso de monografias, dissertações ou teses, uma cópia de tal banco de dados pode ser feita em DVD (ou em outro suporte mais atual) e anexada na versão final do trabalho.

Mas afinal de contas, o que é um documento digital? Para responder esta pergunta vale antes revisar a noção primordial de “documento”. Para os arquivistas, documento é o registro de uma informação, independente da natureza do suporte que a contém (PAES, 2004, p. 26). Tal noção é importante, pois quebra qualquer hipotética relação de dependência entre o documento e o suporte em papel. Mais do que isso, este conceito não relaciona o documento com qualquer suporte específico. A ênfase recai sobre o “registro de uma informação” e não sobre a espécie do suporte. Dessa forma, é afastado o “problema” da natureza digital das fontes eletrônicas. É possível ir além, buscando subsídios em uma área onde a questão dos documentos – inclusive os digitais – é central e bastante debatida: no Direito. Para os juristas, documento pode ser considerado como “qualquer base de conhecimento, fixada materialmente e disposta de maneira que se possa extrair cognição do que está registrado” (GICO JÚNIOR, 2001, p 98). De forma semelhante, pode-se dizer que na esfera do Direito:

“Documento é toda representação material destinada a reproduzir determinada manifestação do pensamento (...). Abarca o mais amplo espectro de sinais, sendo o mais comum deles a escrita. (...) É a coisa material na qual a atividade humana imprime vestígios ou sinais para efeito de comunicação de determinados conhecimentos. (...) Não importa sobre que tipo de material encontra-se o registro, mas a representação física do pensamento humano nele representado”. (GICO JÚNIOR, 2001, pp. 98-99).

Perceba-se que não buscamos a concepção jurídica de documento como “prova”, mas como “registro”. Utilizar o termo no sentido de “prova jurídica” significaria aproximar-se do conceito de “prova científica” almejado pela historiografia metódica. Não é esta a intenção deste trabalho ao resgatar as concepções da Arquivologia e do Direito. O objetivo é enfatizar que o documento é o registro da expressão da experiência humana, em suas mais variadas manifestações, independente de seu suporte material. Sendo assim, podemos considerar como “documento histórico” uma enorme variedade de registros da atividade humana: escritos dos mais variados tipos, logicamente, mas também música, arquitetura, palavra oral, pintura, escultura, teatro, fotografia, cinema, iconografia, vestuário, etc.

Dessa forma, e tentando construir um conceito o mais simples possível, podemos considerar que “documento digital” é aquele documento – de conteúdo tão variável quanto os registros da atividade humana possam permitir – codificado em sistema de dígitos binários, implicando na necessidade de uma máquina para intermediar o acesso às informações. Tal máquina é, na maioria das vezes, um computador.

Partindo desse conceito fundamental e através da experiência empírica, percebe-se a existência de dois tipos básicos de fontes digitais utilizáveis em uma pesquisa histórica: as fontes primárias e as “não-primárias”. Dentro destas duas categorias fundamentais é possível encontrar dois tipos de documentos: “não-primários” digitais, e primários digitais. Dentro deste último, outras duas subcategorias ainda podem ser identificadas: os “documentos primários digitais exclusivos” e os documentos primários digitalizados. Esta tipologia será explicada a seguir e está representada em forma de diagrama na Tabela 1.30

O primeiro tipo de fontes digitais utilizáveis em uma pesquisa histórica diz respeito às fontes “não-primárias” digitais, que por sua vez correspondem aos documentos “não-primários” digitais. A Internet oferece uma quantidade imensa de informação combinada com uma facilidade de acesso inexistente há apenas quinze ou vinte anos atrás. Basta digitar uma URL31 para que o navegador nos transporte a um universo de textos e imagens sobre os mais diversos assuntos. Entretanto, muitos sites apresentam-se sob uma formatação aparentemente acadêmica, quando na verdade não representam o fruto de verdadeiro trabalho científico. Apesar de ser facilmente encontrado através de mecanismos de busca como o Google, grande parte do material existente na Internet não possui qualidade e contém erros grosseiros. Em outros casos, apesar de apresentarem-se como o trabalho de especialistas, os textos encontrados na rede refletem apenas a opinião altamente ideológica de seus autores. Isso quando é possível identificar os autores. Ao contrário de um livro ou uma revista impressa em papel, na Internet muitas vezes é mais difícil avaliar a autoria e procedência do material.

Tal característica implica na adoção de critérios cuidadosos para a seleção de fontes da Internet a serem utilizadas em uma pesquisa científica. É necessário perceber se o conteúdo de um determinado site corresponde a uma fonte integral, ou se foi retirado parcialmente de outra fonte. A precisão das informações contidas em um determinado site deve ser testada comparando-as com outras fontes. Também é importante observar se há alguma instituição acadêmica respaldando o site em questão. Nos últimos anos, as principais publicações científicas passaram a contar com edições eletrônicas. Papers, artigos, dissertações de mestrado ou teses de doutorado podem ser acessadas através da Internet. Por exemplo, no Brasil o portal de periódicos da CAPES disponibiliza o acesso a 15.475 revistas científicas nacionais e internacionais (em 2008 eram aproximadamente 11.500).32 O acesso dos pesquisadores a esta vasta quantidade de fontes secundárias foi significativamente facilitado pela Internet.

O segundo tipo de fontes digitais diz respeito àquelas que fornecem documentos primários. Estes, por sua vez, podem ser classificados em dois tipos básicos: os “documentos primários digitais exclusivos” e os “documentos primários digitalizados”. Os documentos digitalizados são aqueles resultantes do trabalho de digitalização da documentação “tradicional” já existente. Por exemplo, o jornal inglês The Times disponibiliza na Internet 200 anos de seu acervo (de 1785 a 1985).33 São cerca de 20 milhões de artigos e 35 milhões de imagens. Em um trabalho de enorme proporção, cada página dos jornais foi escaneada34 e processada por OCR.35

Também são muitas as instituições acadêmicas de pesquisa que já possuem arquivos de documentos digitalizados acessíveis pela Internet: bibliotecas, arquivos, Universidades, centros de pesquisa, museus, fundações. Como exemplos é possível lembrar o German Propaganda Archive, da Calvin University,36 talvez o maior arquivo digital sobre propaganda nazista disponível na Internet. Outro exemplo importante é a coleção de pôsteres de guerra resultante da parceria entre a University of Minnesota e a Minneapolis Public Library. Entre 2001 e 2004, foram digitalizados mais de cinco mil pôsteres da I e II Guerras Mundiais, formando o maior acervo do mundo sobre o assunto acessível pela Internet.37 Também é possível citar a Biblioteca Digital, da Biblioteca Nacional38; e o acervo digital do CPDOC39; entre outros.

O segundo tipo de documentos primários digitais, os “digitais exclusivos”, engloba aqueles documentos que não possuem outro suporte além do digital. Trata-se de uma enorme quantidade de informação que está sendo produzida e disponibilizada unicamente em formato digital, sobretudo na Internet. Nesse caso, os dados referentes a tais documentos têm na rede o seu único meio de publicação e arquivamento. Dessa forma, a rede mundial de computadores propicia uma existência “virtual” para esta documentação.40 Por exemplo, nos dias de hoje muitas pessoas possuem diários virtuais publicados em blogs da Internet.

Contudo, os diários virtuais são voláteis e sua permanência na Internet (e nos discos rígidos dos servidores, onde encontram sua materialidade física) pode ser efêmera. Há muito tempo os historiadores valorizam os diários “tradicionais” como fontes para pesquisa. É chegado o momento de reconhecer o potencial de documentos semelhantes, porém publicados em um formato novo. Os diários virtuais representam apenas um, entre os diversos documentos históricos produzidos exclusivamente na Internet.

É importante perceber que os dois tipos de documentos primários citados anteriormente podem ser considerados digitais, pois utilizam a codificação em dígitos binários. Contudo, os documentos “digitalizados” constituem um tipo específico por possuírem obrigatoriamente um suporte material anterior à digitalização: na maioria das vezes, o papel, porém não necessariamente este. A outra categoria (documentos primários digitais exclusivos), não possui outro suporte material além do digital.

Tabela 1: Os tipos de fontes e documentos digitais utilizáveis pelo historiador. 
De maneira geral, a abundância é uma característica que chama a atenção quando se fala em “informação digital”. Quando a responsabilidade sobre a publicação das informações digitais recai sobre instituições de pesquisa, é provável que haja uma equipe de profissionais a revisar e avalizar a autenticidade de tais informações. Normalmente, as instituições publicam relatórios impressos que “referendam” as informações disponibilizadas nos sites da Internet. Como exemplo, podemos citar o Inter-University Consortium for Political and Social Research, da Universidade de Michigan41, o Center for Electronic Records do Arquivo Nacional dos Estados Unidos da América42 e o Instituto Brasileiro de Geografia e Estatística.43

Todavia, há uma vasta quantidade de informações disponíveis através da Internet, sem nenhuma relação com instituições que possam responsabilizar-se pela autenticidade das mesmas. Nesse conjunto entram blogs, fóruns eletrônicos, e-mails e uma série de outros meios digitais. Em primeiro lugar, um questionamento fundamental precisa ser respondido: as informações contidas em uma página da Internet sem relação com instituições de pesquisa podem ser tomadas como fonte de estudo?44 A resposta para esta pergunta não pode ser outra: sem dúvida! Elas podem e devem ser utilizadas, pois em caso contrário se estaria correndo o risco de negligenciar um período importante da História do Tempo Presente. Contudo, para utilizar tal documentação, faz-se necessário um maior rigor em relação ao método historiográfico, além da utilização de alguns procedimentos metodológicos específicos.

Um cuidado fundamental a ser tomado diz respeito ao inter-relacionamento da documentação. É importante demonstrar, quando for o caso, que a documentação utilizada possui certa relação entre si. Também é interessante salientar as aproximações temáticas e ideológicas da documentação, que se manifestam através de citações e convergências discursivas. Uma forma de interligação particular das fontes oriundas da Internet é feita através dos links. As páginas podem apresentar atalhos para outros sites, o que demonstra algum tipo de afinidade entre os conteúdos dos mesmos. Por exemplo, e de forma simplificada, o site oficial do Partido Renovador Nacional (PNR), organização de extrema-direita de Portugal, apresenta links para o twitter e para o blog do partido.45

Portanto, é perfeitamente razoável supor que tais páginas sejam realmente ligadas à instituição. Por outro lado, blogs ou twitters que porventura se afirmem como representativos do PNR, mas que não estejam linkados no site oficial do partido devem ser analisados, inicialmente, com desconfiança. É fundamental registrar tais aproximações tendo em vista que o inter-relacionamento das fontes pode funcionar como um indicador da confiabilidade das mesmas. De acordo com Luciana Duranti, o inter-relacionamento da documentação:

“...é devido ao fato de que os documentos estabelecem relações no decorrer do andamento das transações e de acordo com suas necessidades. Cada documento está intimamente relacionado "com outros tanto dentro quanto fora do grupo no qual está preservado e (...) seu significado depende dessas relações". As relações entre os documentos, e entre eles e as transações das quais são resultantes, estabelecem o axioma de que um único documento não pode se constituir em testemunho suficiente do curso de fatos e atos passados: os documentos são interdependentes no que toca a seu significado e sua capacidade comprobatória. Em outras palavras, os documentos estão ligados entre si por um elo que é criado no momento em que são produzidos ou recebidos, que é determinado pela razão de sua produção e que é necessário à sua própria existência, à sua capacidade de cumprir seu objetivo, ao seu significado, confiabilidade e autenticidade. Na verdade, os registros documentais são um conjunto indivisível de relações intelectuais permanentes tanto quanto de documentos”.46

Trabalhar sob uma incerteza calculada não é novidade para o historiador, pois os métodos históricos não são totalmente precisos. As fontes “tradicionais” não são mais confiáveis do que as fontes digitais. Um documento impresso pode ser falso. Uma fotografia antiga pode ser fraudulenta. Um depoimento oral pode modificar os fatos. É normal para os historiadores trabalhar dentro de campos de possibilidades, utilizando métodos para reduzir as chances de erro. No futuro, é possível que sejam criados mecanismos mais precisos para verificar a autenticidade das fontes digitais.47 Contudo, enquanto tais procedimentos não se tornarem operacionais, a habilidade e a experiência do pesquisador continuarão determinantes na seleção das fontes mais confiáveis.

Outro procedimento especial a ser adotado na análise das fontes oriundas da Internet deve estar relacionado à preocupação com o cruzamento de dados. Tais fontes podem ser altamente ideológicas, sendo necessária a crítica cuidadosa de suas informações. Uma forma de fazer isso é cruzar seus dados com outras fontes disponíveis. Por exemplo, se o historiador estiver estudando sites de partidos políticos, torna-se interessante utilizar também periódicos de diferentes orientações ideológicas para confrontar determinadas informações.

Ao utilizar documentação “convencional” (cartas, jornais, inventários, fotografias, etc.) sob a guarda de instituições de pesquisa, museus ou arquivos, algumas vezes é possível que o historiador não se preocupe em verificar sua autenticidade. Isto porque, em alguns casos, supõe-se que tais documentos já tenham passado pela avaliação de outros profissionais que em algum momento atestaram sua autenticidade. Todavia, ao se deparar com documentos inéditos, faz-se necessário o exame criterioso para verificar sua confiabilidade. Uma fotografia pode ser falsificada ou uma carta pode ser forjada e existem métodos que possibilitam identificar tais falsificações. Ao utilizar sites da Internet como fonte primária o historiador irá, provavelmente, ser a primeira pessoa a preocupar-se em verificar sua autenticidade. Isso faz com que aumentem as chances de se deparar com algum tipo de falsificação. Por isso, ao trabalhar com fontes da Internet, a atenção deve ser redobrada. O historiador precisa utilizar a técnica e desenvolver a habilidade necessária para selecionar o material confiável.

Por exemplo, um site pode ser hackeado48 e as informações ali publicadas originalmente podem ser alteradas sem o conhecimento dos seus autores. Por exemplo, em agosto de 2008, hackers do grupo antifascista AFA (Antifašistická Akce) conseguiram invadir o fórum eletrônico da organização neonazista Blood & Honour e alterar o conteúdo original das páginas.49

Imagem 2: Este banner deixado pelos hackers da AFA substituiu o conteúdo original do fórum da Blood & Honour. 
Outro tipo de falsificação às quais as fontes da Internet estão sujeitas, diz respeito a falsos sites, ou fake sites. Normalmente os fake sites são construídos com o propósito de aplicar golpes eletrônicos pela Internet. Os estelionatários criam cópias dos sites de empresas, instituições bancárias ou governamentais e atraem os usuários até elas para roubarem-lhes informações como número de cartões de crédito ou senhas bancárias. Também são comuns as falsificações de sites de relacionamento, como o Orkut, Facebook, My Space e Twitter. Há a possibilidade teórica da criação de um fake site em qualquer área do conhecimento.

Tomar um fake site como sendo um site verdadeiro seria um erro grosseiro, portanto o historiador deve estar atento a esta possível prática na hora de selecionar suas fontes. Existem procedimentos básicos que devem ser adotados para minimizar a possibilidade de que sejam cometidos enganos dessa natureza. Nesse sentido, a utilização da ferramenta WHOIS mostrou-se efetiva em alguns casos. WHOIS é um protocolo específico para consultar informações de contato e domínio sobre entidades da Internet. As entidades podem ser um nome de domínio, um endereço IP ou um AS (Sistema Autônomo). O protocolo WHOIS apresenta três tipos de contatos para uma entidade: Contato Administrativo (Admin Contact), Contato Técnico (Technical Contact) e Contato de Cobrança (Registrant Contact). Estes contatos são informações de responsabilidade do provedor de Internet.50

O historiador deve adquirir familiaridade com a documentação, a fim de conhecer os símbolos, os códigos, os detalhes que envolvem os documentos autênticos. Ao obter esta habilidade, a existência de desvios no padrão torna-se visível para o pesquisador atento. Trabalhar quantitativamente também pode ser um procedimento metodológico interessante, principalmente quando se estiver trabalhando com documentos anônimos ou cuja autenticidade seja de difícil comprovação. Dessa forma, se for obtido um corpus significativo de dados, é possível identificar uma coerência discursiva que remete a um modelo padrão.

Todos os desvios relevantes dentro do padrão identificado devem ser analisados com mais detalhes, para precisar sua procedência e minimizar a possibilidade de erros. É necessário que o historiador adquira certa “intimidade” com a documentação, a fim de perceber os afastamentos da regularidade. Com a experiência, os desvios acabam “saltando aos olhos” do historiador. Trata-se de trabalhar dentro de um espectro admissível de erro. Como afirma Charles Dollar,

“Os estudiosos e pesquisadores que utilizam algum material como fonte primária em sua pesquisa partem, em geral, do pressuposto de que tal material é confiável e fidedigno. Trata-se de uma "autenticidade presuntiva", porque a maior parte do material considerado fonte primária - registros para os arquivistas - não passa de um subproduto de transações rotineiras exigidas para se levar a cabo uma ação (legal, financeira ou comercial), e esses subprodutos acabam formando um corpus de materiais relacionados entre si. A presença de um documento em um corpus constituído de tipos semelhantes de material, que se sabe ou se acredita terem sido produzidos de acordo com procedimentos-padrão, acarreta uma presunção de fidedignidade e autenticidade. Por conseguinte, tanto o contexto quanto o conteúdo dos documentos dão testemunho da fidedignidade e da autenticidade”.51

É importante salientar o amplo espectro de documentação proporcionado pela Internet, especialmente para os historiadores do Tempo Presente. Em alguns casos, esta abundância pode chegar ao extremo. Mais do que facilitar o trabalho do historiador, a grande quantidade de fontes constitui um obstáculo perigoso. O impulso em buscar expandir a análise pode levar o pesquisador a um labirinto de fontes, onde seria difícil encontrar a saída no tempo disponível. A situação seria semelhante à metáfora usada por Aléxis de Tocqueville, onde o historiador é comparado com um minerador sobre o qual a mina desaba, deixando-o sem saber como sair dali carregando o tesouro.52 Dessa forma, é necessário selecionar os documentos mais relevantes para uma análise qualitativa, dentro do universo bem maior de fontes que entram na análise quantitativa.

O impacto das novas tecnologias da informação sobre a atividade dos pesquisadores em Ciências Humanas ainda não foi totalmente assimilado. As novas tecnologias causaram alterações na maneira de lidar com a documentação. Atualmente, os profissionais que trabalham em arquivos ainda estão em fase de adaptação a esse novo contexto:

“Com a proliferação dos sistemas eletrônicos de informação, esse mundo físico bem-arrumado dos arquivos desapareceu, tanto quanto assinaturas e selos, pastas e caixas, maços e dossiês, e a mais sagrada das entidades, a proveniência física e a ordem física original. Além disso, os sistemas eletrônicos de informação estão gerando uma realidade documental tão distinta daquela com que os arquivistas estão familiarizados que é muito difícil para eles acreditar que exista de todo uma realidade documental”.53

Em 2005, Orville Burton classificava este novo panorama no ofício do historiador como “revolucionário”, referindo-se a ele como uma “História Digital”.54 Algumas das vantagens de uma “História Digital” estão relacionadas com seu potencial para o armazenamento de dados, a sua facilidade de acesso, a flexibilidade de formatos (textos, imagens, vídeo, áudio,...), e a interatividade entre o usuário e as fontes, facilitada pelo princípio do hipertexto e pela web 2.0.

Todavia, o otimismo demonstrado por Burton cinco anos atrás não levava em consideração o fato de que História Digital também tem suas desvantagens: a falta de qualidade de grande parte do material disponível na Internet, o caráter volátil da documentação, a necessidade de atualização técnica constante do pesquisador, a possibilidade de cobrança para o acesso às fontes, a necessidade de avaliação da autenticidade da documentação (embora estas últimas não sejam exigências apenas da História Digital).

Tais características implicam na necessidade de uma metodologia específica para a lida com a documentação digital. Contudo, ao contrário do que parece afirmar Orville Burton, acreditamos que a “História Digital” não implica em uma revolução metodológica. Ela necessita, sem dúvida, de uma metodologia particular, porém fundamentada nos princípios básicos já consagrados da pesquisa historiografica, apenas adaptados ao formato digital.55

Referências Bibliográficas
ALMEIDA, Fábio Chang de. A serpente na rede: extrema-direita, neofascismo e internet na Argentina. Dissertação de Mestrado. Universidade Federal do Rio Grande do Sul. Instituto de Filosofia e Ciências Humanas, Programa de Pós-Graduação em História. Porto Alegre: 2008.
__________. Neofascismo: uma abordagem histórica. In: GONÇALVES, Leandro Pereira; PARADA, Maurício B. Alvarez; SILVA, Giselda Brito (orgs.). Histórias da Política Autoritária: Integralismos, Nacional-Sindicalismo, Nazismo e Fascismos. Recife: Editora da UFRPE, 2010. ISBN: 978-85-7946-019-7.
BURTON, Orville Vernon. American Digital History. In: Social Science Computer Review, v. 23, n. 2. Social Science Computing Association - North Carolina State University, 2005, p. 207. Disponível em: <http://ssc.sagepub.com/cgi/content/abstract/23/2/206>. Acesso em setembro de 2010.
CALDEIRA NETO, Odilon. Breves reflexões sobre o uso da Internet em pesquisas historiográficas. Revista Eletrônica Boletim do TEMPO, Ano 4, n. 20, Rio de Janeiro, 2009. Disponível em: <http://www.tempopresente.org>. Acesso em setembro de 2010.
COHEN, Daniel J; ROSENZWEIG, Roy. Digital History: a guide to gathering, preserving, and presenting the past on the web. Disponível em: <http://chnm.gmu.edu/digitalhistory>. Acesso em setembro de 2010.
DAVIS, Ian. Talis, Web 2.0 and all that. 4 de julho de 2005. Disponível em: <http://blog.iandavis.com/2005/07/talis-web-20-and-all-that>. Acesso em junho de 2010.
DELEUZE, Gilles. GUATTARI, Félix. Mil platôs: capitalismo e esquizofrenia. Vol. 1. Rio de Janeiro: Editora 34, 1995.
DOLLAR, Charles. Tecnologias da informação digitalizada e pesquisa acadêmica nas ciências sociais e humanas: o papel da arquivologia. In: Estudos Históricos, vol. 7, n. 13. Rio de Janeiro: FGV, 1994.
DURANTI, Luciana. Registros documentais contemporâneos como provas de ação. In: Estudos Históricos, vol. 7, n. 13. Rio de Janeiro: FGV, 1994.
EIRAS, Bruno Duarte. Blogs: mais que uma tecnologia, uma atitude. Cadernos de biblioteconomia arquivística e documentação, n. 1. Associação Portuguesa de Bibliotecários, Arquivistas e Documentalistas. Lisboa, 2007. Disponível em: <http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=38570105>. Acesso em junho de 2010.
GICO JÚNIOR, Ivo Teixeira. O documento eletrônico como meio de prova no Brasil. In: BAPTISTA, Luiz Olavo. (coord.) Novas fronteiras do Direito na informática e telemática. São Paulo: Saraiva, 2001. Disponível em: <http://works.bepress.com/ivo_teixeira_gico_junior>. Acesso em abril de 2010.
KUROSE, James F.; ROSS, Keith W. Computer networking: a top-down approach featuring the Internet. 3. ed. Boston: Pearson/Addison Wesley, 2005.
LEÃO, Lucia. O labirinto da hipermídia: Arquitetura e navegação no ciberespaço. São Paulo: FAPESP/Iluminuras, 2001.
LE GOFF, Jacques. História e memória. São Paulo: Editora da UNESP, 1992.
LÉVY, Pierre. A revolução contemporânea em matéria de comunicação. In: Para navegar no século XXI: tecnologias do imaginário e cibercultura. MARTINS, Francisco Menezes; SILVA, Juremir Machado da. Porto Alegre: Sulina/EDIPUCRS, 1999-a.
__________. Cibercultura. São Paulo: Editora 34, 1999-b.
__________. Inteligência colectiva: por una antropologia del ciberespacio. Washington, 2004. Disponível em: <http://inteligenciacolectiva.bvsalud.org>. Acesso em julho de 2010.
PAES, Marilena Leite. Arquivo: teoria e prática. 3. ed. Rio de Janeiro: Fundação Getúlio Vargas, 2004.
__________. O que é o virtual? São Paulo: Editora 34, 1996.
ROLLAND, Denis. Internet e história do tempo presente: estratégias de memória e mitologias políticas. Revista Tempo, n. 16, vol. 8. Rio de Janeiro: UFF, 2004. Disponível em: <http://www.historia.uff.br/tempo/artigos_dossie/artg16-4.pdf>. Acesso em junho de 2010.
SIRINELLI, Jean-François. Os intelectuais. In. REMOND, René (org.) Por uma história política. Rio de janeiro: UFRJ/FGV, 1996.
TRAVERSO, Enzo. La singularidad de Auschwitz - hipótesis, problemas y derivaciones de la investigación histórica. Buenos Aires: Revista Nuestra Memória, n. 22, 2003.

NOTAS:
1 Este artigo é uma versão revisada e ampliada do texto apresentado dia 27 de julho de 2010 no X Encontro
Estadual de História da ANPUH-RS, realizado na cidade de Santa Maria.
2 Mestre em História pela UFRGS (2008), onde foi bolsista de mestrado CNPq. Doutorando em História pela UFRGS. Bolsista PDEE-CAPES (2011). Investigador Visitante Júnior no Instituto de Ciências Sociais da Universidade de Lisboa (ICS-UL, 2011). Membro do Grupo de Pesquisa "Integralismo e outros Movimentos nacionalistas" (UFF/CNPq). Tem experiência na área de História, com ênfase em História Contemporânea e História do Tempo Presente, atuando principalmente nos seguintes temas: nazismo, fascismo, neofascismo, história oral, extrema-direita, propaganda política, teoria da história. E-mail: history.chang@gmail.com
3 A Internet é uma rede de computadores de alcance global que interconecta milhões de equipamentos através do mundo. Inicialmente estes equipamentos eram essencialmente computadores de mesa, estações de trabalho baseadas em UNIX e servidores que armazenavam e transmitiam informações como sites e mensagens de e-mail. Todavia, cada vez mais equipamentos vêm sendo conectados à rede, como PDAs (Personal digital assistant, ou palmtop), televisores, notebooks, telefones celulares, automóveis, câmeras de vídeo, etc. Em função disso, o termo “rede de computadores” parece estar defasado em sua aplicação à Internet. Todos esses equipamentos conectados à rede podem ser considerados hosts. Todos os hosts se comunicam através de links de comunicação, que podem ser de vários tipos: cabos coaxiais, cabos de cobre, fibras óticas, ondas de rádio, etc. Por sua vez, os hosts acessam a Internet através dos provedores de serviço de Internet (ISPs) (KUROSE; ROSS, 2005, pp. 2-6).
4 Com exceção de um período de comportamento anômalo entre 2009 e 2010, quando registrou-se uma redução no número total de hostnames na Internet, como é visível na Imagem 1.
5 Disponível em: <http://netcraft.com>. Acesso em julho de 2010.
6 July 2010 Web Server Survey. Disponível em: <http://news.netcraft.com>. Acesso em julho de 2010.
7 Neste trabalho é utilizada a palavra “atalho” como um sinônimo para link.
8 Podemos fazer uma analogia entre a estrutura da Internet e o conceito de rizoma. Deleuze e Guattari expõem os princípios seguidos pelo rizoma: “qualquer ponto de um rizoma pode ser conectado a qualquer outro e deve sê-lo. (...) um rizoma pode ser rompido, quebrado em um lugar qualquer, e também retoma segundo uma ou outrade suas linhas e segundo outras linhas. (...) Contra os sistemas centrados (e mesmo policentrados), de comunicação hierárquica e ligações preestabelecidas, o rizoma é um sistema a-centrado não hierárquico e não significante, sem General, sem memória organizadora ou autômato central, unicamente definido por uma circulação de estados.” (DELEUZE; GUATTARI, 1995, pp. 15-33).
9 A palavra blog é uma abreviação da expressão “web-log”.
10 Disponível em <http://blog.planalto.gov.br>. Acesso em junho de 2010.
11 Disponível em <http://twitter.com/presidencia>. Acesso em junho de 2010.
12 Disponível em <http://twitter.com/ArquivoPublico>. Acesso em junho de 2010.
13 Disponível em <http://www.wikipedia.org>. Acesso em junho de 2010.
14 Na década de 1960 foi estruturada uma corrente de pensamento em torno de historiadores como Joachim Fest e Andreas Hillgruber. O movimento que tomou forma nesse momento pode ser considerado como o “revisionismo clássico”, e representou a primeira fase do revisionismo histórico acerca da 2ª Guerra Mundial. Na maioria dos casos, o revisionismo clássico caracterizava-se por uma tentativa de relativização do nazi-fascismo, geralmente mantendo-se dentro dos limites acadêmicos, não assumindo explicitamente posicionamentos anti-semitas ou de negação do holocausto. Por exemplo, de acordo com Joachim Fest, não haveria diferença qualitativa entre as câmaras de gás nazistas e os fuzilamentos em massa promovidos pelo NKVD soviético. (FEST, apud TRAVERSO, 2003). Contudo, existe outra vertente revisionista que chega ao extremo da fraude histórica. Esta não constitui um movimento acadêmico ou historiográfico, embora apresente-se como tal. Trata-se de um discurso impregnado com uma pesada carga ideológica travestida em forma de ciência. Conhecido como negacionismo, esta subdivisão do revisionismo procura reescrever a história negando o holocausto judeu. Os negacionistas esforçam-se em construir um discurso que atribui uma aura de heroísmo ao seu trabalho. O negacionismo assume caráter de “ciência perseguida” e seus agentes enfatizam as restrições impostas em muitos países às suas publicações. É através do negacionismo que os grupos neofascistas atingem o maior número de leitores. Isso acontece porque, muitas vezes, os simpatizantes do revisionismo não são necessariamente militantes neofascistas, nem mesmo simpatizantes da extrema-direita. Podem ser pessoas comuns, sem motivação ideológica aparente. Trata-se da sedução de uma história “oculta”, o fascínio pela possibilidade de uma “verdade além do aparente”, fora da influência dos “vencedores da guerra” ou dos envolvidos na “grande conspiração”. São recorrentes nas fontes estudadas referências à teoria de uma “conspiração sionista internacional”. Algumas vezes o termo pode ser “conspiração judaica”, “conspiração judeu-maçônica”, ou “conspiração judeu-marxista”, mas o princípio é sempre o mesmo. No imaginário neofascista, trata-se de uma complexa coalizão envolvendo judeus, maçons e comunistas com o objetivo secreto de dominar o mundo e subjugar a “raça ariana”. Uma suposta manipulação da história pode ser compreendida pelos simpatizantes do revisionismo como um dos elementos dessa conspiração. (Ver: ALMEIDA, 2008; e ALMEIDA, 2010)
15 Disponível em: <http://www.metapedia.org>. Acesso em junho de 2010.
16 Disponível em: <http://www.friendster.com>. Acesso em julho de 2010.
17 Disponível em: <http://www.facebook.com>. Acesso em julho de 2010.
18 Disponível em: <http://www.orkut.com>. Acesso em julho de 2010.
19 Disponível em: <http://www.hi5.com>. Acesso em julho de 2010.
20 Disponível em: <http://www.myspace.com>. Acesso em julho de 2010.
21 Disponível em: <http://www.flickr.com>. Acesso em julho de 2010.
22 Disponível em: <http://www.imageshack.us>. Acesso em julho de 2010.
23 Disponível em: <http://www.panoramio.com>. Acesso em julho de 2010.
24 Disponível em: <http://www.metacafe.com>. Acesso em julho de 2010.
25 Disponível em: <http://www.dailymotion.com>. Acesso em julho de 2010.
26 Disponível em: <http://www.youtube.com>. Acesso em julho de 2010.
27 Algumas organizações de extrema-direita são exemplos de aproveitamento dos recursos da web 2.0, ao possuírem simultaneamente além do site tradicional, também um blog, Twitter, comunidade no Orkut, canal no Youtube, página no Flickr, etc.
28 Por exemplo, em 23 de abril de 2009 o Yahoo comunicou que encerraria as atividades do serviço de hospedagem de sites Geocities. Em 26 de outubro de o serviço foi definitivamente encerrado, e as páginas hospedadas no Geocities (cerca de 38 milhões) foram retiradas da Internet. Isso ocasionou algumas mobilizações no sentido de preservar muitos sites. Tais esforços estão representados em bancos de dados como o <http://www.archive.org>; <http://reocities.com>; <http://www.oocities.com>; <http://geociti.es>; e <http://geocities.ws>.
29 Portable Document Format (ou PDF) é um formato de arquivo desenvolvido pela Adobe Systems em 1993, para representar documentos de maneira independente do aplicativo usado para criá-los. Um arquivo PDF pode descrever documentos que contenham texto, gráficos e imagens num formato independente.
30 A classificação é nossa, estabelecida em função da experiência e da necessidade de sistematização metodológica advindas das pesquisas de mestrado e doutorado (este ainda em andamento), onde foram analisados os argumentos da extrema-direita atual na América Latina e na Europa. Em muitos casos, a documentação utilizada era oriunda da Internet. (Ver: ALMEIDA, 2008)
31 Uma URL (Uniform Resource Locator), é o endereço de um recurso disponível em uma rede, seja a Internet ou uma rede corporativa (Intranet). Uma URL tem a seguinte estrutura: <protocolo://máquina/caminho/recurso>. O protocolo poderá ser HTTP, FTP, entre outros. O campo “máquina” designa o servidor que disponibiliza o recurso designado. O “caminho” especifica o local onde se encontra o recurso dentro do servidor. No exemplo: <http://www.integralismo.org/textos/code_etica.html>, o protocolo é o HTTP, o servidor é designado por <www.integralismo.org>, o caminho especificado é a seção “textos” e o recurso, neste caso o “Código de Ética do Estudante”, elaborado por Plínio Salgado em 1947, encontra-se em “code_etica.html”.
32 Portal Periódicos CAPES, disponível em: <http://www.periodicos.capes.gov.br>. Acesso em junho de 2010.
33 Disponível em: <http://archive.timesonline.co.uk/tol/archive>. Acesso em setembro de 2010. Para ter acesso total ao conteúdo do Times Online, é necessário pagar um valor equivalente a U$ 8,95 (acesso por 1 dia); U$ 24,00 (acesso por 1 mês); ou U$ 129,95 (acesso por 1 ano).
34 Escaneada: processada por um scanner, equipamento que digitaliza documentos através de uma varredura ótica.
35 OCR: Optical Character Recognition, software que interpreta individualmente cada letra na versão impressa convertendo-a para um caractere codificado na versão digital. Dessa forma o texto do arquivo original é transformado em um texto codificado digitalmente. Este pode então ser indexado em um mecanismo de busca, pode ser copiado, colado, editado, etc.
36 German Propaganda Archive, disponível em: <http://www.calvin.edu/academic/cas/gpa>. Acesso em junho de2010.
37 A Summons to Comradeship, disponível em: <http://digital.lib.umn.edu/warposters/warpost.html>. Acesso em junho de 2010.
38 Fundação Biblioteca Nacional, disponível em: <http://www.bn.br>. Acesso em junho de 2010.
39 CPDOC, disponível em: <http://cpdoc.fgv.br>. Acesso em junho de 2010.
40 De acordo com Pierre Levy, "Na filosofia escolástica, é virtual o que existe em potência e não em ato. O virtual tende a atualizar-se, sem ter passado no entanto à concretização efetiva ou formal. A árvore está virtualmente presente na semente. Em termos rigorosamente filosóficos, o virtual não se opõe ao real mas ao atual: virtualidade e atualidade são apenas duas maneiras de ser diferentes. (...) Contrariamente ao possível, estático e já constituído, o virtual é como o complexo problemático, o nó de tendências ou de forças que acompanha uma situação, um acontecimento, um objeto ou uma entidade qualquer, e que chama um processo de resolução: a atualização." (LÉVY, 1996, pp. 15-16).
41 ICPSR, disponível em: <http://www.icpsr.umich.edu>. Acesso em junho de 2010.
42 U.S. National Archives and Record Administration, disponível em: <http://www.archives.gov>. Acesso em junho de 2010.
43 IBGE, disponível em: <http://www.ibge.gov.br>. Acesso em junho de 2010.
44 Charles Dollar afirma que “o meio tradicional de garantir que os registros permaneçam autênticos ou "não-adulterados" é a "custódia ininterrupta" em instalações especializadas” (DOLLAR, 1994, p. 9). Consideramos que as fontes primárias resultantes do trabalho de digitalização de documentação “tradicional” já existente (desde que realizado por instituições de pesquisa), bem como os dados disponíveis em sites de instituições do mesmo tipo, cumprem o verificador tradicional de autenticação, ou seja, a "custódia ininterrupta" em instalações especializadas.
45 Disponível em: <http://www.pnr.pt>. Acesso em agosto de 2010.
46 DURANTI, 1994, p. 3.
47 Charles Dollar aponta para duas possibilidades: “A primeira emprega o que se chama de uma arquitetura cliente-servidor segura, que bloqueia o acesso do usuário à base de dados ou aos arquivos eletrônicos. Em uma arquitetura cliente-servidor o usuário formula suas perguntas para a base de dados ou emite as instruções para a recuperação de um ou mais documentos eletrônicos em uma estação de trabalho. Essas instruções chegam ao servidor, o qual, depois da tradução adequada, as passa diretamente à base de dados. O sistema que gerencia a base de dados recebe e processa as perguntas e as instruções de recuperação, e os resultados são retornados ao servidor e daí ao usuário. Como em uma arquitetura cliente-servidor os documentos eletrônicos originais nunca são acessados diretamente pelos usuários, eletronicamente falando tem-se a custódia ininterrupta dos registros. A segunda ferramenta eletrônica é um "carimbo numerador" de duas fases para autenticar documentos digitalizados, atualmente em desenvolvimento na Bellcore, uma subsidiária da AT&T. A primeira fase é a criação de um resumo de 160 bits de um documento digitalizado (texto, imagem ou desenho) de qualquer tamanho, resumo que é apenso ao documento. Esse apêndice é chamado de "resumo unidirecional", porque não pode ser revertido para recriar o documento original. O segundo estágio desse processo de autenticação liga o resumo a um número matematicamente único de 160 bits, que é derivado do número único de identificação dos documentos digitalizados imediatamente anterior e posterior na fila do carimbo numerador. Essa ligação cria um “número carimbado" que não se repete para os números combinados de 160 bits, que é então apenso ao documento digitalizado em questão. Assim, um documento digitalizado "com número carimbado" fica indissoluvelmente ligado a outros documentos digitalizados igualmente "carimbados" em um determinado período. O receptor de um documento ou um pesquisador no ano 2093 poderia comprovar sua autenticidade usando uma chave de verificação publicada semanalmente no New York Times para gerar um segundo resumo do documento e compará-lo com o que está apenso ao documento eletrônico. Como a mudança de apenas um bit em um documento eletrônico modifica substancialmente os bits do resumo, os resumos dos documentos digitalizados "numerados pelo carimbo" poderiam ser indicadores poderosos de autenticidade.” (DOLLAR, 1994, p. 10).
48 Hackeado: invadido por um hacker (ou cracker), indivíduo que quebra o sistema de segurança de um site e altera seu conteúdo.
49 Ver: <http://www.theregister.co.uk/2008/09/01/neo_nazi_forum_hacked>. Acesso em maio de 2010.
50 A ferramenta WHOIS pode ser utilizada em: <https://registro.br/cgi-bin/whois>. Acesso em junho de 2010.
51 DOLLAR, 1994, p. 9.
52 TOCQUEVILLE, apud SIRINELLI, 1996, pp. 244-245.
53 DURANTI, 1994.
54 “…história digital é o processo através do qual historiadores são capazes de usar computadores para fazer história de formas impossíveis sem o computador. História digital é algo mais do que scanear artigos acadêmicos e coloca-los online ou publicar anotações de curso na web. História digital é a revolução na profissão histórica que mudará a maneira que a história é feita em todos os níveis de estudo e ensino e através das bibliotecas e bases de dados que os historiadores usam em seu trabalho diário. Ao incorporar o tremendo poder do computador às práticas e metodologias do historiador, o resultado deve ser uma história melhor. Embora a história digital seja importante para a operação e prática do fazer histórico, pouca atenção tem sido dedicada ao assunto pelos profissionais. Com computadores e especialmente a rede de computadores se tornando comuns nas últimas décadas (...) o potencial para historiadores utilizarem computadores e comentarem sobre sua utilidade para a profissão histórica é evidente. Exceto por uns poucos indivíduos que escrevem sobre a chamada revolução ou renascença na história através da computação, isto não está acontecendo como deveria.” (BURTON, 2005, p. 207).
55 As considerações metodológicas expostas no presente texto não tem a pretensão de esgotar o assunto, nem tampouco de constituir um “manual para o uso das fontes digitais”, mas antes funcionar como apresentação de algumas experiências práticas neste momento em que os historiadores buscam adaptação às novas tecnologias.


Fonte: ALMEIDA, Fábio Chang de. O historiador e as fontes digitais: uma visão acerca da internet como fonte primária para pesquisas históricas. Revista Aedos, n. 8, v. 3, janeiro-junho 2011, p. 9-30. 

Nenhum comentário: