Seguindo os passos da História: O historiador e as fontes digitais

O historiador e as fontes digitais: uma visão acerca da internet como fonte primária para pesquisas históricas

Fábio Chang de Almeida

A Internet3 configura-se como uma nova categoria de fontes documentais para pesquisas históricas. Em especial os pesquisadores do Tempo Presente, após o advento da Internet, passaram a contar com um aporte quase inesgotável de novas fontes. Contudo, já na segunda década do século XXI, ainda são poucas as pesquisas históricas que utilizam a Internet como fonte primária. Por que os historiadores ainda relutam em aproveitar a Rede como fonte de pesquisa, especialmente enquanto fonte primária para pesquisas históricas?

Uma primeira explicação para este comportamento é de caráter histórico. Durante séculos, a historiografia baseou suas regras de validação de fontes e metodologia de análise em um suporte documental específico: o papel. Para a Escola Metódica, dita Positivista, do final do século XIX, o historiador deveria trabalhar, sobretudo, com documentos oficiais. Estes documentos eram, em última análise, textos registrados em papel: atos governamentais, tratados internacionais, códigos de leis, etc. Outras formas de registro das atividades humanas eram desprezadas ou relegadas às chamadas “ciências auxiliares”, como a Arqueologia e a Numismática.

Mesmo atualmente, a grande maioria das fontes documentais consagradas no ofício do historiador ainda encontra sua materialidade no papel: correspondências, ofícios, requerimentos, atas, inventários, testamentos, processos, registros paroquiais, periódicos... Existe toda uma tradição historiográfica baseada nesse suporte específico. Até mesmo o estereótipo do historiador como “rato de arquivo” não dispensa a alegoria de um cenário de penumbra, onde um personagem com a postura arqueada e os óculos na ponta do nariz, analisa papéis amarelados em meio à poeira e ao mofo.

Entretanto, o “reinado do papel” começou a ruir com a concepção histórica difundida a partir da Escola dos Annales. O texto de Lucien Febvre citado a seguir pode ser considerado emblemático na defesa de uma ampliação na noção de documento. Para o autor, o conhecimento histórico deveria ser produzido utilizando-se uma ampla gama de fontes, relacionadas com uma variedade de manifestações do ser humano:

“A história faz-se com documentos escritos, sem dúvida. Quando estes existem. Mas pode fazer-se, deve fazer-se sem documentos escritos, quando não existem. Com tudo o que a habilidade do historiador lhe permite utilizar para fabricar o seu mel, na falta das flores habituais. Logo, com palavras. Signos. Paisagens e telhas. Com as formas do campo e das ervas daninhas. Com os eclipses da lua e a atrelagem dos cavalos de tiro. Com os exames de pedras feitos pelos geólogos e com as análises de metais feitas pelos químicos. Numa palavra, com tudo o que, pertencendo ao homem, depende do homem, serve o homem, exprime o homem, demonstra a presença, a atividade, os gostos e as maneiras de ser do homem. Toda uma parte, e sem dúvida a mais apaixonante do nosso trabalho de historiadores, não consistirá num esforço constante para fazer falar as coisas mudas, para fazê-las dizer o que elas por si próprias não dizem sobre os homens, sobre as sociedades que as produziram, e para constituir, finalmente, entre elas, aquela vasta rede de solidariedade e de entreajuda que supre a ausência do documento escrito?” (FEBVRE apud LE GOFF, 1992, p. 540).

As palavras do mestre francês, escritas na década de 1950, ajudam a entender a incorporação das fontes digitais no ofício dos historiadores, décadas depois. “Tudo o que, pertencendo ao homem, depende do homem, serve o homem, exprime o homem, demonstra a presença, a atividade, os gostos e as maneiras de ser do homem.” Especialmente no século XX, outras fontes passaram a figurar (sempre encontrando alguma resistência) no cotidiano do historiador. Contudo, a desconfiança em relação à incorporação de novas categorias documentais ainda é visível. No Brasil, a quantidade de pesquisas de mestrado e doutorado em História que utilizam as fontes digitais ainda está muito aquém do potencial oferecido por este suporte documental. Certamente tal resistência está relacionada, em parte, com a herança metodológica positivista que privilegiava os “papéis” oficiais.

Outra explicação para que a utilização das fontes digitais ainda seja ínfima diz respeito à ausência de uma ampla discussão teórico-metodológica acerca do assunto. Os primeiros trabalhos que utilizam documentos digitais são muito recentes e, de uma maneira geral, não realizam esta tarefa. Para que os historiadores aceitem definitivamente os documentos digitais enquanto fontes primárias, é necessária a sistematização teórica e metodológica que vai pautar esta prática. Isto só será concretizado quando houver um número significativo de pesquisas que utilizem fontes digitais. O método será construído analisando os erros e acertos efetuados nesse processo. Entretanto, a escassez de referenciais não pode justificar uma falta de preocupação com o método. Por exemplo, no artigo em que analisa sites dos Ministérios de Relações Exteriores de vários países, Denis Rolland (2004) não reservou nenhuma linha para reflexões metodológicas. O leitor não é informado sobre qual critério foi utilizado para selecionar os sites utilizados na pesquisa. Como foi analisado o material? De que forma foi preservado (supondo que tenha sido preservado) o seu conteúdo? O artigo não se preocupa em fornecer respostas para estas questões.

A palavra de ordem é adaptação. É compreensível que a historiografia não acompanhe imediatamente todas as evoluções tecnológicas da sociedade contemporânea. Todavia, tratando-se de informática, as evoluções são muito rápidas, os impactos sociais são extremamente significativos e a necessidade de adaptação torna-se mais urgente. A tecnologia atualiza-se a partir das demandas da sociedade (e do mercado), e simultaneamente a sociedade altera-se a partir das evoluções tecnológicas, em um processo dinâmico. Pierre Levy chama de “cibercultura” ao “conjunto de técnicas (materiais e intelectuais), de práticas, de atitudes, de modos de pensamento e de valores que se desenvolvem juntamente com o crescimento do ciberespaço.” (LÉVY, 1999-b, p. 17).

A historiografia não pode se isolar da realidade que pretende estudar. Especificamente a História do Tempo Presente (HTP) deve adaptar-se mais rapidamente às novas tecnologias da informação. Para a HTP, não se trata apenas de aproveitar as facilidades técnicas proporcionadas pelas fontes digitais. Para os historiadores que buscam compreender o presente, negligenciar as fontes digitais e a Internet significa fechar os olhos para todo um novo conjunto de práticas, de atitudes, de modos de pensamento e de valores que vêm se desenvolvendo juntamente com o crescimento e popularização da rede mundial de computadores.

A Internet vem crescendo significativamente desde os anos 1990. De acordo com os censos realizados sistematicamente pela empresa Netcraft5, o número total de hostnames na Internet era de aproximadamente 19 mil em 1995. Em 1997, o número atingiu um milhão de hostnames. Em 2000 eram 20 milhões; em 2003, 40 milhões; em 2005, 70 milhões; em 2006 alcançou-se a cifra de 100 milhões; em fevereiro de 2008 mais de 158 milhões; e em julho de 2010 foram contabilizados mais de 205 milhões de hostnames na Internet.6

Imagem 1: A linha superior representa o número de hostnames na Internet, de outubro de 1995 a julho de 2010.

A rede mundial de computadores tornou-se uma ferramenta de comunicação poderosa, devido à facilidade de acesso e à amplitude de cobertura da nova tecnologia. Um computador conectado à Internet é um eficiente instrumento para a troca de informações em escala global. Com a popularização em escala mundial, criou-se um novo espaço de sociabilidade: o ciberespaço. De acordo com Pierre Lévy, o ciberespaço engloba a infra-estrutura material da Internet, as informações disponíveis através dela e as pessoas que a mantém e a utilizam:

“O ciberespaço (...) é o novo meio de comunicação que surge da interconexão mundial dos computadores. O termo especifica não apenas a infra-estrutura material da comunicação digital, mas também o universo oceânico de informações que ela abriga, assim como os seres humanos que navegam e alimentam esse universo”. (LÈVY, 1999-b, p.17).

Lévy aponta uma característica essencial da Internet, que acaba por modificar a visão de mundo dos seus usuários: a aparente redução das distâncias. De certa maneira, o ciberespaço aboliu o território geográfico no âmbito das comunicações, tornando possível a circulação praticamente instantânea de informações em escala mundial:

“Um computador e uma conexão telefônica dão acesso a quase todas as informações do mundo, imediatamente ou recorrendo a redes de pessoas capazes de remeter a informação desejada. (...) Meditemos um instante sobre uma frase de Fernand Braudel: “Medida pela velocidade dos transportes da época, a Borgonha de Luís XI é várias centenas de vezes a França inteira de hoje.” (...) Cada dispositivo de transporte e de comunicação modifica o espaço prático, isto é, as proximidades efetivas”. (LÈVY, 1999-a, p. 199).

Na história da Internet, é possível identificar dois momentos importantes que alavancaram o crescimento da rede. Estes dois momentos estão relacionados com dois conceitos fundamentais: “web” e “web 2.0”. Em 1990, foi criada pelo inglês Tim Berners-Lee a World Wide Web (www, ou simplesmente web), um modelo de gerenciamento de arquivos que tornou-se padrão na Internet. A web baseia-se em uma interface gráfica que possibilita o acesso a dados variados de maneira simples. Antes dela, eram necessários complexos conhecimentos do sistema operacional UNIX para utilizar a Internet. Na segunda metade da década de 1990, com a interface da World Wide Web, a Internet popularizou-se, atingindo os usuários domésticos. A web é construída a partir do princípio de hipertexto. Este pode ser considerado como um documento digital composto por diferentes blocos de informações conectadas (ou lexias). A conexão entre os blocos de informações é realizada através de vínculos eletrônicos denominados links, que permitem o avanço para outras seções dentro do mesmo site, ou o redirecionamento para sites diferentes (LEÂO, 2001, pp. 15-16). O hipertexto maximizou o caráter rizomático8 da Internet:

“A construção da teia mundial envolve o trabalho de diversas mentes, distribuídas em diversas páginas. Seu crescimento e sua vitalidade não se encontram localizados em um ponto central e específico. Ao contrário, é no caráter de autogeração e autopoiésis que a Internet se desenvolve. Sem dúvida alguma, o que faz da Web uma teia, uma rede na qual uma complexa malha de informações se interligam, é a própria tecnologia hipertextual que permite os elos entre os pontos diversos. Cada página, cada site, traz em si o potencial de se intercomunicar com todos os outros pontos da rede. (...) de um ponto da rede pode-se alcançar outros, que também possibilitam outros”. (LEÂO, 2001, p. 24).

O outro momento importante para o crescimento da Internet ocorreu na primeira metade dos anos 2000. Em 2004 foi criado o termo “web 2.0” para caracterizar uma suposta segunda geração da world wide web. Há muita polêmica em torno do conceito de web 2.0, sendo que na realidade não existe uma definição aceita de maneira consensual. Na prática, a web 2.0 significou uma mudança de mentalidade dos desenvolvedores de sites da Internet. A partir da aplicação de conhecimentos técnicos preexistentes, passou-se a valorizar a interatividade entre os usuários e os sites. Com base nesta interatividade, os usuários passaram a colaborar de forma ativa com a melhoria das páginas, ou mesmo com a construção de novas páginas. Ferramentas mais simples para a criação de sites foram disponibilizadas, aumentando drasticamente o número de pessoas que se aventuram na construção de páginas na Internet. Conforme Ian Davis (2005), web 2.0 é uma atitude, não uma tecnologia, e diz respeito a possibilitar e encorajar a participação dos internautas através de aplicativos e serviços abertos.

Um bom exemplo das consequências desta “mudança de atitude” foi a popularização dos blogs.9 Um blog é um site da Internet atualizado com certa regularidade, onde as atualizações são dispostas em ordem cronológica inversa (iniciando pelas mais recentes). Inicialmente, a maioria dos blogs funcionava como “diários virtuais”, onde as pessoas escreviam sobre suas vidas pessoais. Segundo alguns pesquisadores da Internet, o primeiro blog foi criado por Tim Berners-Lee (o mesmo criador da web), em 1992. (EIRAS, 2007, p. 76).

O formato blog se popularizou a partir de 1999, e mais ainda com o advento da web 2.0. Os blogs passaram a abordar todo tipo de conteúdo e agora suas atualizações incluíam textos, imagens, vídeos, músicas, etc. Os blogs podem ser escritos por uma ou mais pessoas. Em geral possuem sistemas de comentários através dos quais os leitores podem interagir, deixando registradas suas opiniões acerca dos assuntos tratados. Não são necessários conhecimentos de programação para criar um blog. As diversas ferramentas disponíveis para a publicação de blogs (Blogger, Blogspot, Wordpress, Weblog, etc.) tornam extremamente fácil esta tarefa. Diversas instituições apostam nos blogs como uma ferramenta mais dinâmica, a complementar os sites tradicionais. A Presidência da República Federativa do Brasil é um exemplo de instituição que mantém um blog na Internet.

Como uma derivação do conceito blog, surgiu em 2006 uma ferramenta de uso ainda mais simples. O Twitter, chamado por alguns de microblog, possibilita aos seus usuários o envio e recebimento de mensagens curtas. Esta é a principal diferença entre o Twitter e os blogs tradicionais: no Twitter o tamanho das mensagens é limitado a 140 caracteres. A ferramenta tornou-se um sucesso mundial, não só entre usuários “domésticos”, mas também entre instituições. Por exemplo, a Presidência da República Portuguesa possui página no Twitter, assim como o Arquivo Público do Estado de São Paulo.

Outro produto derivado da web 2.0 é a enciclopédia de construção coletiva, cujo exemplo de maior sucesso é a Wikipedia. Criada em 2001, a proposta da Wikipedia é a de uma “enciclopédia livre”, construída por milhares de colaboradores em várias partes do mundo. O princípio de construção da Wikipedia baseia-se no conceito de “inteligência coletiva”. Conforme Pierre Lèvy, O que é inteligência coletiva? É uma inteligência distribuída por toda parte, constantemente avaliada, coordenada em tempo real, levando à mobilização efetiva das competências. Nós adicionamos à nossa definição essa ideia essencial: o fundamento e o objetivo da inteligência coletiva é o reconhecimento e o enriquecimento mútuo das pessoas, não o culto de comunidades fetichizadas ou hipostasiadas. (LÈVY, 2004, p. 20).

Contudo, o modelo ideal de Lèvy mostra-se utópico quando aplicado na prática do ciberespaço. A idéia de uma inteligência coletiva fundamentada no princípio do “enriquecimento múto” esbarra nos conflitos políticos e nos embates ideológicos característicos da sociedade humana, que naturalmente são reproduzidos nas comunidades “virtuais”. Inclusive, a popularidade do formato de “construção coletiva” fez com que surgissem enciclopédias eletrônicas com orientação ideológica voltada à extrema-direita. Usando formato semelhante ao inaugurado pela Wikipedia, podemos citar o exemplo a Metapedia, um site de extrema-direita de inspiração negacionista publicado em 16 idiomas, que aproveita os recursos disponibilizados pela web 2.0, onde os usuários podem editar o conteúdo dos verbetes.

Também deve ser incluída nesse contexto a expansão dos chamados “sites de relacionamento”, criados a partir de teorias de redes sociais, ou “social networking”. São exemplos desta categoria sites como o Friendster, Facebook, Orkut, Hi5, MySpace e o próprio Twitter. De maneira geral, estes sites possibilitam que os seus usuários criem um perfil onde divulgam informações pessoais, revelam interesses específicos, compartilham fotografias e vídeos, mandam e recebem mensagens, etc. Os usuários podem também criar redes de relacionamento com outras pessoas, além de construir ou participar de comunidades voltadas para um determinado assunto.

Outro fenômeno da Internet, relacionado com as mudanças advindas da web 2.0, são os sites de compartilhamento de imagens (image sharing), e compartilhamento de vídeos (video sharing).

Como exemplos do primeiro tipo temos o Flickr, o ImageShack, e o Panoramio. São exemplos do segundo tipo o Metacafe e o Dailymotion, mas sendo o caso de maior sucesso o do Youtube. Os sites de compartilhamento, em sua grande maioria, são gratuitos e permitem que seus usuários coloquem imagens ou vídeos na Internet para que sejam assistidos por um grupo restrito de pessoas (mediante a utilização de uma senha), ou em caráter público, sem nenhuma restrição. O Youtube acaba funcionando como uma plataforma de propaganda política. Por exemplo, o site é um grande sucesso entre os simpatizantes da extrema-direita de inspiração nazi-fascista. No Youtube é possível encontrar milhares de vídeos relacionados ao assunto, sendo muitos de apologia ideológica. Há vários canais no Youtube criados por usuários que se dedicam a colocar na Internet vídeos de caráter neofascista.

O advento da web 2.0 possibilitou a curva ascendente quase exponencial no número de hostnames na Internet a partir da segunda metade dos anos 2000, como é visível na Imagem 1. Em função dessa significativa ampliação do espectro de usuários que colaboram com a construção da Internet, fica evidente que os historiadores do tempo presente não podem negligenciar o potencial da rede como fonte de pesquisa. O caráter efêmero da Internet torna ainda mais importante a tomada de consciência dos historiadores perante esta nova categoria de fontes. Muitos sites são retirados do ar sem aviso prévio e seu conteúdo pode ser perdido, visto à sua inexistência em outro suporte. Dessa forma, o pesquisador do Tempo Presente tem acesso exclusivo a esse material, pois ele só é acessível em uma restrita janela temporal.

Como se estivesse em um trabalho de “arqueologia de salvamento”, o historiador torna-se responsável pela análise e também pela preservação da informação. Não fosse a sua intervenção, o documento poderia ser perdido em caráter definitivo.

Os documentos digitais têm como característica a dissociação entre o suporte físico e o seu conteúdo informacional. Sendo assim, é possível o descarte do suporte físico e a manutenção de seu conteúdo em um novo suporte. A evolução extremamente rápida da tecnologia informática torna os suportes físicos de informação obsoletos em um curto espaço de tempo. Em pouco tempo o disquete de 1,44 Mb de capacidade de armazenamento tornou-se obsoleto, sendo substituído pelo CD de 700 Mb (equivalente a 487 disquetes). Atualmente, a preservação pode ser realizada utilizando como suporte físico DVDs com 4,7 Gb de capacidade (equivalente a quase 7 CDs).

No caso das pesquisas históricas que utilizam fontes digitais, uma solução viável para a questão do armazenamento da documentação é o salvamento dos arquivos pesquisados em formato PDF, construindo assim um banco de dados digital. No caso de monografias, dissertações ou teses, uma cópia de tal banco de dados pode ser feita em DVD (ou em outro suporte mais atual) e anexada na versão final do trabalho.

Mas afinal de contas, o que é um documento digital? Para responder esta pergunta vale antes revisar a noção primordial de “documento”. Para os arquivistas, documento é o registro de uma informação, independente da natureza do suporte que a contém (PAES, 2004, p. 26). Tal noção é importante, pois quebra qualquer hipotética relação de dependência entre o documento e o suporte em papel. Mais do que isso, este conceito não relaciona o documento com qualquer suporte específico. A ênfase recai sobre o “registro de uma informação” e não sobre a espécie do suporte. Dessa forma, é afastado o “problema” da natureza digital das fontes eletrônicas. É possível ir além, buscando subsídios em uma área onde a questão dos documentos – inclusive os digitais – é central e bastante debatida: no Direito. Para os juristas, documento pode ser considerado como “qualquer base de conhecimento, fixada materialmente e disposta de maneira que se possa extrair cognição do que está registrado” (GICO JÚNIOR, 2001, p 98). De forma semelhante, pode-se dizer que na esfera do Direito:

“Documento é toda representação material destinada a reproduzir determinada manifestação do pensamento (...). Abarca o mais amplo espectro de sinais, sendo o mais comum deles a escrita. (...) É a coisa material na qual a atividade humana imprime vestígios ou sinais para efeito de comunicação de determinados conhecimentos. (...) Não importa sobre que tipo de material encontra-se o registro, mas a representação física do pensamento humano nele representado”. (GICO JÚNIOR, 2001, pp. 98-99).

Perceba-se que não buscamos a concepção jurídica de documento como “prova”, mas como “registro”. Utilizar o termo no sentido de “prova jurídica” significaria aproximar-se do conceito de “prova científica” almejado pela historiografia metódica. Não é esta a intenção deste trabalho ao resgatar as concepções da Arquivologia e do Direito. O objetivo é enfatizar que o documento é o registro da expressão da experiência humana, em suas mais variadas manifestações, independente de seu suporte material. Sendo assim, podemos considerar como “documento histórico” uma enorme variedade de registros da atividade humana: escritos dos mais variados tipos, logicamente, mas também música, arquitetura, palavra oral, pintura, escultura, teatro, fotografia, cinema, iconografia, vestuário, etc.

Dessa forma, e tentando construir um conceito o mais simples possível, podemos considerar que “documento digital” é aquele documento – de conteúdo tão variável quanto os registros da atividade humana possam permitir – codificado em sistema de dígitos binários, implicando na necessidade de uma máquina para intermediar o acesso às informações. Tal máquina é, na maioria das vezes, um computador.

Partindo desse conceito fundamental e através da experiência empírica, percebe-se a existência de dois tipos básicos de fontes digitais utilizáveis em uma pesquisa histórica: as fontes primárias e as “não-primárias”. Dentro destas duas categorias fundamentais é possível encontrar dois tipos de documentos: “não-primários” digitais, e primários digitais. Dentro deste último, outras duas subcategorias ainda podem ser identificadas: os “documentos primários digitais exclusivos” e os documentos primários digitalizados. Esta tipologia será explicada a seguir e está representada em forma de diagrama na Tabela 1.

O primeiro tipo de fontes digitais utilizáveis em uma pesquisa histórica diz respeito às fontes “não-primárias” digitais, que por sua vez correspondem aos documentos “não-primários” digitais. A Internet oferece uma quantidade imensa de informação combinada com uma facilidade de acesso inexistente há apenas quinze ou vinte anos atrás. Basta digitar uma URL para que o navegador nos transporte a um universo de textos e imagens sobre os mais diversos assuntos. Entretanto, muitos sites apresentam-se sob uma formatação aparentemente acadêmica, quando na verdade não representam o fruto de verdadeiro trabalho científico. Apesar de ser facilmente encontrado através de mecanismos de busca como o Google, grande parte do material existente na Internet não possui qualidade e contém erros grosseiros. Em outros casos, apesar de apresentarem-se como o trabalho de especialistas, os textos encontrados na rede refletem apenas a opinião altamente ideológica de seus autores. Isso quando é possível identificar os autores. Ao contrário de um livro ou uma revista impressa em papel, na Internet muitas vezes é mais difícil avaliar a autoria e procedência do material.

Tal característica implica na adoção de critérios cuidadosos para a seleção de fontes da Internet a serem utilizadas em uma pesquisa científica. É necessário perceber se o conteúdo de um determinado site corresponde a uma fonte integral, ou se foi retirado parcialmente de outra fonte. A precisão das informações contidas em um determinado site deve ser testada comparando-as com outras fontes. Também é importante observar se há alguma instituição acadêmica respaldando o site em questão. Nos últimos anos, as principais publicações científicas passaram a contar com edições eletrônicas. Papers, artigos, dissertações de mestrado ou teses de doutorado podem ser acessadas através da Internet. Por exemplo, no Brasil o portal de periódicos da CAPES disponibiliza o acesso a 15.475 revistas científicas nacionais e internacionais (em 2008 eram aproximadamente 11.500). O acesso dos pesquisadores a esta vasta quantidade de fontes secundárias foi significativamente facilitado pela Internet.

O segundo tipo de fontes digitais diz respeito àquelas que fornecem documentos primários. Estes, por sua vez, podem ser classificados em dois tipos básicos: os “documentos primários digitais exclusivos” e os “documentos primários digitalizados”. Os documentos digitalizados são aqueles resultantes do trabalho de digitalização da documentação “tradicional” já existente. Por exemplo, o jornal inglês The Times disponibiliza na Internet 200 anos de seu acervo (de 1785 a 1985). São cerca de 20 milhões de artigos e 35 milhões de imagens. Em um trabalho de enorme proporção, cada página dos jornais foi escaneada e processada por OCR.

Também são muitas as instituições acadêmicas de pesquisa que já possuem arquivos de documentos digitalizados acessíveis pela Internet: bibliotecas, arquivos, Universidades, centros de pesquisa, museus, fundações. Como exemplos é possível lembrar o German Propaganda Archive, da Calvin University, talvez o maior arquivo digital sobre propaganda nazista disponível na Internet. Outro exemplo importante é a coleção de pôsteres de guerra resultante da parceria entre a University of Minnesota e a Minneapolis Public Library. Entre 2001 e 2004, foram digitalizados mais de cinco mil pôsteres da I e II Guerras Mundiais, formando o maior acervo do mundo sobre o assunto acessível pela Internet. Também é possível citar a Biblioteca Digital, da Biblioteca Nacional; e o acervo digital do CPDOC; entre outros.

O segundo tipo de documentos primários digitais, os “digitais exclusivos”, engloba aqueles documentos que não possuem outro suporte além do digital. Trata-se de uma enorme quantidade de informação que está sendo produzida e disponibilizada unicamente em formato digital, sobretudo na Internet. Nesse caso, os dados referentes a tais documentos têm na rede o seu único meio de publicação e arquivamento. Dessa forma, a rede mundial de computadores propicia uma existência “virtual” para esta documentação.40 Por exemplo, nos dias de hoje muitas pessoas possuem diários virtuais publicados em blogs da Internet.

Contudo, os diários virtuais são voláteis e sua permanência na Internet (e nos discos rígidos dos servidores, onde encontram sua materialidade física) pode ser efêmera. Há muito tempo os historiadores valorizam os diários “tradicionais” como fontes para pesquisa. É chegado o momento de reconhecer o potencial de documentos semelhantes, porém publicados em um formato novo. Os diários virtuais representam apenas um, entre os diversos documentos históricos produzidos exclusivamente na Internet.

É importante perceber que os dois tipos de documentos primários citados anteriormente podem ser considerados digitais, pois utilizam a codificação em dígitos binários. Contudo, os documentos “digitalizados” constituem um tipo específico por possuírem obrigatoriamente um suporte material anterior à digitalização: na maioria das vezes, o papel, porém não necessariamente este. A outra categoria (documentos primários digitais exclusivos), não possui outro suporte material além do digital.

Tabela 1: Os tipos de fontes e documentos digitais utilizáveis pelo historiador.

De maneira geral, a abundância é uma característica que chama a atenção quando se fala em “informação digital”. Quando a responsabilidade sobre a publicação das informações digitais recai sobre instituições de pesquisa, é provável que haja uma equipe de profissionais a revisar e avalizar a autenticidade de tais informações. Normalmente, as instituições publicam relatórios impressos que “referendam” as informações disponibilizadas nos sites da Internet. Como exemplo, podemos citar o Inter-University Consortium for Political and Social Research, da Universidade de Michigan, o Center for Electronic Records do Arquivo Nacional dos Estados Unidos da América e o Instituto Brasileiro de Geografia e Estatística.

Todavia, há uma vasta quantidade de informações disponíveis através da Internet, sem nenhuma relação com instituições que possam responsabilizar-se pela autenticidade das mesmas. Nesse conjunto entram blogs, fóruns eletrônicos, e-mails e uma série de outros meios digitais. Em primeiro lugar, um questionamento fundamental precisa ser respondido: as informações contidas em uma página da Internet sem relação com instituições de pesquisa podem ser tomadas como fonte de estudo? A resposta para esta pergunta não pode ser outra: sem dúvida! Elas podem e devem ser utilizadas, pois em caso contrário se estaria correndo o risco de negligenciar um período importante da História do Tempo Presente. Contudo, para utilizar tal documentação, faz-se necessário um maior rigor em relação ao método historiográfico, além da utilização de alguns procedimentos metodológicos específicos.

Um cuidado fundamental a ser tomado diz respeito ao inter-relacionamento da documentação. É importante demonstrar, quando for o caso, que a documentação utilizada possui certa relação entre si. Também é interessante salientar as aproximações temáticas e ideológicas da documentação, que se manifestam através de citações e convergências discursivas. Uma forma de interligação particular das fontes oriundas da Internet é feita através dos links. As páginas podem apresentar atalhos para outros sites, o que demonstra algum tipo de afinidade entre os conteúdos dos mesmos. Por exemplo, e de forma simplificada, o site oficial do Partido Renovador Nacional (PNR), organização de extrema-direita de Portugal, apresenta links para o twitter e para o blog do partido.

Portanto, é perfeitamente razoável supor que tais páginas sejam realmente ligadas à instituição. Por outro lado, blogs ou twitters que porventura se afirmem como representativos do PNR, mas que não estejam linkados no site oficial do partido devem ser analisados, inicialmente, com desconfiança. É fundamental registrar tais aproximações tendo em vista que o inter-relacionamento das fontes pode funcionar como um indicador da confiabilidade das mesmas. De acordo com Luciana Duranti, o inter-relacionamento da documentação:

“...é devido ao fato de que os documentos estabelecem relações no decorrer do andamento das transações e de acordo com suas necessidades. Cada documento está intimamente relacionado "com outros tanto dentro quanto fora do grupo no qual está preservado e (...) seu significado depende dessas relações". As relações entre os documentos, e entre eles e as transações das quais são resultantes, estabelecem o axioma de que um único documento não pode se constituir em testemunho suficiente do curso de fatos e atos passados: os documentos são interdependentes no que toca a seu significado e sua capacidade comprobatória. Em outras palavras, os documentos estão ligados entre si por um elo que é criado no momento em que são produzidos ou recebidos, que é determinado pela razão de sua produção e que é necessário à sua própria existência, à sua capacidade de cumprir seu objetivo, ao seu significado, confiabilidade e autenticidade. Na verdade, os registros documentais são um conjunto indivisível de relações intelectuais permanentes tanto quanto de documentos”.

Trabalhar sob uma incerteza calculada não é novidade para o historiador, pois os métodos históricos não são totalmente precisos. As fontes “tradicionais” não são mais confiáveis do que as fontes digitais. Um documento impresso pode ser falso. Uma fotografia antiga pode ser fraudulenta. Um depoimento oral pode modificar os fatos. É normal para os historiadores trabalhar dentro de campos de possibilidades, utilizando métodos para reduzir as chances de erro. No futuro, é possível que sejam criados mecanismos mais precisos para verificar a autenticidade das fontes digitais. Contudo, enquanto tais procedimentos não se tornarem operacionais, a habilidade e a experiência do pesquisador continuarão determinantes na seleção das fontes mais confiáveis.

Outro procedimento especial a ser adotado na análise das fontes oriundas da Internet deve estar relacionado à preocupação com o cruzamento de dados. Tais fontes podem ser altamente ideológicas, sendo necessária a crítica cuidadosa de suas informações. Uma forma de fazer isso é cruzar seus dados com outras fontes disponíveis. Por exemplo, se o historiador estiver estudando sites de partidos políticos, torna-se interessante utilizar também periódicos de diferentes orientações ideológicas para confrontar determinadas informações.

Ao utilizar documentação “convencional” (cartas, jornais, inventários, fotografias, etc.) sob a guarda de instituições de pesquisa, museus ou arquivos, algumas vezes é possível que o historiador não se preocupe em verificar sua autenticidade. Isto porque, em alguns casos, supõe-se que tais documentos já tenham passado pela avaliação de outros profissionais que em algum momento atestaram sua autenticidade. Todavia, ao se deparar com documentos inéditos, faz-se necessário o exame criterioso para verificar sua confiabilidade. Uma fotografia pode ser falsificada ou uma carta pode ser forjada e existem métodos que possibilitam identificar tais falsificações. Ao utilizar sites da Internet como fonte primária o historiador irá, provavelmente, ser a primeira pessoa a preocupar-se em verificar sua autenticidade. Isso faz com que aumentem as chances de se deparar com algum tipo de falsificação. Por isso, ao trabalhar com fontes da Internet, a atenção deve ser redobrada. O historiador precisa utilizar a técnica e desenvolver a habilidade necessária para selecionar o material confiável.

Por exemplo, um site pode ser hackeado e as informações ali publicadas originalmente podem ser alteradas sem o conhecimento dos seus autores. Por exemplo, em agosto de 2008, hackers do grupo antifascista AFA (Antifašistická Akce) conseguiram invadir o fórum eletrônico da organização neonazista Blood & Honour e alterar o conteúdo original das páginas.

Imagem 2: Este banner deixado pelos hackers da AFA substituiu o conteúdo original do fórum da Blood & Honour.

Outro tipo de falsificação às quais as fontes da Internet estão sujeitas, diz respeito a falsos sites, ou fake sites. Normalmente os fake sites são construídos com o propósito de aplicar golpes eletrônicos pela Internet. Os estelionatários criam cópias dos sites de empresas, instituições bancárias ou governamentais e atraem os usuários até elas para roubarem-lhes informações como número de cartões de crédito ou senhas bancárias. Também são comuns as falsificações de sites de relacionamento, como o Orkut, Facebook, My Space e Twitter. Há a possibilidade teórica da criação de um fake site em qualquer área do conhecimento.

Tomar um fake site como sendo um site verdadeiro seria um erro grosseiro, portanto o historiador deve estar atento a esta possível prática na hora de selecionar suas fontes. Existem procedimentos básicos que devem ser adotados para minimizar a possibilidade de que sejam cometidos enganos dessa natureza. Nesse sentido, a utilização da ferramenta WHOIS mostrou-se efetiva em alguns casos. WHOIS é um protocolo específico para consultar informações de contato e domínio sobre entidades da Internet. As entidades podem ser um nome de domínio, um endereço IP ou um AS (Sistema Autônomo). O protocolo WHOIS apresenta três tipos de contatos para uma entidade: Contato Administrativo (Admin Contact), Contato Técnico (Technical Contact) e Contato de Cobrança (Registrant Contact). Estes contatos são informações de responsabilidade do provedor de Internet.

O historiador deve adquirir familiaridade com a documentação, a fim de conhecer os símbolos, os códigos, os detalhes que envolvem os documentos autênticos. Ao obter esta habilidade, a existência de desvios no padrão torna-se visível para o pesquisador atento. Trabalhar quantitativamente também pode ser um procedimento metodológico interessante, principalmente quando se estiver trabalhando com documentos anônimos ou cuja autenticidade seja de difícil comprovação. Dessa forma, se for obtido um corpus significativo de dados, é possível identificar uma coerência discursiva que remete a um modelo padrão.

Todos os desvios relevantes dentro do padrão identificado devem ser analisados com mais detalhes, para precisar sua procedência e minimizar a possibilidade de erros. É necessário que o historiador adquira certa “intimidade” com a documentação, a fim de perceber os afastamentos da regularidade. Com a experiência, os desvios acabam “saltando aos olhos” do historiador. Trata-se de trabalhar dentro de um espectro admissível de erro. Como afirma Charles Dollar:

“Os estudiosos e pesquisadores que utilizam algum material como fonte primária em sua pesquisa partem, em geral, do pressuposto de que tal material é confiável e fidedigno. Trata-se de uma "autenticidade presuntiva", porque a maior parte do material considerado fonte primária - registros para os arquivistas - não passa de um subproduto de transações rotineiras exigidas para se levar a cabo uma ação (legal, financeira ou comercial), e esses subprodutos acabam formando um corpus de materiais relacionados entre si. A presença de um documento em um corpus constituído de tipos semelhantes de material, que se sabe ou se acredita terem sido produzidos de acordo com procedimentos-padrão, acarreta uma presunção de fidedignidade e autenticidade. Por conseguinte, tanto o contexto quanto o conteúdo dos documentos dão testemunho da fidedignidade e da autenticidade”.

É importante salientar o amplo espectro de documentação proporcionado pela Internet, especialmente para os historiadores do Tempo Presente. Em alguns casos, esta abundância pode chegar ao extremo. Mais do que facilitar o trabalho do historiador, a grande quantidade de fontes constitui um obstáculo perigoso. O impulso em buscar expandir a análise pode levar o pesquisador a um labirinto de fontes, onde seria difícil encontrar a saída no tempo disponível. A situação seria semelhante à metáfora usada por Aléxis de Tocqueville, onde o historiador é comparado com um minerador sobre o qual a mina desaba, deixando-o sem saber como sair dali carregando o tesouro. Dessa forma, é necessário selecionar os documentos mais relevantes para uma análise qualitativa, dentro do universo bem maior de fontes que entram na análise quantitativa.

O impacto das novas tecnologias da informação sobre a atividade dos pesquisadores em Ciências Humanas ainda não foi totalmente assimilado. As novas tecnologias causaram alterações na maneira de lidar com a documentação. Atualmente, os profissionais que trabalham em arquivos ainda estão em fase de adaptação a esse novo contexto:

“Com a proliferação dos sistemas eletrônicos de informação, esse mundo físico bem-arrumado dos arquivos desapareceu, tanto quanto assinaturas e selos, pastas e caixas, maços e dossiês, e a mais sagrada das entidades, a proveniência física e a ordem física original. Além disso, os sistemas eletrônicos de informação estão gerando uma realidade documental tão distinta daquela com que os arquivistas estão familiarizados que é muito difícil para eles acreditar que exista de todo uma realidade documental”.

Em 2005, Orville Burton classificava este novo panorama no ofício do historiador como “revolucionário”, referindo-se a ele como uma “História Digital”. Algumas das vantagens de uma “História Digital” estão relacionadas com seu potencial para o armazenamento de dados, a sua facilidade de acesso, a flexibilidade de formatos (textos, imagens, vídeo, áudio,...), e a interatividade entre o usuário e as fontes, facilitada pelo princípio do hipertexto e pela web 2.0.

Todavia, o otimismo demonstrado por Burton cinco anos atrás não levava em consideração o fato de que História Digital também tem suas desvantagens: a falta de qualidade de grande parte do material disponível na Internet, o caráter volátil da documentação, a necessidade de atualização técnica constante do pesquisador, a possibilidade de cobrança para o acesso às fontes, a necessidade de avaliação da autenticidade da documentação (embora estas últimas não sejam exigências apenas da História Digital).

Tais características implicam na necessidade de uma metodologia específica para a lida com a documentação digital. Contudo, ao contrário do que parece afirmar Orville Burton, acreditamos que a “História Digital” não implica em uma revolução metodológica. Ela necessita, sem dúvida, de uma metodologia particular, porém fundamentada nos princípios básicos já consagrados da pesquisa historiográfica, apenas adaptados ao formato digital.

Referências Bibliográficas

ALMEIDA, Fábio Chang de. A serpente na rede: extrema-direita, neofascismo e internet na Argentina. Dissertação de Mestrado. Universidade Federal do Rio Grande do Sul. Instituto de Filosofia e Ciências Humanas, Programa de Pós-Graduação em História. Porto Alegre: 2008.

ALMEIDA, Fábio Chang de. Neofascismo: uma abordagem histórica. In: GONÇALVES, Leandro Pereira; PARADA, Maurício B. Alvarez; SILVA, Giselda Brito (orgs.). Histórias da Política Autoritária: Integralismos, Nacional-Sindicalismo, Nazismo e Fascismos. Recife: Editora da UFRPE, 2010.

BURTON, Orville Vernon. American Digital History. In: Social Science Computer Review, v. 23, n. 2. Social Science Computing Association - North Carolina State University, 2005, p. 207.

CALDEIRA NETO, Odilon. Breves reflexões sobre o uso da Internet em pesquisas historiográficas. Revista Eletrônica Boletim do TEMPO, Ano 4, n. 20, Rio de Janeiro, 2009.

COHEN, Daniel J; ROSENZWEIG, Roy. Digital History: a guide to gathering, preserving, and presenting the past on the web.

DAVIS, Ian. Talis, Web 2.0 and all that. 4 de julho de 2005.

DELEUZE, Gilles. GUATTARI, Félix. Mil platôs: capitalismo e esquizofrenia. Vol. 1. Rio de Janeiro: Editora 34, 1995.

DOLLAR, Charles. Tecnologias da informação digitalizada e pesquisa acadêmica nas ciências sociais e humanas: o papel da arquivologia. In: Estudos Históricos, vol. 7, n. 13. Rio de Janeiro: FGV, 1994.

DURANTI, Luciana. Registros documentais contemporâneos como provas de ação. In: Estudos Históricos, vol. 7, n. 13. Rio de Janeiro: FGV, 1994.

EIRAS, Bruno Duarte. Blogs: mais que uma tecnologia, uma atitude. Cadernos de biblioteconomia arquivística e documentação, n. 1. Associação Portuguesa de Bibliotecários, Arquivistas e Documentalistas. Lisboa, 2007.

GICO JÚNIOR, Ivo Teixeira. O documento eletrônico como meio de prova no Brasil. In: BAPTISTA, Luiz Olavo. (coord.) Novas fronteiras do Direito na informática e telemática. São Paulo: Saraiva, 2001.

KUROSE, James F.; ROSS, Keith W. Computer networking: a top-down approach featuring the Internet. 3. ed. Boston: Pearson/Addison Wesley, 2005.

LEÃO, Lucia. O labirinto da hipermídia: Arquitetura e navegação no ciberespaço. São Paulo: FAPESP/Iluminuras, 2001.

LE GOFF, Jacques. História e memória. São Paulo: Editora da UNESP, 1992.

LÉVY, Pierre. A revolução contemporânea em matéria de comunicação. In: Para navegar no século XXI: tecnologias do imaginário e cibercultura. MARTINS, Francisco Menezes; SILVA, Juremir Machado da. Porto Alegre: Sulina/EDIPUCRS, 1999-a.

LÉVY, Pierre. Cibercultura. São Paulo: Editora 34, 1999-b.

LÉVY, Pierre. Inteligência colectiva: por una antropologia del ciberespacio. Washington, 2004.

PAES, Marilena Leite. Arquivo: teoria e prática. 3. ed. Rio de Janeiro: Fundação Getúlio Vargas, 2004.

PAES, Marilena Leite. O que é o virtual? São Paulo: Editora 34, 1996.

ROLLAND, Denis. Internet e história do tempo presente: estratégias de memória e mitologias políticas. Revista Tempo, n. 16, vol. 8. Rio de Janeiro: UFF, 2004.

SIRINELLI, Jean-François. Os intelectuais. In. REMOND, René (org.) Por uma história política. Rio de janeiro: UFRJ/FGV, 1996.

TRAVERSO, Enzo. La singularidad de Auschwitz - hipótesis, problemas y derivaciones de la investigación histórica. Buenos Aires: Revista Nuestra Memória, n. 22, 2003.

Fonte: ALMEIDA, Fábio Chang de. O historiador e as fontes digitais: uma visão acerca da internet como fonte primária para pesquisas históricas. Revista Aedos, n. 8, v. 3, janeiro-junho 2011, p. 9-30.

domingo, 9 de outubro de 2016

O historiador e as fontes digitais

Nenhum comentário:

Postar um comentário