O historiador e as fontes digitais: uma visão acerca da internet como fonte primária para pesquisas históricas
Fábio Chang de Almeida
A Internet3 configura-se como uma nova
categoria de fontes documentais para pesquisas históricas. Em especial os
pesquisadores do Tempo Presente, após o advento da Internet, passaram a contar
com um aporte quase inesgotável de novas fontes. Contudo, já na segunda década
do século XXI, ainda são poucas as pesquisas históricas que utilizam a Internet
como fonte primária. Por que os historiadores ainda relutam em aproveitar a
Rede como fonte de pesquisa, especialmente enquanto fonte primária para
pesquisas históricas?
Uma
primeira explicação para este comportamento é de caráter histórico. Durante
séculos, a historiografia baseou suas regras de validação de fontes e
metodologia de análise em um suporte documental específico: o papel. Para a
Escola Metódica, dita Positivista, do final do século XIX, o historiador
deveria trabalhar, sobretudo, com documentos oficiais. Estes documentos eram,
em última análise, textos registrados em papel: atos governamentais, tratados
internacionais, códigos de leis, etc. Outras formas de registro das atividades
humanas eram desprezadas ou relegadas às chamadas “ciências auxiliares”, como a
Arqueologia e a Numismática.
Mesmo
atualmente, a grande maioria das fontes documentais consagradas no ofício do
historiador ainda encontra sua materialidade no papel: correspondências,
ofícios, requerimentos, atas, inventários, testamentos, processos, registros
paroquiais, periódicos... Existe toda uma tradição historiográfica baseada
nesse suporte específico. Até mesmo o estereótipo do historiador como “rato de
arquivo” não dispensa a alegoria de um cenário de penumbra, onde um personagem
com a postura arqueada e os óculos na ponta do nariz, analisa papéis amarelados
em meio à poeira e ao mofo.
Entretanto, o “reinado do papel”
começou a ruir com a concepção histórica difundida a partir da Escola dos
Annales. O texto de Lucien Febvre citado a seguir pode ser considerado
emblemático na defesa de uma ampliação na noção de documento. Para o autor, o
conhecimento histórico deveria ser produzido utilizando-se uma ampla gama de
fontes, relacionadas com uma variedade de manifestações do ser humano:
“A história faz-se com documentos
escritos, sem dúvida. Quando estes existem. Mas pode fazer-se, deve fazer-se
sem documentos escritos, quando não existem. Com tudo o que a habilidade do
historiador lhe permite utilizar para fabricar o seu mel, na falta das flores
habituais. Logo, com palavras. Signos. Paisagens e telhas. Com as formas do
campo e das ervas daninhas. Com os eclipses da lua e a atrelagem dos cavalos de
tiro. Com os exames de pedras feitos pelos geólogos e com as análises de metais
feitas pelos químicos. Numa palavra, com tudo o que, pertencendo ao homem,
depende do homem, serve o homem, exprime o homem, demonstra a presença, a
atividade, os gostos e as maneiras de ser do homem. Toda uma parte, e sem
dúvida a mais apaixonante do nosso trabalho de historiadores, não consistirá
num esforço constante para fazer falar as coisas mudas, para fazê-las dizer o
que elas por si próprias não dizem sobre os homens, sobre as sociedades que as
produziram, e para constituir, finalmente, entre elas, aquela vasta rede de
solidariedade e de entreajuda que supre a ausência do documento escrito?”
(FEBVRE apud LE GOFF, 1992, p. 540).
As palavras do mestre francês, escritas
na década de 1950, ajudam a entender a incorporação das fontes digitais no
ofício dos historiadores, décadas depois. “Tudo o que, pertencendo ao homem,
depende do homem, serve o homem, exprime o homem, demonstra a presença, a
atividade, os gostos e as maneiras de ser do homem.” Especialmente no
século XX, outras fontes passaram a figurar (sempre encontrando alguma
resistência) no cotidiano do historiador. Contudo, a desconfiança em relação à
incorporação de novas categorias documentais ainda é visível. No Brasil, a
quantidade de pesquisas de mestrado e doutorado em História que utilizam as
fontes digitais ainda está muito aquém do potencial oferecido por este suporte
documental. Certamente tal resistência está relacionada, em parte, com a
herança metodológica positivista que privilegiava os “papéis” oficiais.
Outra explicação para que a utilização
das fontes digitais ainda seja ínfima diz respeito à ausência de uma ampla
discussão teórico-metodológica acerca do assunto. Os primeiros trabalhos que utilizam
documentos digitais são muito recentes e, de uma maneira geral, não realizam
esta tarefa. Para que os historiadores aceitem definitivamente os documentos
digitais enquanto fontes primárias, é necessária a sistematização teórica e
metodológica que vai pautar esta prática. Isto só será concretizado quando
houver um número significativo de pesquisas que utilizem fontes digitais. O
método será construído analisando os erros e acertos efetuados nesse processo.
Entretanto, a escassez de referenciais não pode justificar uma falta de
preocupação com o método. Por exemplo, no artigo em que analisa sites dos
Ministérios de Relações Exteriores de vários países, Denis Rolland (2004) não
reservou nenhuma linha para reflexões metodológicas. O leitor não é informado
sobre qual critério foi utilizado para selecionar os sites utilizados na
pesquisa. Como foi analisado o material? De que forma foi preservado (supondo
que tenha sido preservado) o seu conteúdo? O artigo não se preocupa em fornecer
respostas para estas questões.
A palavra de ordem é adaptação. É
compreensível que a historiografia não acompanhe imediatamente todas as
evoluções tecnológicas da sociedade contemporânea. Todavia, tratando-se de
informática, as evoluções são muito rápidas, os impactos sociais são
extremamente significativos e a necessidade de adaptação torna-se mais urgente.
A tecnologia atualiza-se a partir das demandas da sociedade (e do mercado), e
simultaneamente a sociedade altera-se a partir das evoluções tecnológicas, em
um processo dinâmico. Pierre Levy chama de “cibercultura” ao “conjunto de
técnicas (materiais e intelectuais), de práticas, de atitudes, de modos de
pensamento e de valores que se desenvolvem juntamente com o crescimento do
ciberespaço.” (LÉVY, 1999-b, p. 17).
A historiografia não pode se isolar da
realidade que pretende estudar. Especificamente a História do Tempo Presente
(HTP) deve adaptar-se mais rapidamente às novas tecnologias da informação. Para
a HTP, não se trata apenas de aproveitar as facilidades técnicas proporcionadas
pelas fontes digitais. Para os historiadores que buscam compreender o presente,
negligenciar as fontes digitais e a Internet significa fechar os olhos para
todo um novo conjunto de práticas, de atitudes, de modos de pensamento e de
valores que vêm se desenvolvendo juntamente com o crescimento e popularização
da rede mundial de computadores.
A Internet vem crescendo
significativamente desde os anos 1990. De acordo com os censos realizados
sistematicamente pela empresa Netcraft5, o número total de hostnames na
Internet era de aproximadamente 19 mil em 1995. Em 1997, o número atingiu um
milhão de hostnames. Em 2000 eram 20 milhões; em 2003, 40 milhões; em
2005, 70 milhões; em 2006 alcançou-se a cifra de 100 milhões; em fevereiro de
2008 mais de 158 milhões; e em julho de 2010 foram contabilizados mais de 205
milhões de hostnames na Internet.6
Imagem 1: A linha superior representa o número de hostnames na Internet, de outubro de 1995 a julho de 2010. |
A rede mundial de computadores
tornou-se uma ferramenta de comunicação poderosa, devido à facilidade de acesso
e à amplitude de cobertura da nova tecnologia. Um computador conectado à
Internet é um eficiente instrumento para a troca de informações em escala
global. Com a popularização em escala mundial, criou-se um novo espaço de
sociabilidade: o ciberespaço. De acordo com Pierre Lévy, o ciberespaço engloba
a infra-estrutura material da Internet, as informações disponíveis através dela
e as pessoas que a mantém e a utilizam:
“O ciberespaço (...) é o novo meio de
comunicação que surge da interconexão mundial dos computadores. O termo
especifica não apenas a infra-estrutura material da comunicação digital, mas
também o universo oceânico de informações que ela abriga, assim como os seres
humanos que navegam e alimentam esse universo”. (LÈVY, 1999-b, p.17).
Lévy
aponta uma característica essencial da Internet, que acaba por modificar a
visão de mundo dos seus usuários: a aparente redução das distâncias. De certa
maneira, o ciberespaço aboliu o território geográfico no âmbito das
comunicações, tornando possível a circulação praticamente instantânea de
informações em escala mundial:
“Um
computador e uma conexão telefônica dão acesso a quase todas as informações do
mundo, imediatamente ou recorrendo a redes de pessoas capazes de remeter a
informação desejada. (...) Meditemos um instante sobre uma frase de Fernand
Braudel: “Medida pela velocidade dos transportes da época, a Borgonha de Luís
XI é várias centenas de vezes a França inteira de hoje.” (...) Cada dispositivo
de transporte e de comunicação modifica o espaço prático, isto é, as
proximidades efetivas”. (LÈVY, 1999-a, p. 199).
Na história da Internet, é possível
identificar dois momentos importantes que alavancaram o crescimento da rede.
Estes dois momentos estão relacionados com dois conceitos fundamentais: “web” e
“web 2.0”. Em 1990, foi criada pelo inglês Tim Berners-Lee a World Wide Web (www,
ou simplesmente web), um modelo de gerenciamento de arquivos que
tornou-se padrão na Internet. A web baseia-se em uma interface gráfica
que possibilita o acesso a dados variados de maneira simples. Antes dela, eram
necessários complexos conhecimentos do sistema operacional UNIX para utilizar a
Internet. Na segunda metade da década de 1990, com a interface da World Wide
Web, a Internet popularizou-se, atingindo os usuários domésticos. A web é
construída a partir do princípio de hipertexto. Este pode ser considerado como
um documento digital composto por diferentes blocos de informações conectadas
(ou lexias). A conexão entre os blocos de informações é realizada
através de vínculos eletrônicos denominados links, que permitem o
avanço para outras seções dentro do mesmo site, ou o redirecionamento
para sites diferentes (LEÂO, 2001, pp. 15-16). O hipertexto maximizou o
caráter rizomático8 da Internet:
“A construção da teia mundial envolve o
trabalho de diversas mentes, distribuídas em diversas páginas. Seu crescimento
e sua vitalidade não se encontram localizados em um ponto central e específico.
Ao contrário, é no caráter de autogeração e autopoiésis que a Internet se
desenvolve. Sem dúvida alguma, o que faz da Web uma teia, uma rede na qual uma
complexa malha de informações se interligam, é a própria tecnologia
hipertextual que permite os elos entre os pontos diversos. Cada página, cada
site, traz em si o potencial de se intercomunicar com todos os outros pontos da
rede. (...) de um ponto da rede pode-se alcançar outros, que também
possibilitam outros”. (LEÂO, 2001, p. 24).
O outro momento importante para o
crescimento da Internet ocorreu na primeira metade dos anos 2000. Em 2004 foi
criado o termo “web 2.0” para caracterizar uma suposta segunda geração da world
wide web. Há muita polêmica em torno do conceito de web 2.0, sendo que na
realidade não existe uma definição aceita de maneira consensual. Na prática, a
web 2.0 significou uma mudança de mentalidade dos desenvolvedores de sites da
Internet. A partir da aplicação de conhecimentos técnicos preexistentes,
passou-se a valorizar a interatividade entre os usuários e os sites. Com
base nesta interatividade, os usuários passaram a colaborar de forma ativa com
a melhoria das páginas, ou mesmo com a construção de novas páginas. Ferramentas
mais simples para a criação de sites foram disponibilizadas, aumentando
drasticamente o número de pessoas que se aventuram na construção de páginas na
Internet. Conforme Ian Davis (2005), web 2.0 é uma atitude, não uma tecnologia,
e diz respeito a possibilitar e encorajar a participação dos internautas
através de aplicativos e serviços abertos.
Um bom exemplo das consequências desta
“mudança de atitude” foi a popularização dos blogs.9 Um blog é um
site da Internet atualizado com certa regularidade, onde as atualizações
são dispostas em ordem cronológica inversa (iniciando pelas mais recentes).
Inicialmente, a maioria dos blogs funcionava como “diários virtuais”,
onde as pessoas escreviam sobre suas vidas pessoais. Segundo alguns
pesquisadores da Internet, o primeiro blog foi criado por Tim
Berners-Lee (o mesmo criador da web), em 1992. (EIRAS, 2007, p. 76).
O formato blog se popularizou a
partir de 1999, e mais ainda com o advento da web 2.0. Os blogs passaram
a abordar todo tipo de conteúdo e agora suas atualizações incluíam textos,
imagens, vídeos, músicas, etc. Os blogs podem ser escritos por uma ou
mais pessoas. Em geral possuem sistemas de comentários através dos quais os
leitores podem interagir, deixando registradas suas opiniões acerca dos
assuntos tratados. Não são necessários conhecimentos de programação para criar
um blog. As diversas ferramentas disponíveis para a publicação de blogs
(Blogger, Blogspot, Wordpress, Weblog, etc.) tornam
extremamente fácil esta tarefa. Diversas instituições apostam nos blogs como
uma ferramenta mais dinâmica, a complementar os sites tradicionais. A
Presidência da República Federativa do Brasil é um exemplo de instituição que
mantém um blog na Internet.
Como uma derivação do conceito blog,
surgiu em 2006 uma ferramenta de uso ainda mais simples. O Twitter,
chamado por alguns de microblog, possibilita aos seus usuários o envio e
recebimento de mensagens curtas. Esta é a principal diferença entre o Twitter
e os blogs tradicionais: no Twitter o tamanho das mensagens é
limitado a 140 caracteres. A ferramenta tornou-se um sucesso mundial, não só
entre usuários “domésticos”, mas também entre instituições. Por exemplo, a
Presidência da República Portuguesa possui página no Twitter, assim
como o Arquivo Público do Estado de São Paulo.
Outro produto derivado da web 2.0 é a
enciclopédia de construção coletiva, cujo exemplo de maior sucesso é a
Wikipedia. Criada em 2001, a proposta da Wikipedia é a de uma “enciclopédia
livre”, construída por milhares de colaboradores em várias partes do mundo. O
princípio de construção da Wikipedia baseia-se no conceito de “inteligência
coletiva”. Conforme Pierre Lèvy, O que é inteligência coletiva? É uma
inteligência distribuída por toda parte, constantemente avaliada, coordenada em
tempo real, levando à mobilização efetiva das competências. Nós adicionamos à
nossa definição essa ideia essencial: o fundamento e o objetivo da inteligência
coletiva é o reconhecimento e o enriquecimento mútuo das pessoas, não o culto
de comunidades fetichizadas ou hipostasiadas. (LÈVY, 2004, p. 20).
Contudo, o modelo ideal de Lèvy
mostra-se utópico quando aplicado na prática do ciberespaço. A idéia de uma
inteligência coletiva fundamentada no princípio do “enriquecimento múto”
esbarra nos conflitos políticos e nos embates ideológicos característicos da
sociedade humana, que naturalmente são reproduzidos nas comunidades “virtuais”.
Inclusive, a popularidade do formato de “construção coletiva” fez com que
surgissem enciclopédias eletrônicas com orientação ideológica voltada à
extrema-direita. Usando formato semelhante ao inaugurado pela Wikipedia,
podemos citar o exemplo a Metapedia, um site de extrema-direita de
inspiração negacionista publicado em 16 idiomas, que aproveita os recursos
disponibilizados pela web 2.0, onde os usuários podem editar o conteúdo dos
verbetes.
Também deve ser incluída nesse contexto
a expansão dos chamados “sites de relacionamento”, criados a partir de
teorias de redes sociais, ou “social networking”. São exemplos desta
categoria sites como o Friendster, Facebook, Orkut, Hi5, MySpace e o próprio Twitter. De maneira geral,
estes sites possibilitam que os seus usuários criem um perfil onde divulgam
informações pessoais, revelam interesses específicos, compartilham fotografias
e vídeos, mandam e recebem mensagens, etc. Os usuários podem também criar redes
de relacionamento com outras pessoas, além de construir ou participar de
comunidades voltadas para um determinado assunto.
Outro fenômeno da Internet, relacionado
com as mudanças advindas da web 2.0, são os sites de compartilhamento de imagens
(image sharing), e compartilhamento de vídeos (video sharing).
Como exemplos do primeiro tipo temos o
Flickr, o ImageShack, e o Panoramio. São exemplos do segundo tipo o
Metacafe e o Dailymotion, mas sendo o caso de maior sucesso o do Youtube. Os sites de compartilhamento, em sua grande maioria, são gratuitos e permitem
que seus usuários coloquem imagens ou vídeos na Internet para que sejam
assistidos por um grupo restrito de pessoas (mediante a utilização de uma
senha), ou em caráter público, sem nenhuma restrição. O Youtube acaba
funcionando como uma plataforma de propaganda política. Por exemplo, o site é
um grande sucesso entre os simpatizantes da extrema-direita de inspiração
nazi-fascista. No Youtube é possível encontrar milhares de vídeos relacionados
ao assunto, sendo muitos de apologia ideológica. Há vários canais no Youtube
criados por usuários que se dedicam a colocar na Internet vídeos de caráter
neofascista.
O advento da web 2.0 possibilitou a
curva ascendente quase exponencial no número de hostnames na Internet a
partir da segunda metade dos anos 2000, como é visível na Imagem 1. Em função
dessa significativa ampliação do espectro de usuários que colaboram com a
construção da Internet, fica evidente que os historiadores do tempo presente
não podem negligenciar o potencial da rede como fonte de pesquisa. O caráter
efêmero da Internet torna ainda mais importante a tomada de consciência dos
historiadores perante esta nova categoria de fontes. Muitos sites são
retirados do ar sem aviso prévio e seu conteúdo pode ser perdido, visto à sua
inexistência em outro suporte. Dessa forma, o pesquisador do Tempo Presente
tem acesso exclusivo a esse material, pois ele só é acessível em uma restrita
janela temporal.
Como se estivesse em um trabalho de
“arqueologia de salvamento”, o historiador torna-se responsável pela análise e
também pela preservação da informação. Não fosse a sua intervenção, o documento
poderia ser perdido em caráter definitivo.
Os documentos digitais têm como
característica a dissociação entre o suporte físico e o seu conteúdo
informacional. Sendo assim, é possível o descarte do suporte físico e a
manutenção de seu conteúdo em um novo suporte. A evolução extremamente rápida
da tecnologia informática torna os suportes físicos de informação obsoletos em
um curto espaço de tempo. Em pouco tempo o disquete de 1,44 Mb de capacidade de
armazenamento tornou-se obsoleto, sendo substituído pelo CD de 700 Mb
(equivalente a 487 disquetes). Atualmente, a preservação pode ser realizada
utilizando como suporte físico DVDs com 4,7 Gb de capacidade (equivalente a
quase 7 CDs).
No caso das pesquisas históricas que
utilizam fontes digitais, uma solução viável para a questão do armazenamento da
documentação é o salvamento dos arquivos pesquisados em formato PDF, construindo assim um banco de dados digital. No caso de monografias,
dissertações ou teses, uma cópia de tal banco de dados pode ser feita em DVD
(ou em outro suporte mais atual) e anexada na versão final do trabalho.
Mas afinal de contas, o que é um
documento digital? Para responder esta pergunta vale antes revisar a noção
primordial de “documento”. Para os arquivistas, documento é o registro de uma
informação, independente da natureza do suporte que a contém (PAES, 2004, p.
26). Tal noção é importante, pois quebra qualquer hipotética relação de
dependência entre o documento e o suporte em papel. Mais do que isso, este
conceito não relaciona o documento com qualquer suporte específico. A ênfase
recai sobre o “registro de uma informação” e não sobre a espécie do suporte.
Dessa forma, é afastado o “problema” da natureza digital das fontes
eletrônicas. É possível ir além, buscando subsídios em uma área onde a questão
dos documentos – inclusive os digitais – é central e bastante debatida: no
Direito. Para os juristas, documento pode ser considerado como “qualquer
base de conhecimento, fixada materialmente e disposta de maneira que se possa
extrair cognição do que está registrado” (GICO JÚNIOR, 2001, p 98). De
forma semelhante, pode-se dizer que na esfera do Direito:
“Documento é toda representação
material destinada a reproduzir determinada manifestação do pensamento (...).
Abarca o mais amplo espectro de sinais, sendo o mais comum deles a escrita.
(...) É a coisa material na qual a atividade humana imprime vestígios ou sinais
para efeito de comunicação de determinados conhecimentos. (...) Não importa
sobre que tipo de material encontra-se o registro, mas a representação física
do pensamento humano nele representado”. (GICO JÚNIOR, 2001, pp. 98-99).
Perceba-se que não buscamos a concepção
jurídica de documento como “prova”, mas como “registro”. Utilizar o termo no
sentido de “prova jurídica” significaria aproximar-se do conceito de “prova
científica” almejado pela historiografia metódica. Não é esta a intenção deste
trabalho ao resgatar as concepções da Arquivologia e do Direito. O objetivo é
enfatizar que o documento é o registro da expressão da experiência humana, em
suas mais variadas manifestações, independente de seu suporte material. Sendo
assim, podemos considerar como “documento histórico” uma enorme variedade de
registros da atividade humana: escritos dos mais variados tipos, logicamente,
mas também música, arquitetura, palavra oral, pintura, escultura, teatro,
fotografia, cinema, iconografia, vestuário, etc.
Dessa forma, e tentando construir um
conceito o mais simples possível, podemos considerar que “documento digital” é
aquele documento – de conteúdo tão variável quanto os registros da atividade
humana possam permitir – codificado em sistema de dígitos binários, implicando
na necessidade de uma máquina para intermediar o acesso às informações. Tal
máquina é, na maioria das vezes, um computador.
Partindo desse conceito fundamental e
através da experiência empírica, percebe-se a existência de dois tipos básicos
de fontes digitais utilizáveis em uma pesquisa histórica: as fontes primárias e
as “não-primárias”. Dentro destas duas categorias fundamentais é possível
encontrar dois tipos de documentos: “não-primários” digitais, e primários
digitais. Dentro deste último, outras duas subcategorias ainda podem ser
identificadas: os “documentos primários digitais exclusivos” e os documentos
primários digitalizados. Esta tipologia será explicada a seguir e está
representada em forma de diagrama na Tabela 1.
O primeiro tipo de fontes digitais
utilizáveis em uma pesquisa histórica diz respeito às fontes “não-primárias”
digitais, que por sua vez correspondem aos documentos “não-primários” digitais.
A Internet oferece uma quantidade imensa de informação combinada com uma
facilidade de acesso inexistente há apenas quinze ou vinte anos atrás. Basta
digitar uma URL para que o navegador nos transporte a um universo de textos e
imagens sobre os mais diversos assuntos. Entretanto, muitos sites apresentam-se
sob uma formatação aparentemente acadêmica, quando na verdade não representam o
fruto de verdadeiro trabalho científico. Apesar de ser facilmente encontrado
através de mecanismos de busca como o Google, grande parte do material
existente na Internet não possui qualidade e contém erros grosseiros. Em outros
casos, apesar de apresentarem-se como o trabalho de especialistas, os textos
encontrados na rede refletem apenas a opinião altamente ideológica de seus
autores. Isso quando é possível identificar os autores. Ao contrário de um
livro ou uma revista impressa em papel, na Internet muitas vezes é mais difícil
avaliar a autoria e procedência do material.
Tal característica implica na adoção de
critérios cuidadosos para a seleção de fontes da Internet a serem utilizadas em
uma pesquisa científica. É necessário perceber se o conteúdo de um determinado site
corresponde a uma fonte integral, ou se foi retirado parcialmente de outra
fonte. A precisão das informações contidas em um determinado site deve
ser testada comparando-as com outras fontes. Também é importante observar se há
alguma instituição acadêmica respaldando o site em questão. Nos últimos
anos, as principais publicações científicas passaram a contar com edições
eletrônicas. Papers, artigos, dissertações de mestrado ou teses de
doutorado podem ser acessadas através da Internet. Por exemplo, no Brasil o
portal de periódicos da CAPES disponibiliza o acesso a 15.475 revistas
científicas nacionais e internacionais (em 2008 eram aproximadamente 11.500). O acesso dos pesquisadores a esta vasta quantidade de fontes secundárias foi
significativamente facilitado pela Internet.
O segundo tipo de fontes digitais diz
respeito àquelas que fornecem documentos primários. Estes, por sua vez, podem
ser classificados em dois tipos básicos: os “documentos primários digitais
exclusivos” e os “documentos primários digitalizados”. Os documentos
digitalizados são aqueles resultantes do trabalho de digitalização da
documentação “tradicional” já existente. Por exemplo, o jornal inglês The
Times disponibiliza na Internet 200 anos de seu acervo (de 1785 a 1985). São cerca de 20 milhões de artigos e 35 milhões de imagens. Em um trabalho de
enorme proporção, cada página dos jornais foi escaneada e processada por
OCR.
Também são muitas as instituições
acadêmicas de pesquisa que já possuem arquivos de documentos digitalizados
acessíveis pela Internet: bibliotecas, arquivos, Universidades, centros de
pesquisa, museus, fundações. Como exemplos é possível lembrar o German
Propaganda Archive, da Calvin University, talvez o maior arquivo
digital sobre propaganda nazista disponível na Internet. Outro exemplo
importante é a coleção de pôsteres de guerra resultante da parceria entre a University
of Minnesota e a Minneapolis Public Library. Entre 2001 e 2004,
foram digitalizados mais de cinco mil pôsteres da I e II Guerras Mundiais,
formando o maior acervo do mundo sobre o assunto acessível pela Internet. Também é possível citar a Biblioteca Digital, da Biblioteca Nacional; e o
acervo digital do CPDOC; entre outros.
O segundo tipo de documentos primários
digitais, os “digitais exclusivos”, engloba aqueles documentos que não possuem
outro suporte além do digital. Trata-se de uma enorme quantidade de informação
que está sendo produzida e disponibilizada unicamente em formato digital,
sobretudo na Internet. Nesse caso, os dados referentes a tais documentos têm na
rede o seu único meio de publicação e arquivamento. Dessa forma, a rede mundial
de computadores propicia uma existência “virtual” para esta documentação.40 Por
exemplo, nos dias de hoje muitas pessoas possuem diários virtuais publicados em
blogs da Internet.
Contudo, os diários virtuais são
voláteis e sua permanência na Internet (e nos discos rígidos dos servidores,
onde encontram sua materialidade física) pode ser efêmera. Há muito tempo os
historiadores valorizam os diários “tradicionais” como fontes para pesquisa. É
chegado o momento de reconhecer o potencial de documentos semelhantes, porém
publicados em um formato novo. Os diários virtuais representam apenas um, entre
os diversos documentos históricos produzidos exclusivamente na Internet.
É importante perceber que os dois tipos
de documentos primários citados anteriormente podem ser considerados digitais,
pois utilizam a codificação em dígitos binários. Contudo, os documentos
“digitalizados” constituem um tipo específico por possuírem obrigatoriamente um
suporte material anterior à digitalização: na maioria das vezes, o papel, porém
não necessariamente este. A outra categoria (documentos primários digitais
exclusivos), não possui outro suporte material além do digital.
Tabela 1: Os tipos de fontes e documentos digitais utilizáveis pelo historiador. |
De maneira geral, a abundância é uma
característica que chama a atenção quando se fala em “informação digital”.
Quando a responsabilidade sobre a publicação das informações digitais recai
sobre instituições de pesquisa, é provável que haja uma equipe de profissionais
a revisar e avalizar a autenticidade de tais informações. Normalmente, as
instituições publicam relatórios impressos que “referendam” as informações
disponibilizadas nos sites da Internet. Como exemplo, podemos citar o Inter-University
Consortium for Political and Social Research, da Universidade de
Michigan, o Center for Electronic Records do Arquivo Nacional dos
Estados Unidos da América e o Instituto Brasileiro de Geografia e
Estatística.
Todavia, há uma vasta quantidade de
informações disponíveis através da Internet, sem nenhuma relação com
instituições que possam responsabilizar-se pela autenticidade das mesmas. Nesse
conjunto entram blogs, fóruns eletrônicos, e-mails e uma série de
outros meios digitais. Em primeiro lugar, um questionamento fundamental precisa
ser respondido: as informações contidas em uma página da Internet sem relação
com instituições de pesquisa podem ser tomadas como fonte de estudo? A resposta
para esta pergunta não pode ser outra: sem dúvida! Elas podem e devem ser
utilizadas, pois em caso contrário se estaria correndo o risco de negligenciar
um período importante da História do Tempo Presente. Contudo, para utilizar tal
documentação, faz-se necessário um maior rigor em relação ao método
historiográfico, além da utilização de alguns procedimentos metodológicos
específicos.
Um cuidado fundamental a ser tomado diz
respeito ao inter-relacionamento da documentação. É importante demonstrar, quando
for o caso, que a documentação utilizada possui certa relação entre si. Também
é interessante salientar as aproximações temáticas e ideológicas da
documentação, que se manifestam através de citações e convergências
discursivas. Uma forma de interligação particular das fontes oriundas da
Internet é feita através dos links. As páginas podem apresentar atalhos
para outros sites, o que demonstra algum tipo de afinidade entre os
conteúdos dos mesmos. Por exemplo, e de forma simplificada, o site oficial
do Partido Renovador Nacional (PNR), organização de extrema-direita de
Portugal, apresenta links para o twitter e para o blog do
partido.
Portanto, é perfeitamente razoável
supor que tais páginas sejam realmente ligadas à instituição. Por outro lado, blogs
ou twitters que porventura se afirmem como representativos do PNR,
mas que não estejam linkados no site oficial do partido devem ser
analisados, inicialmente, com desconfiança. É fundamental registrar tais
aproximações tendo em vista que o inter-relacionamento das fontes pode
funcionar como um indicador da confiabilidade das mesmas. De acordo com Luciana
Duranti, o inter-relacionamento da documentação:
“...é devido ao fato de que os
documentos estabelecem relações no decorrer do andamento das transações e de
acordo com suas necessidades. Cada documento está intimamente relacionado
"com outros tanto dentro quanto fora do grupo no qual está preservado e
(...) seu significado depende dessas relações". As relações entre os
documentos, e entre eles e as transações das quais são resultantes, estabelecem
o axioma de que um único documento não pode se constituir em testemunho
suficiente do curso de fatos e atos passados: os documentos são
interdependentes no que toca a seu significado e sua capacidade comprobatória.
Em outras palavras, os documentos estão ligados entre si por um elo que é
criado no momento em que são produzidos ou recebidos, que é determinado pela
razão de sua produção e que é necessário à sua própria existência, à sua
capacidade de cumprir seu objetivo, ao seu significado, confiabilidade e
autenticidade. Na verdade, os registros documentais são um conjunto indivisível
de relações intelectuais permanentes tanto quanto de documentos”.
Trabalhar
sob uma incerteza calculada não é novidade para o historiador, pois os métodos
históricos não são totalmente precisos. As fontes “tradicionais” não são mais
confiáveis do que as fontes digitais. Um documento impresso pode ser falso. Uma
fotografia antiga pode ser fraudulenta. Um depoimento oral pode modificar os
fatos. É normal para os historiadores trabalhar dentro de campos de
possibilidades, utilizando métodos para reduzir as chances de erro. No futuro,
é possível que sejam criados mecanismos mais precisos para verificar a
autenticidade das fontes digitais. Contudo, enquanto tais procedimentos não
se tornarem operacionais, a habilidade e a experiência do pesquisador
continuarão determinantes na seleção das fontes mais confiáveis.
Outro
procedimento especial a ser adotado na análise das fontes oriundas da Internet
deve estar relacionado à preocupação com o cruzamento de dados. Tais fontes
podem ser altamente ideológicas, sendo necessária a crítica cuidadosa de suas
informações. Uma forma de fazer isso é cruzar seus dados com outras fontes
disponíveis. Por exemplo, se o historiador estiver estudando sites de
partidos políticos, torna-se interessante utilizar também periódicos de
diferentes orientações ideológicas para confrontar determinadas informações.
Ao
utilizar documentação “convencional” (cartas, jornais, inventários,
fotografias, etc.) sob a guarda de instituições de pesquisa, museus ou
arquivos, algumas vezes é possível que o historiador não se preocupe em
verificar sua autenticidade. Isto porque, em alguns casos, supõe-se que tais
documentos já tenham passado pela avaliação de outros profissionais que em
algum momento atestaram sua autenticidade. Todavia, ao se deparar com
documentos inéditos, faz-se necessário o exame criterioso para verificar sua
confiabilidade. Uma fotografia pode ser falsificada ou uma carta pode ser
forjada e existem métodos que possibilitam identificar tais falsificações. Ao
utilizar sites da Internet como fonte primária o historiador irá,
provavelmente, ser a primeira pessoa a preocupar-se em verificar sua
autenticidade. Isso faz com que aumentem as chances de se deparar com algum
tipo de falsificação. Por isso, ao trabalhar com fontes da Internet, a atenção
deve ser redobrada. O historiador precisa utilizar a técnica e desenvolver a
habilidade necessária para selecionar o material confiável.
Por exemplo, um site pode ser hackeado e as informações ali publicadas originalmente podem ser alteradas sem o
conhecimento dos seus autores. Por exemplo, em agosto de 2008, hackers do
grupo antifascista AFA (Antifašistická Akce) conseguiram invadir o fórum
eletrônico da organização neonazista Blood & Honour e alterar o
conteúdo original das páginas.
Imagem 2: Este banner deixado pelos hackers da AFA substituiu o conteúdo original do fórum da Blood & Honour. |
Outro tipo de falsificação às quais as
fontes da Internet estão sujeitas, diz respeito a falsos sites, ou fake
sites. Normalmente os fake sites são construídos com o propósito de
aplicar golpes eletrônicos pela Internet. Os estelionatários criam cópias dos sites
de empresas, instituições bancárias ou governamentais e atraem os usuários
até elas para roubarem-lhes informações como número de cartões de crédito ou
senhas bancárias. Também são comuns as falsificações de sites de
relacionamento, como o Orkut, Facebook, My Space e Twitter.
Há a possibilidade teórica da criação de um fake site em qualquer área
do conhecimento.
Tomar um fake site como sendo um
site verdadeiro seria um erro grosseiro, portanto o historiador deve
estar atento a esta possível prática na hora de selecionar suas fontes. Existem
procedimentos básicos que devem ser adotados para minimizar a possibilidade de
que sejam cometidos enganos dessa natureza. Nesse sentido, a utilização da
ferramenta WHOIS mostrou-se efetiva em alguns casos. WHOIS é um protocolo
específico para consultar informações de contato e domínio sobre entidades da
Internet. As entidades podem ser um nome de domínio, um endereço IP ou um AS
(Sistema Autônomo). O protocolo WHOIS apresenta três tipos de contatos para uma
entidade: Contato Administrativo (Admin Contact), Contato Técnico (Technical
Contact) e Contato de Cobrança (Registrant Contact). Estes contatos
são informações de responsabilidade do provedor de Internet.
O historiador deve adquirir
familiaridade com a documentação, a fim de conhecer os símbolos, os códigos, os
detalhes que envolvem os documentos autênticos. Ao obter esta habilidade, a
existência de desvios no padrão torna-se visível para o pesquisador atento.
Trabalhar quantitativamente também pode ser um procedimento metodológico
interessante, principalmente quando se estiver trabalhando com documentos
anônimos ou cuja autenticidade seja de difícil comprovação. Dessa forma, se for
obtido um corpus significativo de dados, é possível identificar uma
coerência discursiva que remete a um modelo padrão.
Todos os desvios relevantes dentro do
padrão identificado devem ser analisados com mais detalhes, para precisar sua
procedência e minimizar a possibilidade de erros. É necessário que o
historiador adquira certa “intimidade” com a documentação, a fim de perceber os
afastamentos da regularidade. Com a experiência, os desvios acabam “saltando
aos olhos” do historiador. Trata-se de trabalhar dentro de um espectro
admissível de erro. Como afirma Charles Dollar:
“Os estudiosos e pesquisadores que
utilizam algum material como fonte primária em sua pesquisa partem, em geral,
do pressuposto de que tal material é confiável e fidedigno. Trata-se de uma
"autenticidade presuntiva", porque a maior parte do material
considerado fonte primária - registros para os arquivistas - não passa de um
subproduto de transações rotineiras exigidas para se levar a cabo uma ação
(legal, financeira ou comercial), e esses subprodutos acabam formando um corpus
de materiais relacionados entre si. A presença de um documento em um corpus
constituído de tipos semelhantes de material, que se sabe ou se acredita
terem sido produzidos de acordo com procedimentos-padrão, acarreta uma
presunção de fidedignidade e autenticidade. Por conseguinte, tanto o contexto
quanto o conteúdo dos documentos dão testemunho da fidedignidade e da
autenticidade”.
É importante salientar o amplo espectro
de documentação proporcionado pela Internet, especialmente para os
historiadores do Tempo Presente. Em alguns casos, esta abundância pode chegar
ao extremo. Mais do que facilitar o trabalho do historiador, a grande
quantidade de fontes constitui um obstáculo perigoso. O impulso em buscar
expandir a análise pode levar o pesquisador a um labirinto de fontes, onde
seria difícil encontrar a saída no tempo disponível. A situação seria
semelhante à metáfora usada por Aléxis de Tocqueville, onde o historiador é
comparado com um minerador sobre o qual a mina desaba, deixando-o sem saber
como sair dali carregando o tesouro. Dessa forma, é necessário selecionar os
documentos mais relevantes para uma análise qualitativa, dentro do universo bem
maior de fontes que entram na análise quantitativa.
O impacto das novas tecnologias da
informação sobre a atividade dos pesquisadores em Ciências Humanas ainda não
foi totalmente assimilado. As novas tecnologias causaram alterações na maneira
de lidar com a documentação. Atualmente, os profissionais que trabalham em
arquivos ainda estão em fase de adaptação a esse novo contexto:
“Com a proliferação dos sistemas
eletrônicos de informação, esse mundo físico bem-arrumado dos arquivos
desapareceu, tanto quanto assinaturas e selos, pastas e caixas, maços e
dossiês, e a mais sagrada das entidades, a proveniência física e a ordem física
original. Além disso, os sistemas eletrônicos de informação estão gerando uma
realidade documental tão distinta daquela com que os arquivistas estão
familiarizados que é muito difícil para eles acreditar que exista de todo uma
realidade documental”.
Em
2005, Orville Burton classificava este novo panorama no ofício do historiador
como “revolucionário”, referindo-se a ele como uma “História Digital”. Algumas das vantagens de uma “História Digital” estão relacionadas com seu
potencial para o armazenamento de dados, a sua facilidade de acesso, a flexibilidade
de formatos (textos, imagens, vídeo, áudio,...), e a interatividade entre o
usuário e as fontes, facilitada pelo princípio do hipertexto e pela web 2.0.
Todavia, o otimismo demonstrado por
Burton cinco anos atrás não levava em consideração o fato de que História
Digital também tem suas desvantagens: a falta de qualidade de grande parte do
material disponível na Internet, o caráter volátil da documentação, a
necessidade de atualização técnica constante do pesquisador, a possibilidade de
cobrança para o acesso às fontes, a necessidade de avaliação da autenticidade
da documentação (embora estas últimas não sejam exigências apenas da História
Digital).
Tais características implicam na
necessidade de uma metodologia específica para a lida com a documentação
digital. Contudo, ao contrário do que parece afirmar Orville Burton,
acreditamos que a “História Digital” não implica em uma revolução metodológica.
Ela necessita, sem dúvida, de uma metodologia particular, porém fundamentada
nos princípios básicos já consagrados da pesquisa historiográfica, apenas
adaptados ao formato digital.
Referências
Bibliográficas
ALMEIDA, Fábio Chang de. A serpente na rede: extrema-direita,
neofascismo e internet na Argentina. Dissertação de Mestrado. Universidade
Federal do Rio Grande do Sul. Instituto de Filosofia e Ciências Humanas,
Programa de Pós-Graduação em História. Porto Alegre: 2008.
ALMEIDA, Fábio Chang de.
Neofascismo: uma abordagem
histórica. In: GONÇALVES, Leandro
Pereira; PARADA, Maurício B.
Alvarez; SILVA, Giselda Brito (orgs.).
Histórias da Política Autoritária:
Integralismos, Nacional-Sindicalismo, Nazismo e Fascismos. Recife: Editora
da UFRPE, 2010.
BURTON, Orville
Vernon. American Digital History.
In: Social Science Computer Review, v. 23, n. 2. Social Science Computing Association - North Carolina
State University, 2005, p. 207.
CALDEIRA NETO, Odilon. Breves reflexões sobre o uso da Internet em pesquisas historiográficas.
Revista Eletrônica Boletim do TEMPO, Ano 4, n. 20, Rio de Janeiro, 2009.
COHEN, Daniel J; ROSENZWEIG,
Roy. Digital History: a guide to gathering,
preserving, and presenting the past on the web.
DAVIS, Ian. Talis,
Web 2.0 and all that. 4
de julho de 2005.
DELEUZE, Gilles. GUATTARI, Félix. Mil
platôs: capitalismo e esquizofrenia. Vol. 1. Rio de Janeiro: Editora
34, 1995.
DOLLAR, Charles. Tecnologias da informação digitalizada e pesquisa acadêmica nas
ciências sociais e humanas: o papel da arquivologia. In: Estudos
Históricos, vol. 7, n. 13. Rio de Janeiro: FGV, 1994.
DURANTI, Luciana. Registros documentais contemporâneos como provas de ação. In: Estudos
Históricos, vol. 7, n. 13. Rio de Janeiro: FGV, 1994.
EIRAS, Bruno Duarte. Blogs: mais que uma tecnologia, uma atitude. Cadernos de
biblioteconomia arquivística e documentação, n. 1. Associação
Portuguesa de Bibliotecários, Arquivistas e Documentalistas. Lisboa, 2007.
GICO JÚNIOR, Ivo Teixeira. O documento eletrônico como meio de prova no Brasil. In: BAPTISTA,
Luiz Olavo. (coord.) Novas fronteiras do Direito na informática e telemática.
São Paulo: Saraiva, 2001.
KUROSE, James F.; ROSS,
Keith W. Computer networking: a
top-down approach featuring the Internet. 3. ed. Boston: Pearson/Addison Wesley, 2005.
LEÃO, Lucia. O labirinto da hipermídia: Arquitetura e navegação no
ciberespaço. São Paulo: FAPESP/Iluminuras, 2001.
LE GOFF, Jacques. História e memória. São Paulo:
Editora da UNESP, 1992.
LÉVY, Pierre. A revolução contemporânea em matéria de comunicação. In: Para
navegar no século XXI: tecnologias do imaginário e cibercultura. MARTINS,
Francisco Menezes; SILVA, Juremir Machado da. Porto Alegre: Sulina/EDIPUCRS,
1999-a.
LÉVY, Pierre.
Cibercultura. São
Paulo: Editora 34, 1999-b.
LÉVY, Pierre.
Inteligência colectiva: por una
antropologia del ciberespacio. Washington, 2004.
PAES, Marilena Leite. Arquivo: teoria e prática. 3.
ed. Rio de Janeiro: Fundação Getúlio Vargas, 2004.
PAES, Marilena Leite.
O que é o virtual? São
Paulo: Editora 34, 1996.
ROLLAND, Denis. Internet e história do tempo presente: estratégias de memória e
mitologias políticas. Revista Tempo, n. 16, vol. 8. Rio de Janeiro:
UFF, 2004.
SIRINELLI, Jean-François. Os intelectuais. In. REMOND, René
(org.) Por uma história política. Rio de janeiro: UFRJ/FGV, 1996.
TRAVERSO, Enzo. La singularidad de Auschwitz - hipótesis, problemas
y derivaciones de la investigación histórica. Buenos Aires: Revista
Nuestra Memória, n. 22, 2003.
Fonte: ALMEIDA, Fábio Chang de. O historiador e as fontes digitais: uma visão acerca da internet como fonte primária para pesquisas históricas. Revista Aedos, n. 8, v. 3, janeiro-junho 2011, p. 9-30.
Nenhum comentário:
Postar um comentário