Uma outra face dos metadados: informações para a gestão da preservação digital

AutorLuís Fernando Sayão
CargoCNEN - Rio de Janeiro - RJ
Páginas1-31

Page 1

Luís Fernando Sayão

CNEN - Rio de Janeiro - RJ

lsayao@cnen.gov.br

Page 2

1 Introdução

Nos dias de hoje, é virtualmente impossível discutir serviços e sistemas de informação sem o envolvimento direto com questões relacionadas aos metadados. Embora o termo “metadados” seja uma invenção relativamente recente – primordialmente ele foi usado no contexto dos sistemas de banco de dados para descrever e controlar a gestão e o uso dos dados - a ideia que ele porta remonta outros tempos, tendo suas raízes na catalogação realizada pelas bibliotecas e organizações similares (DAY, 2005). Essa noção é determinante, posto que, quando pensamos em metadados, a primeira idéia que nos ocorre é inspirada no seu uso no ambiente da biblioteca; no seu papel de um esquema formal para descrição de todo tipo de objetos informacionais, digitais e não digitais. A catalogação tradicional é uma forma de atribuição de metadados; o MARC 211e o conjunto de regras usadas com ele, tais como o AACR22, são padrões de metadados (NISO, 2004).

Relacionada à função de catalogação, existe outra importante razão para a criação de metadados: facilitar a descoberta de informações relevantes, seja no ambiente da biblioteca, seja no ambiente web. O exemplo mais ilustrativo é o Dublin Core Metadata Element Set3, uma das mais importantes iniciativas na área de metadados, cujo objetivo essencial é apoiar a descoberta de recursos no extenso e fragmentado universo web, que apesar da sua riqueza informacional não foi pensado especificamente para a recuperação de informação.

Porém, quando uma biblioteca assinala metadados descritivos para um livro de sua coleção, ela não precisa se preocupar com a possibilidade dele se dissolver numa série de páginas e figuras desconectadas caso as informações sobre a seqüência das páginas e a estrutura do livro não forem registradas; nenhum pesquisador ficará impossibilitado de avaliar o conteúdo do livro se os dados sobre a máquina offset que o imprimiu não forem informados. O mesmo não pode ser dito para a versão digital desse livro (LIBRARY OF CONGRESS, 2009). Quando submergimos no mundo dos documentos digitais, constatamos que outras dimensões dos metadados, que ultrapassam os limites de ferramenta para a descrição e descoberta de recursos, precisam ser reveladas e

Page 3

exploradas. Isto porque os objetos digitais para serem gerenciados e usados requerem processos de maior amplitude, que implica em identificar informações precisas para instruílos adequadamente.

Na medida em que a idéia de metadados se torna uma parte essencial do mundo digital, eles se mostram conceitualmente mais complexos e mais abrangentes, apoiando um espectro extremamente amplo de atividades. Essas novas dimensões de metadados são vitais para o acesso e para a interpretação dos recursos informacionais digitais; como são importantes também para a estruturação e para os processos de gestão associados a esses recursos, que podem incluir inúmeras funções, tais como: controle dos direitos, intercâmbio, comércio eletrônico, interoperabilidade técnica e semântica, reuso da informação e curadoria digital, para citar alguns. Esse elenco crescente de funções circunscreve conceitos tradicionais e conceitos inéditos que convergem para apoiar a composição de novos ambientes informacionais, como as bibliotecas, os arquivos e os museus digitais.

Esta ampliação do domínio de aplicação faz com que os metadados necessários para a gestão e para o uso de objetos digitais sejam mais diversificados e, na maioria dos casos, diferentes dos metadados usados para gestão de coleções de obras impressas e de outros materiais físicos.

Em outro plano, o acesso e a usabilidade dos recursos informacionais digitais é impactado fortemente pela sua dependência a contextos tecnológicos específicos; esse fato gera uma área de tensão e complexidade na gestão de acervos digitais. A fragilidade estrutural da informação digital configura um dos maiores desafios a ser enfrentado pelos pesquisadores e profissionais das áreas de informação e de tantas outras áreas, neste começo de século. A preservação da informação digital por longo prazo é um problema que envolve um número grande de variáveis, planejamento cuidadoso, tecnologia e orçamentos vultosos, e cuja complexidade tem arrefecido o entusiasmo das bibliotecas digitais e demais organizações de patrimônio informacional em disponibilizar seus estoques digitais para as futuras gerações.

Entretanto, está cada vez mais claro – para a prática e para a teoria – que existe uma parte do problema de preservação digital de longo prazo que só será resolvido a partir da identificação de um conjunto de dados e informações, expressos na forma de metadados, que ancorem os processos de gestão da preservação digital.

Page 4

Este elenco específico de metadados é chamado de metadados de preservação; é uma nova face para os metadados que vai assegurar que o recurso de valor contínuo sobreviva ao longo do tempo e continue sendo acessível e, não menos importante, que não perca a capacidade de ter seus significados apropriadamente interpretados no tempo que for necessário pelas comunidades para quem a informação, de forma privilegiada, se dirige.

Nessa direção, uma série de especificação de metadados e de infraestruturas físicas e conceituais vem sendo desenvolvida em torno do compromisso da preservação de longo prazo das informações digitais. É exatamente o papel dos metadados como ferramenta voltada para instruir os processos de preservação de documentos digitais que vamos discutir resumidamente nesse trabalho. Para contextualizar o problema, começamos com uma rápida definição de metadados e seus tipos; passamos pelas estratégias de preservação digital; em seguida, discutimos os metadados de preservação, tomando como referências o modelo conceitual definido pelo Open Archival Information System (OAIS), o dicionário de dados do PREMIS4 e o papel da infraestrutura de empacotamento definida pelo Metadata Encoding Transmission Protocol (METS)5.

2 Uma definição e uma categorização para metadados

Primordialmente, as iniciativas relacionadas à criação de formatos de metadados estavam focadas no desenvolvimento de padrões para organização e para a descoberta de recursos informacionais. Entretanto, novas exigências, impostas principalmente pelos desafios do mundo digital, foram redesenhando a ideia puramente descritiva de metadados, criando expansões para o seu conceito com o intuito de abrigar novos propósitos e funções.

Como desdobramento, a definição minimalista e quase clássica, que enuncia que “metadados é dados sobre dados”, tornase inexpressiva e rasa diante da complexidade dos papeis atribuídos aos metadados nos diversos contextos correntes da gestão da informação; além do mais, ela não

Page 5

nos ajuda a entender o que é e como os metadados podem ser usados. A NISO6 – sigla para National Information Standard Organization - apresenta uma definição que expande o que se entende por metadados, ampliando o seu domínio de aplicação: “Metadados é a informação estruturada que descreve, explica, localiza, ou possibilita que um recurso informacional seja fácil de recuperar, usar ou gerenciar” (NISO, 2004, p.1, tradução nossa).

Não se pode afirmar que haja um consenso, mas uma fração significante dos autores que tratam do assunto concorda que os metadados podem ser divididos em três categorias conceituais: metadados descritivos, metadados estruturais e metadados administrativos. Essa segmentação é útil para uma compreensão mais clara sobre os tipos de informações que eles podem circunscrever, muito embora os seus contornos não possam ser precisamente definidos.

Metadados descritivos: é a face mais conhecida dos metadados, são eles que descrevem um recurso com o propósito de descoberta e identificação; podem incluir elementos tais como título, autor, resumo, palavraschave e identificador persistente.

Metadados estruturais: são informações que documentam como os recursos complexos, compostos por vários elementos, devem ser recompostos e ordenados. Por exemplo, como as páginas de um livro, digitalizadas separadamente, são vinculadas entre si e ordenadas para formar um capítulo.

Metadados administrativos: fornecem informações que apoiam os processos de gestão do ciclo de vida dos recursos informacionais. Incluem, por exemplo, informações sobre como e quando o recurso foi criado e a razão da sua criação. Nessa categoria, estão metadados técnicos que explicitam as especificidades e dependências técnicas do recurso; inclui também os metadados voltados para apoio à gestão dos direitos relacionados ao recurso.

Um requisito importante para os sistemas de informações atuais é a possibilidade da representação de recursos informacionais em níveis variados de granularidade; isso compreende a capacidade dos metadados de descreverem camadas diferenciadas de agregação dos recursos, por exemplo: descrever uma coleção, um item ou uma parte de um item, como um capítulo, uma fotografia ou um gráfico. Ainda relacionada à amplitude de resolução dos metadados, está a

Page 6

capacidade de descrever uma obra e suas expressões, manifestações e itens particulares (NISO, 2004).

Metadados são agrupados em estruturas abstratas conhecidas como esquemas ou formatos de metadados, que são conjuntos de elementos criados com fins específicos, por exemplo: descrever um tipo...

Para continuar a ler

PEÇA SUA AVALIAÇÃO

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT