domingo, 13 de outubro de 2013

​Metadados e seus significados


A definição clássica, metadados são dados sobre dados, que lemos em todo início de artigo sobre o tema, não é suficiente para compreendermos o termo, suas implicações e aplicações. O universo de profissionais da informação que se utilizam dessa definição é muito amplo e os conceitos e entendimentos se confundem. 

O prefixo “Meta” vem do grego e significa “além de”.  Portanto, o objetivo é fazer com que o metadado vá além do dado. Então vou procurar explicar o que é esse “além” na visão de áreas distintas.

Para expor os diferentes conceitos, tomarei como base o entendimento e aplicação para os profissionais da área de Biblioteconomia e Ciência da Informação, comparados com profissionais da área de Tecnologia da Informação. O significado de dados sobre dados é completamente diferente.


Bibliotecários gerenciam recursos informacionais que devem ser representados de forma estruturada em um sistema de informação. A descrição através de padrões deve facilitar a localização e recuperação da informação. No universo biblioteconômico existem inúmeros códigos universais que visam facilitar a interoperabilidade entre sistemas de informação abertos. Um padrão bastante conhecido é o DublinCore, criado para descrever objetos digitais, com a possibilidade de intercâmbio de dados entre instituições. O DublinCore consiste em 15 elementos padronizados que, se adotados, permitirão a troca de informação entre instituições. Na prática significa que não há a necessidade de se descrever um recurso informacional (um item) se ele já existe no catálogo de outra instituição que adota o mesmo padrão.
Metadados podem ser estruturados ou desestruturados. O catálogo de uma biblioteca física ou digital é estruturado,  já um índice gerado automaticamente por um sistema de indexação ou a pesquisa na íntegra de um texto, são exemplos de metadados não estruturados.
As redes sociais são exemplos complexos de informação não estruturadas e estão na pauta de projetos de BigData. Muito conhecimento explícito desestruturado pode ser identificado em um simples post. Como capturar e organizar? Existem situações onde profissionais de empresas que colaboram em rede, publicam seus conhecimentos tácitos em posts e a empresa não sabe o que ele sabe. Bom, mas esse assunto é para outro artigo.

E na área de TI? Uma das práticas comuns é extrair e consolidar dados de múltiplas fontes de informação em uma base de dados para consulta na tomada de decisão. Nesse sentido os metadados são um instrumento essencial para a gestão do repositório incluindo informações como lista de conteúdo, origem dos dados, responsável pelo dado, sistema de origem, filtragem ou cálculos efetuados na transferência, versão etc. 

Assim sendo, um dicionário de dados com a definição e metadados acima descritos, é um exemplo de sistema de informação estruturada. Da mesma forma o EDI - Electronic Data Interchange - meio de troca de transações eletrônicas para grandes volumes de dados que dependem de metadados padronizados para promover o intercâmbio e recuperar informação. Na área de TI existem ferramentas que mapeiam os metadados em bancos de dados, facilitando a tarefa de criação de um dicionário de dados.

Voltando aos documentos e especificamente aos arquivos, os metadados tem a função de gerenciar o ciclo de vida, meio de armazenamento​​ e preservação de documentos, condições essenciais para gerir volumes físicos e digitais no tempo.

A tecnologia está madura e empresas oferecem várias soluções de captura automática de metadados não estruturados tanto para a área de documentação como para a área de TI. Não são soluções muito baratas, mas há que se analisar o custo x benefício. Tratar os metadados de uma imagem ou tratar essa imagem convertida em texto são resultados completamente diferentes.

​Vale comentar a importância dos metadados para a Web Semântica. Os conteúdos na web deverão ser descritos a partir de metadados para que a recuperação se dê de forma multilíngue. Algo complexo ainda, mas já na pauta do W3C, consórcio que rege a Web no mundo. 

​A FIG 1 abaixo representa as camadas onde encontramos metadados e os tipos de extração que podemos nos beneficiar, partindo de repositórios estanques e indo até a camada de BI onde os metadados servirão para tomadas de decisões estratégicas, em uma visão de metadados na área de TI. Aqui a aplicação é mais corporativa.

A FIG 2 representa a arquitetura de um repositório institucional para bibliotecas digitais, onde os metadados são utilizados para descrever os recursos informacionais com o objetivo de serem recuperados pelos diversos perfis de usuários. Aqui a aplicação é mais institucional.

FIG 1                                                                                           


Concluindo, vê-se que metadados é muito mais que dados sobre dados e o BigData está aí para nos reforçar essa afirmação.​ Cuidado com os jargões e ruídos de comunicação também são recomendações importantes para um projeto que envolva áreas técnicas distintas.






FIG 2




3 comentários:

  1. Convido você a comentar o texto com sugestões, dúvidas, comentários. O post gerou algum insight em você? Por que esse tema te chamou a atenção?

    ResponderExcluir
  2. Grato pelo excelente artigo, Renate. Metadados são vitais também para interoperarem com outras plataformas no segmento M2M - máquina "conversando" com máquina. Um pouco além do EDI e às portas da web semântica (a dos significados). Ah!, cheguei até aqui via meus robozinhos de colheita.

    ResponderExcluir
    Respostas
    1. Ola Germana! Bom saber como vc chegou em me blog. Sim, o cientista de dados será uma das carreiras mais valorizadas. Veja meu artigo sobre esse tema. O dado é o rei em um sistema de informação, não é mesmo? abs

      Excluir