segunda-feira, 9 de maio de 2011

Os Feeds RSS na coleta para um arquivo histórico de web sites

Qual o quantitativo de novas páginas adicionadas em um website ou de novos conteúdos publicados? Este é um problema crucial para o sucesso de um arquivo da web na sua função de preservação histórica de website, pois devido ao conteúdo efêmero da web não se pode deixar para fazer a coleta depois. Mas quando coletar? Como monitorar um website? ou pior: como monitorar um acervo de websites indefinidamente.

Os feeds da Web tem sido pouco estudados, mas continuam sendo um fenômeno em evolução. Eles podem ser usados ​​como instrumentos para a análise de um site antes e durante o rastreamento. Além de ser uma forma depropaganda de conteúdo, feeds da Web são também utilizados para classificar as fontes de informação e seus tipos de conteúdo pelos motores de busca. Em suma, a partir da Web feeds, aspectos importantes de um Website dinâmico podem ser extraídos e explorados no contexto de um rastreamento, a fim de torná-lo mais consciente.

O Feed serve para que o arquivo da web possa rastrear as atualizações além daquelas exibidas na página principal, pode permitir capturar informações sobre as publicações nos dados do conteúdo e nas tags excluindo-se informações adicionais, para fins de indexação, existentes em um website.

Veja o restante da notícia aqui: http://bibliotecno.com.br/?p=1586

Por Glauber Martins

Nenhum comentário:

Postar um comentário