Publicado:
Leitura 2 minutos
Dando continuidade ao post anterior, vimos que em 2007, Tim-Berners Lee, juntamente com outros colaboradores, propõem os dados abertos vinculados (LOD ? Linked Open Data).
Cada Dataset do LOD agrega e interliga um conjunto na casa de bilhões de triplas RDFs (Resource Description Framework) para todos os domínios e áreas do conhecimento.
Como vimos também, esta nuvem de dados (LOD), na época de sua criação, contava com 12 datasets. A última atualização, em 2011, eram 295. O crescimento está sendo exponencial.
Alguns exemplos de datasets: Conhecimentos gerais (DBPedia – o dataset do Wikipedia); Entretenimento (BBC Music, etc.); Doenças (Diseasome, etc.); Bulas de Drogas (DailyMed); Censo EUA (US Census); Dados Governamentais (data.gov.uk, etc.), dentre outros datasets.
O número de datasets da ?Life Science?, segundo Bizer, Jentzsch e Cyganiak (2012) é de 41 (do total de 295), com mais de três bilhões de triplas. Acima deste número, encontram-se apenas 87 datasets de publicações e 49 datasets de dados governamentais. Abaixo está descrito alguns dos principais datasets da ?Ciência da Vida?:
Referência
BIZER, C.; JENTZSCH, A.; CYGANIAK, R. State of the LOD Cloud. 2011. Disponível em <http://www4.wiwiss.fu-berlin.de/lodcloud/state/>. Acesso em: 04 jul. 2012.