Google lanza Dataset Search, un motor de búsqueda para acceder a repositorios de datos 'online'

Google Dataset Search
GOOGLE
Dataset Search Google
Publicado: jueves, 6 septiembre 2018 14:35

   MADRID, 6 Sep. (Portaltic/EP) -

   Google ha lanzado Dataset Search, una herramienta de búsqueda que permite acceder y consultar datos integrados en cualquier tabla o base de datos, siempre que la publicación del contenido se etiquete a través de estándares abiertos de indexación como scheme.org para describir la información.

   Dataset Search es capaz de localizar las conjuntos de datos sin importar donde se encuentren alojados, como se explica a través de una publicación en el blog oficial de Google. A través de la herramienta se puede consultar información proveniente de cualquier dirección, ya se trate de direcciones públicas, bibliotecas digitales o webs personales de un autor.

   El funcionamiento de Dataset Search es similar al de Google Académico --enfocado a la búsqueda de contenido y literatura de tipo científico-académica-- y cualquier persona puede hacer uso de ellas, pues no se trata de una característica reservada para el ámbito académico. Las fuentes consultadas van desde organismos gubernamentales que hayan publicado en la Red hasta organizaciones especializadas de noticias como ProPublica.

   Las búsquedas de 'Dataset Search' se basan en el estándares abiertos para describir la información publicada y así permitir que sea más fácilmente identificable, como son schema.org u otros que mantengan el formato de vocabulario establecido por el Consorcio 'World Wide Web' (W3C). Cualquiera que publique datos, puede describirlos y etiquetarlos mediante esta forma para hacer su búsqueda algo más sencillo.

   Las búsquedas han de ser claras y realizarse a través de formas que permitan que Google pueda entender bien el contenido de las páginas. Se recomienda utilizar un 'sitemap' o listado de URL del sitio que el usuario quiera indexar para que el buscador pueda encontrar la dirección correspondiente.

   La compañía también recoge en su blog de desarrolladores consejos para realizar búsquedas más efectivas, lo cual comprende el uso de etiquetas de búsqueda como 'sameAs', para conjuntos de datos o descripciones de materiales republicados, o 'isBasedOn', en el caso de que al republicarse los datos, estos se hayan cambiado de forma significativa. También ayuda acotar las búsquedas al indicar cuándo se publicó, cómo se recopilaron los datos o quién creó el contenido.

   Dataset Search funciona en varios idiomas y Google pretende llevar la herramienta a nuevos idiomas próximamente. Esta iniciativa se recoge dentro de los esfuerzos de la empresa por hacer de los datos recogidos dentro de documentos o bases de datos en la Red algo más accesible.

Leer más acerca de: