Máster Universitario Online en SEO, SEM, Social Media y Web Analytics

Inicio » B11 Fundamentos en Tecnologías Web » Big data, OpenData y Linked data

Big data, OpenData y Linked data

Big data, OpenData y Linked data

Joan Teran

Joan Marco. Big data, OpenData y Linked data. En Cristòfol Rovira; Mari Carmen Marcos; Lluís Codina (dir.). Máster en Información Digital. Barcelona: Universidad Pompeu Fabra – BSM.


Estos tres conceptos, contemporáneos como pocos, empezaron a cobrar sentido cuando el desarrollo tecnológico alcanzó una velocidad difícil de imaginar hace 30 años. Para explicarlos vamos a empezar desde el principio y a ir en orden, de menos a más.

El Big Data

Los inicios nos llevan a cuando pensábamos que los megas eran unidades de memoria realmente potentes. En los ochenta no eran nada desdeñables, desde luego; en cambio, en los 90 nos pasamos a los gigas, en los 2000 a los teras y ahora existen, siguiendo la regla de que el siguiente de la lista es 1024 veces el anterior: el petabyte, el exabyte, el zettabyte, el yottabyte, el brontobyte y el geopbyte.

Estos términos se han tenido que inventar a la fuerza, ya que la información que se genera día a día en todo el mundo es cada vez mayor. Es mayor no solo porque se vaya acumulando, sino porque cada vez hay más canales capaces de generarla.

bigdata.jpg

Imagen 1

El Big Data hace referencia a dos cosas al mismo tiempo: a la gran cantidad de información –imposible de procesar por el software habitual– por un lado y a la capacidad tecnológica de gestionar dicha información por otro.

Este binomio de información-capacidad, si se sabe tratar, es un arma potentísima para las empresas. Si estas son capaces de conocer el comportamiento de su público objetivo a través del Big Data, ¿no serán más capaces de satisfacer lo que este quiere?

Y es que el Big Data nace de cualquier cosa que genere información y se pueda registrar: un email, una hoja de Excel, una llamada de teléfono, una red social, un formulario web, una fotografía hecha con el móvil, etc.

El Big Data y el uso de la razón nos llevan al Open Data.

El Open Data

Si el Big Data se mide como si fuera un tamaño o una capacidad, el Open Data lo tomaremos desde el sentido del uso.

 

La información recogida, almacenada y procesada tiene un potencial incalculable, eso es evidente. Entonces se plantea la pregunta: ¿por qué no podría sacar partido de ello cualquiera? Si mucha de esa información es pública, ¿por qué no facilitar el acceso a dicha información al ciudadano medio?

Con ella, las personas serán capaces de mejorar el mundo actual, al tomar decisiones fundamentadas en datos reales.

open data.jpg

Imagen 2

El Open Data es el uso público del Big Data.

 

El Big, Open Data, por tanto, hace referencia a la parte del Big Data que es pública, accesible para todo el mundo.

 

Por ejemplo: el censo de una población es Open Data. Los censos de todo el mundo junto a los atributos de todos los miembros del censo (fecha de nacimiento, dirección, documento de identidad, etc.) es Big, Open Data.

Que una información sea accesible no quiere decir que sea útil. ¿Qué pasa si no se puede «navegar» en esa información, si hay dificultades para catalogarla o comprenderla? Es aquí donde se presenta el concepto de Linked Data.

Linked Data

Imagina que el Big, Open Data se etiqueta. Pero no un etiquetado sencillo de blanco o negro, sino un etiquetado semántico completo, capaz de otorgar distintos niveles de caracterización a un dato. Niveles que permita, además, conectarlo con otros datos directamente relacionados.

linked data.png

Imagen 3

Un ejemplo muy sencillo y llano: en una base de datos, se aplica un formato determinado para registrar la ciudad de Barcelona. Los usuarios que entren a esa base de datos podrán identificar Barcelona sin problemas gracias al formato aplicado y, además, podrán acceder desde ese registro a otras entidades (registradas con el mismo formato determinado) como Catalunya, Girona, Ciudad, Tarragona, Lleida, Mediterráneo, etc.

Con el Big, Open Data procesado y bien etiquetado, su potencial crece de manera exponencial.

Ya no se trata tanto de reunir información, sino de entenderla, conectarla y hacerla más útil. Si somos capaces de procesarla y relacionarla podremos comprenderla, y si la comprendemos nuestras decisiones serán cada vez no solo más fiables, sino también más rápidas.

Fijaos que hemos pasado de Big Data a Big, Open Linked Data.

Herramientas de visualización de datos

Existen cientos de herramientas en la red que nos permiten visualizar a nuestro antojo la pequeñísima porción de Big, Open Linked Data que hayamos seleccionado. Evidentemente, no todas valen para todo. Las hojas de cálculo de Excel con extremadamente útiles para cometidos numéricos, algebraicos y analíticos, pero la parte visual deja bastante que desear.

Entre las herramientas más potentes del mercado se encuentran las siguientes, todas ellas de pago, aunque algunas incluyen usos algo limitados de forma gratuita:

Tableau

Qlikview

FusionCharts

HighCharts

DataWrapper

Plotly

Sisense

Referencias

Álex Rayón (2016). “Del Open Data al Linked Open Data: sacando valor de los datos enlazados”. Deusto Data.

Del Open Data al Linked Open Data: sacando valor de los datos enlazados

Bernard Marr (2017). “The 7 Best Data Visualization Tools in 2017”. Forbes. https://www.forbes.com/sites/bernardmarr/2017/07/20/the-7-best-data-visualization-tools-in-2017/#135c8bad6c30

Joel Gurin, New York University (2014). “Big data and open data: what’s what and why does it matter?”. The Guardian. https://www.theguardian.com/public-leaders-network/2014/apr/15/big-data-open-data-transform-government

Imagen 1: Matt Clarke (2013). “Big Data Diary”. https://mattclarkecto.com/category/big-data/

Imagen 2: Joel Gurin (2014). “Driving Innovation With Open Data”. U.S. Chamber of Commerce Foundation. https://www.uschamberfoundation.org/driving-innovation-open-data

Imagen 3: WikiToLearn. “Linked Data Visualization”. https://en.wikitolearn.org/Course:How_to_use_Linked_Data/Interaction_with_Linked_Data/Linked_Data_Visualization


© Texto: Joan Marco

© Presente edición: Máster en Información Digital UPF-BSM

Este obra está bajo una licencia Creative Commons

Reconocimiento-NoComercial-SinObraDerivada 3.0 Unported