·
¿Qué es Big Data?
En términos
generales es la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma
de decisiones, la cual es utilizada para describir enormes cantidades de datos
(estructurados, no estructurados y semi estructurados) que tomaría demasiado
tiempo y sería muy costoso cargarlos a un base de datos relacional para su
análisis. De tal manera que, el concepto de Big Data aplica para toda aquella
información que no puede ser procesada o analizada utilizando procesos o
herramientas tradicionales.
Un alto volumen de datos puede provocar
un problema de almacenamiento, pero tener demasiados tipos de datos,
principalmente procedentes de los nuevos medios de comunicación social y móvil,
también genera problemas a la hora de realizar análisis masivos de esta
información por ejemplo: dispositivos móviles, audio, video, sistemas GPS,
incontables sensores digitales en equipos industriales, automóviles, medidores
eléctricos, veletas, anemómetros, etc., los cuales pueden medir y comunicar el
posicionamiento, movimiento, vibración, temperatura, humedad y hasta los
cambios químicos que sufre el aire, de tal forma que las aplicaciones que
analizan estos datos requieren que la velocidad de
respuesta sea lo demasiado rápida para lograr obtener la información correcta
en el momento preciso. Estas son las características principales de una
oportunidad para Big Data.
·
¿De dónde proviene toda esa información?
Los seres humanos estamos creando
y almacenando información constantemente y cada vez más en cantidades
astronómicas. La acumulación masiva de datos la podemos encontrar en diversas
industrias, las compañías mantienen grandes cantidades de datos
transaccionales, reuniendo información acerca de sus clientes, proveedores,
operaciones, etc. En muchos países se administran enormes bases de datos que contienen
datos de censo de población, registros médicos, impuestos, etc., y si a todo
esto le añadimos transacciones financieras realizadas en línea o por
dispositivos móviles, análisis de redes sociales (en Twitter son cerca de 12
Terabytes de tweets creados diariamente y Facebook almacena alrededor de 100
Petabytes de fotos y videos), ubicación geográfica mediante coordenadas GPS, en
otras palabras, todas aquellas actividades que la mayoría de nosotros
realizamos varias veces al día con nuestros "smartphones", estamos
hablando de que se generan alrededor de 2.5 quintillones de bytes diariamente
en el mundo, donde 1 quintillón = 10 30.
De acuerdo con un estudio
realizado por Cisco, entre el 2011 y el 2016 la cantidad de tráfico de datos
móviles crecerá a una tasa anual de 78%, así como el número de dispositivos
móviles conectados a Internet excederá el número de habitantes en el planeta.
Las naciones unidas proyectan que la población mundial alcanzará los 7.5
billones para el 2016 de tal modo que habrá cerca de 18.9 billones de
dispositivos conectados a la red a escala mundial, esto conllevaría a que el
tráfico global de datos móviles alcance 10.8 Exabytes mensuales o 130 Exabytes
anuales.
·
Tipos de datos de Big Data
1.- Web and Social Media:
Incluye contenido web e información que es obtenida de las redes sociales como
Facebook, Twitter, LinkedIn, etc, blogs.
2.- Machine to Machine(M2M):
M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos.
M2M utiliza dispositivos como sensores o medidores que capturan algún evento en
particular (velocidad, temperatura, presión, variables meteorológicas,
variables químicas como la salinidad, etc.) los cuales transmiten a través de
redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen
estos eventos en información significativa.
3.- Big TransactionData:
Incluye registros de facturación, en telecomunicaciones registros detallados de
las llamadas (CDR), etc. Estos datos transaccionales están disponibles en
formatos tanto semiestructurados como no estructurados.
4.- Biometrics:
Información biométrica en la que se incluye huellas digitales, escaneo de la
retina, reconocimiento facial, genética, etc. En el área de seguridad e
inteligencia, los datos biométricos han sido información importante para las
agencias de investigación.
5.- Human Generated: Las
personas generamos diversas cantidades de datos como la información que guarda
un call center al establecer una llamada telefónica, notas de voz, correos
electrónicos, documentos electrónicos, estudios médicos, etc.
·
Big Data y el campo de
investigación
Esta explosión de "grandes
datos" está transformando la manera en que se conduce una investigación
adquiriendo habilidades en el uso de Big Data para resolver problemas complejos
relacionados con el descubrimiento científico, investigación ambiental y
biomédica, educación, salud, seguridad nacional, entre otros.
Ø El Instituto
de Tecnología de la Universidad de Ontario (UOIT) junto con el Hospital de
Toronto utilizan una plataforma de big data para análisis en tiempo real de IBM
(IBM InfoSphereStreams), la cual
permite monitorear bebés prematuros en las salas de neonatología para
determinar cualquier cambio en la presión arterial, temperatura, alteraciones
en los registros del electrocardiograma y electroencefalograma, etc., y así
detectar hasta 24 horas antes aquellas condiciones que puedan ser una amenaza
en la vida de los recién nacidos.
Ø Los laboratorios PacificNorthwestNationalLabs(PNNL)
utilizan de igual manera IBM InfoSphereStreamspara analizar
eventos de medidores de su red eléctrica y en tiempo real verificar aquellas
excepciones o fallas en los componentes de la red, logrando comunicar casi de
manera inmediata a los consumidores sobre el problema para ayudarlos en
administrar su consumo de energía eléctrica.
Con la capacidad de generar toda
esta información valiosa de diferentes sistemas, las empresas y los gobiernos
están lidiando con el problema de analizar los datos para dos propósitos
importantes: ser capaces de detectar y responder a los acontecimientos actuales
de una manera oportuna, y para poder utilizar las predicciones del aprendizaje
histórico. Esta situación requiere del análisis tanto de datos en movimiento
(datos actuales) como de datos en reposo (datos históricos), que son
representados a diferentes y enormes volúmenes, variedades y velocidades.
No hay comentarios:
Publicar un comentario