Término que describe un gran volumen de datos, estructurados como no estructurados.
Cuando hablamos de Big Data nos referimos a conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales.
Aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo, la mayoría de los analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.
Dicho de otro modo, el big data está formado por conjuntos de datos de mayor tamaño y más complejos, especialmente procedentes de nuevas fuentes de datos como los web logs, las redes sociales como Facebook, computadoras portátiles, teléfonos inteligentes entre otros.
¿Qué son las 5V?
Volumen
Se tiene que que procesar grandes volúmenes de datos no estructurados de baja densidad.
Velocidad
Se refiere al ritmo en el que se reciben los datos que cada vez es mayor.
Variedad
Asociado al tipo de información estructurada, no estructurada y semiestructurada.
Veracidad
Apunta a tener la certeza de que los datos que se están procesando sean verídicos.
Valor
Es el valor que generan los datos que una vez convertidos en información le brindan a las empresas la oportunidad de sacar el máximo partido a los datos para introducir mejoras en su organización.
Importancia del Big Data
Reducción de costos
Rapidez
Mejora en la toma de decisiones
Identificar nuevas oportunidades
Identificar mejora de procesos
Identificar las necesidades de los clientes
Innovación
Mantenimiento predictivo
Fases del ciclo de vida del Big Data
Análisis interno
Recogida y filtrado de datos
Extracción de datos
Validación y limpieza de los datos
Análisis de los datos
Visualización de los datos
Comments