El Big Data es una forma de gestionar (almacenar, tratar y analizar) todos los datos que son generados en una compañía, los cuales sirven para identificar tendencias, mantener la relación marca-cliente, hacer investigaciones, resolver problemas complejos y/o determinar estrategias empresariales. Para ello es necesario el desarrollo y la implantación tanto de hardware como de software específicos que gestionen esta explosión de datos.
Pese a su complejidad, en la actualidad cualquier tipo de dato pueden ser analizado, pues si miramos a nuestro alrededor, vemos que todos los dispositivos que usamos generan datos (Internet, transacciones empresariales, biométrica, Internet de las cosas, etc). Estudios establecen que sólo el 20% se trata de información estructurada y el 80% son datos no estructurados. Estos últimos se hacen más complejos a la hora de almacenar y analizar.
De manera sorprendente, como lo describe la historia, el mundo no había dado la importancia que se merece la gestión de los datos:
Todo empezó a mediados de la década de 1970, cuando aparecieron los sistemas de Planificación de necesidades de material (MRP) como herramienta que ayudaba a las empresas a organizar la información. En este contexto se creo Oracle, SAP y JD Edwards. Fue Oracle la que presentó y comercializó el Lenguaje de consulta estructurado o SQL.
A principios de los 90, se dio el auge de los sistemas de Planificación de recursos empresariales (ERP), pues ofrecían la posibilidad de integrarse con todos los departamentos de la empresa. Pero fue hasta el año 2010, que empresas como: Netsuite y Lawson Software, adoptaron las tecnologías de nube para los sistemas ERP.
En 1992, Crystal Reports creó el primer informe de base de datos sencillo con Windows. Para ese año el término «Big Data» se empleó por primera vez en un artículo de los investigadores: Michael Cox y David Ellsworth, en el cual afirmaron: “el ritmo de crecimiento de los datos empieza a ser un problema para los sistemas informáticos actuales”. Esto se denominó el «problema del Big Data». Fuente: Application-Controlled Demand Paging for Out-of-Core Visualization.
Siete años después, en 1999 Peter Lyman y Hal R. de UC Berkeley publicaron otro estudio, titulado How Much Information? El cual cuantificaba, en términos de almacenamiento informático, la cantidad total de información nueva y original creada en el mundo al año.
En 2006 y hasta el día de hoy, se da una solución de código abierto para el Big Data, llamada Hadoop, un framework que permite el procesamiento distribuido de grandes cantidades de datos a través de clusters de ordenadores, usando un modelo simple de programación, para así procesar miles de millones de datos.
Realmente fue en el año 2008 que el término «Big Data» comenzó a utilizarse con cada vez más frecuencia en los círculos tecnológicos: «De la misma forma que los motores de búsqueda han cambiado la forma de acceder a la información, otras formas de informática de Big Data pueden transformar y transformarán las actividades de empresas, investigadores científicos, médicos y las operaciones de defensa e inteligencia de nuestra nación…” Big Data Computing: Creating Revolutionary Breakthroughs in Commerce, Science, and Society
En 2011, IBM introdujo la etiqueta de Twitter, #IBMbigdata.
Para el 2013, Las empresas empiezan a implementar nuevas tecnologías en memoria, para analizar y optimizar cantidades de datos masivos. Entre las soluciones más representativas están: SQL Server 2012 de Microsoft, SAP HANA de SAP, BigQuery de Google, Oracle Big Data Appliance de Oracle.
El futuro de Big Data: Los expertos apuntan a un aumento estimado del 4300% en la generación de datos anuales para 2020, provenientes en su mayoría de los smartphones, como lo afirma un estudio de Online Bussiness school (dic 2014) las conexiones a Internet desde dispositivos móviles llegarán a los 10.200 millones en 2018.
Otra tendencia es que el Big Data y la Nube se están volviendo inseparables: “se necesitan recursos en la nube para el almacenamiento y la ejecución de proyectos de Big Data, y el Big Data brinda a las compañías una buena ocasión de pasar a la nube”.( www.sascolombia.com.co).
Por último dejo las conclusiones más interesantes del estudio realizado por la Online Bussiness school (http://www.obs-edu.com) en diciembre de 2014, sobre el uso del Big Data en las empresas del mundo:
– El 38% de las empresas españolas aún no tienen puestas en marcha soluciones de Big Data.
– Las mayores inversiones en soluciones de Big Data se harán en Comercio, Manufacturación, Salud, Información y Comunicaciones, Banca y Finanzas, Seguros y Administración Pública.
– Japón es el país con mayor porcentaje de empresas sin iniciativas activas de Big Data (49%).
– Las empresas brasileñas son las que mayor confianza presentan en las tecnologías de Big Data con un 93% de sus empresas, seguido de las empresas mexicanas y colombianas (92%).