7 predicciones para 2014 en el universo de los datos
Se acercan unas fechas señaladas en las que, al margen de hacer balance del año que acaba, es momento de practicar uno de los deportes favoritos de la industria: realizar predicciones.
El 2014 estará marcado por 7 tendencias en lo que respecta al universo de los datos:
- El concepto `Big Data´ perderá relieve: aunque parezca increíble, el término `Big Data´ no resonará tanto como estos últimos años, aunque por supuesto los volúmenes de datos no cesarán de crecer. Para finales de 2014 volveremos a llamarles simplemente datos históricos, aunque seguiremos nadando entre océanos de información. Es decir, el crecimiento de los datos seguirá siendo un gran problema o una gran oportunidad, según se mire.
- El año de las Apps: en 2014 observaremos un incremento significativo en el uso de apps analíticas en comparación con el empleo de herramientas tradicionales de análisis de información. Pero no estamos hablando de las “aplicaciones analíticas” que desarrollan los fabricantes, y que traen consigo modelos de datos estándar y paquetes de reporting universales. Sino de apps como las que tenemos en nuestros móviles: ligeras, interactivas, orientadas al negocio y fáciles de usar sin necesidad de formación. Esas son las clases de apps que la gente quiere emplear. Si se obtienen resultados satisfactorios en este campo, desde un punto de vista de velocidad y flexibilidad, la suerte estará echada para las herramientas analíticas tradicionales, cada vez más difíciles de justificar.
- El advenimiento de las máquinas: muchos expertos que discuten sobre Big Data se centran en datos desestructurados, generados por los seres humanos, como los provenientes de las redes sociales. De acuerdo, continuaremos observando énfasis en este campo. Si bien, el próximo año adquirirán más relevancia los datos generados por las máquinas (incluidos los provenientes del `Internet de las Cosas´), que crecerán más rápido que cualquier otra fuente de Big Data empleada para propósitos analíticos. Esta realidad será especialmente fehaciente en los sectores de industria y salud.
- `Data Steward´ será el próximo puesto de trabajo en el universo TI: el cargo de `Data Scientist´ (Científico de los Datos) dio bastante que hablar en 2013, pero teniendo en cuenta que los volúmenes de datos seguirán creciendo de manera imparable en el seno de las empresas, se habrá de poner más énfasis en la gestión y supervisión de la información, y no sólo en la parcela científica. Como consecuencia, emergerán nuevos puestos como el de `Data Steward´ (Gestor de los Datos), que, en definitiva, no deja de ser un profesional con perfil de negocio que entienda los datos y sepa cómo cualificarlos en el curso de un proyecto.
- El ascenso del `data discovery´ de datos integrados: las herramientas de `data discovery´ han cosechado un éxito relevante en la industria durante los últimos años, lo que ha revertido en pingües beneficios para los proveedores de este tipo de tecnología. Si bien, cada vez existe más frustración entre los usuarios de herramientas estancas de `data discovery´. Muchos de ellos desconocen cómo manipular los datos para obtener los resultados esperados; y en numerosas ocasiones se encuentran con que el dato no proviene del sistema adecuado, contiene errores o no se halla en el formato apto para su integración con otros datos. Para prevenir este tipo de situaciones, los proveedores deberán ser capaces de integrar los datos de confianza de sus clientes con los programas de visualización existentes.
- La calidad del dato, un problema en aumento: el número de incidencias en materia de integridad de la información crecerá de manera significativa, especialmente en lo que concierne a la analítica del Big Data. Teniendo en cuenta que cada vez más organizaciones están tomando sus decisiones estratégicas en base a datos puros, esta problemática irá en aumento. Consideramos que en 2014 el foco sobre la calidad de los datos se intensificará de manera notable.
- Convergencia analítica: la convergencia de la analítica predictiva, el `data discovery´, los sistemas de información geográfica (GIS) y otras soluciones de analítica comandarán la nueva era de la automatización analítica a través del aprendizaje automático, el ETL inteligente y otros procesos automatizados. Diferentes tecnologías están virando en la misma dirección, pero cabe destacar dos ejemplos. En primer lugar, los analistas se están encontrando con la existencia de grandes volúmenes de datos, inservibles en sí mismos, y se están viendo obligados a extraer los subconjuntos más relevantes para poder desarrollar algún tipo de análisis. Gracias a la convergencia de la analítica estadística con las funcionalidades de ETL y extracción de datos, los analistas podrán hacer uso de la precisión de la analítica predictiva para discernir qué conjuntos de datos deben extraer. Por otro lado, las tecnologías de aprendizaje automático están aunando grandes conjuntos de datos y situándolos en grupos pre-agregados para que los científicos de datos tengan la posibilidad de analizarlos de manera más óptima y rápida.