Si usted se encuentra en el negocio de la tecnología, más concretamente en el de la información, probablemente reciba un mínimo de 10 emails a la semana donde el término Big Data es el protagonista. Se ha generado un intenso debate sobre los pros y contras, sobre los hechos reales que rodean a este fenómeno. Habitualmente se habla de los ingentes volúmenes de datos a los que deben hacer frente las compañías. Pero la clave estriba en la relación que asocia analítica con Big Data, aquella analítica que permite extraer conclusiones a través del análisis de los datos y hace posible la toma de decisiones fundamentadas, señala en un artículo Manuel del Pino, gerente de Preventa de Information Builders para México, España y Portugal
Si usted se encuentra en el negocio de la tecnología, más concretamente en el de la información, probablemente reciba un mínimo de 10 emails a la semana donde el término Big Data es el protagonista. Se ha generado un intenso debate sobre los pros y contras, sobre los hechos reales que rodean a este fenómeno. Habitualmente se habla de los ingentes volúmenes de datos a los que deben hacer frente las compañías. Pero la clave estriba en la relación que asocia analítica con Big Data, aquella analítica que permite extraer conclusiones a través del análisis de los datos y hace posible la toma de decisiones fundamentadas, señala en un artículo Manuel del Pino, gerente de Preventa de Information Builders para México, España y Portugal
Numerosos expertos consideran que el principal reto que se desprende del Big Data no tiene tanto que ver con el volumen de los datos, como con su naturaleza desestructurada. Cuando se habla de fuentes de datos desestructurados –aquellos que están repartidos en documentos de procesadores de texto, hojas de cálculo, imágenes y vídeos que no se pueden recuperar o interpretar fácilmente-, habitualmente se piensa en las redes sociales. Si bien, hay otras muchas más fuentes de datos textuales con estas características, que, de ser analizados, pueden revelar interesantes conclusiones (como un reconocimiento médico, el certificado de un servicio técnico, los registros de un call center, etc.). Cada organización cuenta con un tipo distinto de datos textuales que debería estar analizando. ¿Cuál es el suyo?
Nube de etiquetas
El motivo de que estos datos no se hayan tocado durante años estriba en que las empresas no han podido analizarlos de manera efectiva hasta la fecha. Una de las mejores herramientas que existen hoy día para analizar los datos textuales es la nube de etiquetas. Una nube de etiquetas o de palabras es un modelo de visualización habitualmente empleado para representar la frecuencia de términos que se desprenden de un conjunto de datos textuales. Las etiquetas se constituyen habitualmente por palabras individuales cuya relevancia se dictamina por el tamaño o el color de la fuente.
La nube de etiquetas es una vía efectiva para comprender los asuntos más populares que se desprenden del análisis de grandes volúmenes de datos textuales. El siguiente ejemplo es paradigmático: pongamos que la página en Facebook de mi compañía cuenta con 12.000 entradas y comentarios. Si yo fuera el encargado de leer y analizar esa inmensa cantidad de datos, preferiría poder emplear una nube de etiquetas para comprender el cariz general de la conversación, y tener la posibilidad de realizar un informe que me aporte una serie de pistas relevantes sobre las cuestiones más significativas que me interesan.