Lo que dice el académico es lo que dice todo informático informado de la tecnología Big Data. Siendo una herramienta poderosa, es también un termino de moda, al cual el marketing ha sabido sacarle buen provecho, dada la ignorancia generalizada sobre el tema. Trataré de ponerlo en simple (para el que se quiera dar la paja).
Tal como dice su nombre, Big data refiere a un gran volumen de datos. Desde ahí partimos con ambigüedades. ¿Cuanto es una gran cantidad? Para el Big Data Verdadero, estamos hablando de terabytes o petabytes. Luego algunos comenzaron a hablar que es cuando se supera la cantidad de información que una organización puede manejar (acá ya vemos como se mete el negocio en el cuento). Y tiene bastante sentido que le hayan dado esta ultima denominación. Consideremos el caso Chileno. En Chile las únicas industrias que requieren Big Data de verdad son la minera, astronómica, aeronáutica y si se presiona, energías limpias (eólica). El resto no tiene ni de cerca la necesidad de este sistema. Hasta acá hemos cubierto solo una "V" (los autores mas reconocidos hablan desde las 4 V's, hasta las 10 (y se siguen agregando)). Estas V's se refieren a Volumen, Variedad, Veracidad y Velocidad (luego se agregan Valor, Variabilidad, Validez, Vulnerabilidad, Volatilidad, Visualización). Si solo consideramos las 4 principales, obviamente el sistema no es comercializable. ¿Como le dices a un Banco local, que su nivel de transacciones no cumple las condiciones para ser considerado Big Data y no puede estar en la "cresta de la ola" tecnológica? o las empresas que transan en la Bolsa? o a nuestro sistema de transporte? Su sentido de orgullo empresarial se va a la cresta.
Ahora si pasamos a las redes sociales, se puede considerar Big data? Para las empresas involucradas si, para lo que hizo el gobierno, no. Simplemente analizaron un set de datos (Quizás y digamos siendo muuuuy optimistas, analizaron 50 millones de registros (considerando que un hashtag tendencia local puede llegar a 100.000 posteos, siendo marginal los que se acercan y superan este numero)), siendo muy generosos. Las fuentes de información son archivos planos, por tanto no se analizan videos y fotografías. Ya en el análisis mas duro del discurso del presidente, estas fuentes no entregan IPs, sino información de georeferencia.
En definitiva, cuando se habla de Big Data, hay que diferenciar si se habla desde la perspectiva informática o desde la perspectiva comercial, siendo esta ultima mucho mas laxa respecto al termino y sus utilizaciones.