La ciencia de datos gira en torno a un proceso de 4 etapas: comprensión del negocio, recopilación/procesamiento de datos, modelado y despliegue. En los últimos años, cada una de estas etapas ha experimentado cambios fundamentales, siendo la recopilación de datos la más notable debido al auge de los macrodatos.
En lo que respecta a las fases de modelización y despliegue, la práctica más habitual hasta la fecha consiste en realizar el análisis de los datos localmente en la máquina del investigador. El modelo resultante se despliega posteriormente y se aplica a lotes de datos nuevos. A continuación, se genera el resultado: un informe con las conclusiones del análisis. Normalmente, cada 6-12 meses se vuelve a estimar el modelo con nuevos datos, para mantenerlo actualizado.

Al igual que la fase de recopilación de datos, las fases posteriores de modelización y despliegue también han entrado en una nueva era, que abre enormes oportunidades para una toma de decisiones ágil. El cambio fundamental en las nuevas formas de analizar e informar sobre los datos es posible gracias a la computación en nube y a los cuadros de mando en línea. La "nube" se refiere a un conjunto compartido de recursos informáticos que existen en una ubicación física denominada "centros de datos", repartidos por todo el mundo. Los usuarios de la computación en nube pueden ejecutar modelos en tiempo real y actualizarlos instantáneamente cada vez que llegan nuevos lotes de datos. A día de hoy, los 3 principales actores de la nube son: Amazon Web Services, Microsoft Azure y Google Cloud Platform.
Además, la conexión directa entre la nube y los cuadros de mando en línea permite que los informes se actualicen automáticamente al minuto. En el Informe de Investigación y Tendencias de GreenBook (GRIT) de 2021, los cuadros de mando en línea se están convirtiendo en un elemento básico y de máxima prioridad entre los proveedores, ya que los compradores siguen exigiendo rapidez, acceso en tiempo real a los datos/insights y visualizaciones interactivas. Muchos de nuestros clientes, que son innovadores en el sector de la información, optan cada vez más por los cuadros de mando interactivos frente a los métodos tradicionales de elaboración de informes estáticos.

El futuro empezó ayer
Las organizaciones que aprovechan la computación en nube, los informes en tiempo real y advanced analytics predictivos advanced analytics se encuentran claramente más avanzadas en su viaje hacia los "grandes datos". Estas empresas suelen tener equipos de insights o de ciencia de datos con gran competencia analítica. Hay transparencia y armonización entre conjuntos de datos (y departamentos). Ya no se basan en conjuntos de datos individuales, sino que utilizan técnicas analíticas de fusión o integración de datos para elaborar predicciones más precisas y fiables.
De hecho, actualmente todas las empresas se han movido o quieren moverse hacia este entorno, y alejarse del de los silos. La razón es que este entorno permite a las empresas reconocer rápidamente las tendencias del mercado, predecir las consecuencias y adaptar las estrategias en consecuencia. Es la toma de decisiones ágil en acción.
Tenemos una visión de primera fila para ver cómo algunos de nuestros clientes están aprovechando la tecnología y la analítica de fusión de datos para capitalizar las oportunidades y acelerar el crecimiento. Como analogía, si estuviéramos en una carrera de coches, el coche con motor de computación en nube iría a 200 km/h de velocidad de crucero con facilidad, mientras que el resto tendría dificultades para alcanzar siquiera la mitad de su velocidad. En un mundo en el que si te duermes pierdes, los que no puedan seguir el ritmo sin duda quemarán motores.
Autores:

Analista principal

Senior Manager Analytics

Senior Manager Analytics
