Los problemas de datos bloquean las iniciativas de IA/ML. Así es cómo se solucionan.

Casi el 90 % de los proyectos de IA/ML nunca llegan a producción. Conozca los principales retos a los que se enfrentarán los científicos de datos en 2021.

En 2020, los CIO y los equipos de TI se apresuraron a desarrollar capacidades digitales para satisfacer el aumento de la demanda en línea causada por la pandemia. En 2021, los líderes establecidos de la industria continúan sintiendo la urgencia de realizar la transición a lo digital a medida que los consumidores exigen mejores experiencias en línea.

La inteligencia artificial (IA) y el aprendizaje automático (ML) pueden acelerar enormemente el tiempo para comprender y adaptarse a las necesidades del cliente, pero solo si los datos están disponibles para construir y probar modelos. Acelerar el ritmo de la innovación digital y la IA/ML requieren una gran cantidad de datos de los sistemas empresariales principales y las aplicaciones orientadas al cliente. Si bien la mayoría de las empresas establecidas tienen volúmenes de datos, como muestra una encuesta reciente, la entrega lenta de datos a menudo anula la velocidad.

Una nueva encuesta realizada por Pulse sugiere que los datos son un obstáculo para los proyectos de IA/ML si no se cuenta con las herramientas de automatización y administración de datos adecuadas. Si bien esas iniciativas en muchos sentidos aún se encuentran en etapas preliminares, más empresas buscan aplicar IA/ML para optimizar las operaciones, aumentar el rendimiento y brindar una experiencia de cliente diferenciada.

De hecho, la IA/ML es una prioridad de cara a 2021 para la mayoría de los ejecutivos de TI. Pero el tamaño de la dispersión de los datos de las aplicaciones es un gran desafío, ya que los datos residen en varios lugares diferentes, incluidas las aplicaciones orientadas al cliente (48 %), los sistemas ERP (19%), y las aplicaciones financieras (19 %).

Los resultados de la encuesta muestran que cuatro de los cinco principales obstáculos para implementar iniciativas de IA/ML involucran datos.

Ellos incluyen:

  • Precisión de los datos (54 %)

  • Acceso a los datos (44 %)

  • Protección de datos personales y sensibles (43 %)

  • El tiempo que se tarda en actualizar los datos en los modelos (36 %)

Para superar estos desafíos, la automatización es clave para eliminar la entrega manual de datos, la actualización y los procesos de seguridad que bloquean la innovación. Una infraestructura de datos programable permite automatizar y administrar los datos a través de API. Las características de una infraestructura de datos programable incluyen:

  • Acceso y actualización de datos de la API

  • Descubrimiento y enmascaramiento automatizados de datos confidenciales para mitigar el riesgo de cumplimiento

  • Máquina del tiempo de datos inmutables para un registro continuo de cambios en los datos de origen que ofrece datos casi en tiempo real, además de datos históricos.

  • Control de versiones de datos fuente y de formación para análisis de la deriva conceptual

  • Enfoque de API-first para integrar operaciones de datos con herramientas de IA/ML

Por ejemplo, una de las empresas de ingeniería más importantes del mundo en la industria del petróleo y el gas está utilizando la infraestructura de datos programables (PDI) para brindar información y soluciones basadas en IA en sus instalaciones globales. El objetivo de la empresa es impulsar la gestión de riesgos, la eficiencia operativa y respaldar la toma de decisiones y la ejecución en tiempo real.

Con una infraestructura de datos programable, esta empresa de miles de millones de dólares obtiene de manera eficiente datos distribuidos en distintos sistemas y ubicaciones, que abarcan todo el mundo, desde América del Norte y del Sur hasta África, Oriente Medio y Asia. Los equipos pueden importar datos de entrenamiento de manera efectiva e implementar modelos de aprendizaje automático en la nube. PDI también le permite a la empresa entregar de manera continua y eficiente datos nuevos a una base de datos virtual casi en tiempo real, creando un enfoque flexible para los datos y brindando a los usuarios acceso a datos primarios para IA que se obtienen de sus sistemas comerciales más críticos.

Históricamente, cuanto más grande es la empresa, más lento es el ritmo del cambio. Si bien las empresas disruptivas, como las nacidas en la nube, a menudo tienen la ventaja de la rapidez en adoptar nuevas tecnologías, las empresas establecidas tienen grandes volúmenes de datos para alimentar las iniciativas de IA/ML y los recursos para contratar equipos de científicos de datos para sacar el máximo partido de esos datos.

Esto cambia el campo de juego, ya que las empresas más grandes pueden aprovechar la adopción de IA/ML más rápido no solo para mantener a los clientes actuales, sino también para cambiar más rápido hacia nuevas formas de interactuar con las cadenas de suministro y los socios. Incluso cuando el mundo vuelva a abrirse, prevalecerá lo digital, por lo que las inversiones en automatización de datos para iniciativas de IA/ML seguirán dando sus frutos.