Un reinicio de la IA generativa: Reconfiguración para convertir el potencial en valor en 2024

| Artículo

Nota: Hacemos nuestro mejor esfuerzo por preservar el espíritu original y los matices de nuestros artículos. Sin embargo, nos disculpamos de antemano por cualquier falla de traducción que pueda notar. Agradecemos sus comentarios en reader_input@mckinsey.com

Es hora de reiniciar la inteligencia artificial (IA) generativa. El entusiasmo inicial y el frenesí de actividad en 2023 están dando paso a dudas y recalibraciones a medida que las empresas se dan cuenta de que capturar el enorme valor potencial de la IA generativa es más difícil de lo esperado.

Dado que 2024 se perfila como el año en que la IA generativa demostrará su valor, las empresas deben tomar en cuenta las duras lecciones aprendidas con las transformaciones digitales y de IA: la ventaja competitiva proviene de la creación de capacidades organizativas y tecnológicas para innovar, implementar y mejorar ampliamente las soluciones a escala, reconfigurando el negocio para la innovación digital y de IA distribuida.

Las empresas que busquen obtener victorias tempranas con la IA generativa deben actuar con rapidez. Pero las que esperen que la IA generativa ofrezca un atajo para superar la dura –y necesaria– cirugía organizacional, probablemente obtendrán resultados decepcionantes. Poner en marcha proyectos piloto es (relativamente) fácil; conseguir que se amplíen y generen un valor significativo es difícil porque requieren un amplio conjunto de cambios en la forma en que se realiza el trabajo.

Veamos brevemente lo que esto ha supuesto para una empresa de telecomunicaciones de la región del Pacífico. La empresa contrató a un director de datos e IA con el mandato de “habilitar a la organización para crear valor con datos e IA”. Este director trabajó con la empresa para desarrollar la visión estratégica e implementar la hoja de ruta para los casos de uso. Después de un análisis de los dominios (es decir, los recorridos o las funciones de los clientes) y las oportunidades de casos de uso en toda la empresa, el liderazgo dio prioridad al dominio de servicio/mantenimiento doméstico para ponerlo a prueba y luego escalarlo como parte de una secuencia más amplia de iniciativas. Se centraron, en particular, en el desarrollo de una herramienta de IA generativa para ayudar a los expedidores y operadores de servicios a predecir mejor los tipos de llamadas y piezas necesarias para el mantenimiento de los hogares.

El liderazgo estableció equipos de productos interfuncionales con objetivos e incentivos compartidos para desarrollar la herramienta de IA generativa. Como parte de un esfuerzo para elevar las cualificaciones de toda la empresa para trabajar mejor con datos y herramientas de IA generativa, también crearon una academia de datos e IA, en la que se inscribieron los expedidores y operadores de servicios como parte de su capacitación. Para proporcionar la tecnología y los datos que sustentan la IA generativa, el director de datos e IA también seleccionó un gran modelo de lenguaje (large language model, o LLM) y un proveedor de nube que pudiera satisfacer las necesidades del dominio, así como servir a otras partes de la empresa. El director de datos e IA también supervisó la implementación de una arquitectura de datos para que los datos limpios y fiables (incluidos los historiales de servicio y las bases de datos de inventario) necesarios para crear la herramienta de IA generativa pudieran entregarse de manera rápida y responsable.

Más perspectivas de McKinsey en Español

Mire nuestra colección de artículos en Español y suscríbase a nuestro newsletter mensual en Español.

Navegue por la colección

Nuestro libro Rewired: The McKinsey Guide to Outcompeting in the Age of Digital and AI (Wiley, junio de 2023) ofrece un manual detallado sobre las seis capacidades necesarias para lograr el tipo de cambio amplio que aprovecha la tecnología digital y de IA. En este artículo, exploraremos cómo ampliar cada una de esas capacidades para implementar con éxito un programa de IA generativa a gran escala. Si bien reconocemos que aún estamos en los primeros días y que queda mucho por aprender, nuestra experiencia ha demostrado que para aprovechar la oportunidad de la IA generativa es necesario que las empresas reconfiguren su forma de trabajar de las siguientes maneras.

Descubra dónde los copilotos de IA generativa pueden proporcionarle una ventaja competitiva real

El gran entusiasmo en torno a la IA generativa y su relativa facilidad de uso ha dado lugar a un estallido de experimentación en todas las organizaciones. Sin embargo, la mayoría de estas iniciativas no generarán una ventaja competitiva. Un banco, por ejemplo, compró decenas de miles de licencias de GitHub Copilot, pero como no tenía una idea clara de cómo trabajar con la tecnología, el progreso fue lento. Otro esfuerzo desenfocado que vemos a menudo es cuando las empresas deciden incorporar la IA generativa a sus capacidades de servicio al cliente. Para la mayoría de las empresas, el servicio al cliente es una capacidad básica que no forma parte de su actividad principal. Aunque en estos casos la IA generativa puede ayudar a aumentar la productividad, no creará una ventaja competitiva.

Para crear una ventaja competitiva, las empresas primero deben entender la diferencia entre ser un “tomador” (“taker”) —un usuario de las herramientas disponibles, a menudo a través de una interfaz de programación de aplicaciones (application programming interface, o API) y servicios de suscripción—, un “moldeador” (“shaper”) —un integrador de los modelos disponibles con datos propios— y un “creador” (“maker”) —un constructor de LLM—. Por ahora, el enfoque del “creador” es demasiado caro para la mayoría de las empresas, por lo que el punto ideal es implementar un modelo de “tomador” para mejorar la productividad mientras se crean aplicaciones de “moldeador” para obtener una ventaja competitiva.

Gran parte del valor a corto plazo de la IA generativa está estrechamente ligado a su capacidad para ayudar a las personas a hacer mejor su trabajo actual. De esta manera, las herramientas de IA generativa actúan como copilotos que trabajan codo a codo con un empleado, creando un bloque inicial de código que un desarrollador puede adaptar, por ejemplo, o redactando una orden de requisición para una nueva pieza que un trabajador de mantenimiento sobre el terreno puede revisar y enviar (véase el recuadro: “Ejemplos de copilotos en tres arquetipos de IA generativa”). Esto significa que las empresas deberían centrarse en los aspectos en los que la tecnología copiloto puede tener un mayor impacto en sus programas prioritarios.

Algunas empresas industriales, por ejemplo, han identificado el mantenimiento como un ámbito crítico para su negocio. Revisar los informes de mantenimiento y pasar tiempo con los trabajadores de primera línea puede ayudar a determinar dónde un copiloto de IA generativa podría marcar una gran diferencia, como en la identificación rápida y temprana de problemas con fallas en los equipos. Un copiloto de IA generativa también puede ayudar a identificar las causas de raíz de las averías de los camiones y recomendar soluciones mucho más rápido de lo habitual, además de actuar como una fuente continua de mejores prácticas o procedimientos operativos estándar.

El desafío con los copilotos es averiguar cómo generar ingresos a partir de una mayor productividad. En el caso de los centros de atención al cliente, por ejemplo, las empresas pueden dejar de contratar nuevos agentes y utilizar la pérdida de personal para lograr potencialmente ganancias financieras reales. Por lo tanto, definir de antemano los planes para generar ingresos a partir del aumento de la productividad es crucial para capturar el valor.

Mejore el talento que tiene, pero tenga claras las habilidades específicas de IA generativa que necesita

A estas alturas, la mayoría de las empresas tienen una comprensión decente de las competencias técnicas de IA generativa que necesitan, como el ajuste de modelos, la administración de bases de datos vectoriales, la ingeniería prompt y la ingeniería contextual. En muchos casos, se trata de habilidades en las que puede capacitar a sus empleados actuales. Los que ya cuentan con capacidades de IA y aprendizaje automático (machine learning, o ML) tienen una gran ventaja. Los ingenieros de datos, por ejemplo, pueden aprender procesamiento multimodal y gestión de bases de datos vectoriales, los ingenieros de MLOps (operaciones de ML) pueden ampliar sus habilidades a LLMOps (operaciones de LLM), y los científicos de datos pueden desarrollar habilidades de ingeniería prompt, detección de sesgos y ajuste fino.

El proceso de aprendizaje puede llevar de dos a tres meses para alcanzar un nivel de competencia decente, debido a las complejidades de aprender qué pueden y qué no pueden hacer los distintos LLM y cuál es la mejor manera de utilizarlos. Por ejemplo, los codificadores deben adquirir experiencia en la creación de software, pruebas y validación de respuestas. Una empresa de servicios financieros tardó tres meses en formar a sus mejores científicos de datos hasta alcanzar un alto nivel de competencia. Si bien hay cursos y documentación disponibles –muchos proveedores de LLM tienen campamentos de entrenamiento para desarrolladores–, hemos descubierto que la manera más eficaz de desarrollar capacidades a gran escala es a través de un enfoque de aprendices, capacitando a personas para que luego capaciten a otras, y de la creación de comunidades de profesionales. La rotación de expertos en los equipos para formar a otros, la programación de sesiones periódicas para que las personas compartan lo aprendido y la organización de sesiones quincenales de revisión de documentación son prácticas que han demostrado ser exitosas en la creación de comunidades de profesionales (véase el recuadro: “Una muestra de las nuevas competencias necesarias para la IA generativa”).

Es importante tener en cuenta que el éxito de las habilidades de IA generativa va más allá del dominio de la codificación. Nuestra experiencia en el desarrollo de nuestra propia plataforma de IA generativa, Lilli, nos demostró que los mejores talentos técnicos de IA generativa tienen habilidades de diseño para descubrir dónde enfocar las soluciones, comprensión contextual para garantizar que se generen las respuestas más relevantes y de alta calidad, habilidades de colaboración para trabajar bien con expertos en conocimiento (para probar y validar respuestas y desarrollar un enfoque de curaduría apropiado), sólidas habilidades forenses para descubrir las causas de los fallos (¿el problema son los datos, la interpretación de la intención del usuario, la calidad de los metadatos en las incrustaciones o algo más?), y habilidades de anticipación para concebir y planear posibles resultados e introducir el tipo de seguimiento adecuado en su código. Un codificador puro que no posea intrínsecamente estas habilidades puede no ser un miembro tan útil del equipo.

Si bien la actual mejora de habilidades se basa en gran medida en un enfoque de “aprendizaje en el trabajo”, vemos un rápido surgimiento de un mercado para las personas que han aprendido estas habilidades en el último año. Este crecimiento de habilidades está avanzando rápidamente. GitHub informó de que los desarrolladores estaban trabajando en proyectos de IA generativa “en grandes cantidades”, y que en 2023 se crearon 65,000 proyectos públicos de IA generativa en su plataforma, un aumento de casi el 250 por ciento respecto al año anterior. Si su empresa recién está comenzando su recorrido de IA generativa, podría considerar contratar a dos o tres ingenieros senior que hayan creado un producto moldeador de IA generativa para sus empresas. Esto podría acelerar enormemente sus esfuerzos.

Forme un equipo centralizado para establecer normas que permitan una ampliación responsable

Para garantizar que todas las partes de la empresa puedan ampliar las capacidades de IA generativa, centralizar las competencias es un primer paso natural. El enfoque fundamental de este equipo central será desarrollar e implementar protocolos y normas para apoyar la ampliación, garantizando que los equipos puedan acceder a los modelos al tiempo que se minimizan los riesgos y se contienen los costos. El trabajo del equipo podría incluir, por ejemplo, adquirir modelos y prescribir formas de acceder a ellos, desarrollar normas para la preparación de datos, crear bibliotecas de prompts aprobados y asignar recursos.

Mientras se desarrollaba Lilli, nuestro equipo tenía la mente puesta en la escala cuando creó una arquitectura de complementos abierta y estableció estándares sobre cómo deberían funcionar y construirse las APIs. Desarrollaron herramientas e infraestructura estandarizadas en las que los equipos podían experimentar de forma segura y acceder a un LLM de GPT, una puerta de enlace con APIs preaprobadas a las que los equipos podían acceder, y un portal de desarrolladores de autoservicio. Nuestro objetivo es que este enfoque, con el tiempo, pueda ayudar a cambiar “Lilli como producto” (que un puñado de equipos utiliza para crear soluciones específicas) a “Lilli como plataforma” (a la que los equipos de toda la empresa pueden acceder para crear otros productos).

Para los equipos que desarrollan soluciones de IA generativa, su composición será similar a la de los equipos de IA, pero con ingenieros y científicos de datos con experiencia en IA generativa y más colaboradores de las funciones de gestión de riesgos, cumplimiento y jurídica. La idea general de dotar a los equipos con recursos federados de las diferentes áreas de especialización no cambiará, pero sí lo hará la composición de habilidades en un equipo intensivo en IA generativa.

Configure la arquitectura tecnológica para llevarla a gran escala

Construir un modelo de IA generativa suele ser relativamente sencillo, pero hacerlo plenamente operativo a gran escala es un asunto totalmente diferente. Hemos visto a ingenieros crear un chatbot básico en una semana, pero lanzar una versión estable, precisa y que cumpla las normas a gran escala puede llevar cuatro meses. Por eso, según nuestra experiencia, los costos reales del modelo pueden ser inferiores al 10 a 15 por ciento de los costos totales de la solución.

Construir para llevar a gran escala no significa construir una nueva arquitectura tecnológica. Pero sí significa centrarse en unas pocas decisiones básicas que simplifiquen y aceleren los procesos sin gastar mucho dinero. Destacan tres de estas decisiones:

  • Centrarse en reutilizar la tecnología. La reutilización de código puede aumentar la velocidad de desarrollo de casos de uso de IA generativa entre un 30 y un 50 por ciento. Un buen enfoque consiste simplemente en crear una fuente de herramientas, código y componentes aprobados. Una empresa de servicios financieros, por ejemplo, creó una biblioteca de herramientas de nivel de producción, que habían sido aprobadas por los equipos de seguridad y jurídico, y las puso a disposición de los equipos en una biblioteca. Más importante es tomarse el tiempo para identificar y desarrollar las capacidades que son comunes en los casos de uso más prioritarios. La misma empresa de servicios financieros, por ejemplo, identificó tres componentes que podrían reutilizarse en más de 100 casos de uso identificados. Al crearlos primero, pudieron generar una parte significativa del código base para todos los casos de uso identificados, lo que supuso una gran ventaja para todas las aplicaciones.
  • Centrar la arquitectura en permitir conexiones eficientes entre los modelos de IA generativa y los sistemas internos. Para que los modelos de IA generativa funcionen eficazmente en el arquetipo del moldeador, necesitan acceder a los datos y las aplicaciones de una empresa. Los avances en los marcos de integración y orquestación han reducido significativamente el esfuerzo necesario para establecer esas conexiones. Pero definir cuáles son esas integraciones y cómo habilitarlas es fundamental para garantizar que estos modelos funcionen de manera eficiente y evitar la complejidad que genera una “deuda técnica” (el “impuesto” que paga una empresa en términos de tiempo y recursos necesarios para solucionar los problemas tecnológicos existentes). Los directores de información y los directores de tecnología pueden definir arquitecturas de referencia y normas de integración para sus organizaciones. Los elementos clave deben incluir un centro de modelos, que contenga modelos entrenados y aprobados que puedan suministrarse bajo demanda; APIs estándar que actúen como puentes que conecten los modelos de IA generativa con las aplicaciones o los datos; y gestión del contexto y almacenamiento en caché, que aceleren el procesamiento proporcionando a los modelos información relevante de las fuentes de datos empresariales.
  • Aumentar la capacidad de pruebas y control de calidad. Nuestra propia experiencia en la creación de Lilli nos enseñó a dar prioridad a las pruebas sobre el desarrollo. Nuestro equipo invirtió no solo en desarrollar protocolos de pruebas para cada fase de desarrollo, sino también en alinear a todo el equipo para que, por ejemplo, quedara claro quién tenía que aprobar específicamente cada etapa del proceso. Esto ralentizó el desarrollo inicial, pero aceleró el ritmo de entrega y la calidad en general al reducir los errores y el tiempo necesario para corregirlos.

Garantice la calidad de los datos y céntrese en los datos no estructurados para alimentar sus modelos

La capacidad de una empresa para generar y aumentar el valor a partir de modelos de IA generativa dependerá de lo bien que aproveche sus propios datos. Al igual que ocurre con la tecnología, se necesitan actualizaciones específicas de la arquitectura de datos existente para maximizar los futuros beneficios estratégicos de la IA generativa:

  • Aumentar la calidad de los datos y los esfuerzos de aumento de estos. Si bien la calidad de los datos siempre ha sido una cuestión importante, la escala y el alcance de los datos que pueden utilizar los modelos de IA generativa –especialmente los datos no estructurados– han hecho que esta cuestión sea mucho más trascendental. Por ello, es fundamental sentar bien las bases de los datos, desde la clarificación de los derechos de decisión hasta la definición de procesos de datos claros y el establecimiento de taxonomías para que los modelos puedan acceder a los datos que necesitan. Las empresas que lo hacen bien vinculan sus esfuerzos de calidad y aumento de datos a la aplicación y el caso de uso específicos de IA/IA generativa; no es necesario que esta base de datos se extienda a todos los rincones de la empresa. Esto podría significar, por ejemplo, el desarrollo de un nuevo repositorio de datos para todas las especificaciones de los equipos y los problemas reportados para apoyar mejor las aplicaciones de copiloto de mantenimiento.
  • Comprender qué valor encierran sus datos no estructurados. Tradicionalmente, la mayoría de las organizaciones han centrado sus esfuerzos en los datos estructurados (valores que pueden organizarse en tablas, como precios y características). Pero el valor real de los LLM proviene de su capacidad para trabajar con datos no estructurados (por ejemplo, diapositivas de PowerPoint, vídeos y texto). Las empresas pueden determinar qué fuentes de datos no estructurados son más valiosas y establecer normas de etiquetado de metadatos para que los modelos puedan procesarlos y los equipos puedan encontrar lo que necesitan (el etiquetado es particularmente importante para ayudar a las empresas a eliminar datos de los modelos, si es necesario). Sea creativo a la hora de pensar en las oportunidades que ofrecen los datos. Algunas empresas, por ejemplo, están entrevistando a empleados senior a medida que se jubilan e introduciendo ese conocimiento institucional capturado en un LLM para ayudar a mejorar el desempeño de sus copilotos.
  • Optimizar para reducir costos a escala. A menudo hay una diferencia de hasta diez veces entre lo que las empresas pagan por los datos y lo que podrían pagar si optimizaran su infraestructura de datos y los costos subyacentes. Este problema suele deberse a que las empresas amplían sus pruebas de concepto sin optimizar su enfoque de datos. En general, destacan dos costos. Unos son los costos de almacenamiento derivados de las empresas que suben terabytes de datos a la nube y quieren que esos datos estén disponibles 24 horas del día, siete días de la semana. En la práctica, las empresas rara vez necesitan más del 10 por ciento de sus datos para tener ese nivel de disponibilidad, y acceder al resto en un período de 24 o 48 horas es una opción mucho más barata. Los otros costos se relacionan con la computación en modelos que requieren acceso a miles de procesadores para funcionar. Este es especialmente el caso cuando las empresas construyen sus propios modelos (el arquetipo del creador), pero también cuando utilizan modelos previamente entrenados y los ejecutan con sus propios datos y casos de uso (el arquetipo del moldeador). Las empresas podrían analizar detenidamente cómo optimizar los costos de computación en plataformas en la nube; por ejemplo, poner algunos modelos en cola para que se ejecuten cuando los procesadores no están en uso (como cuando los estadounidenses se van a la cama y disminuye el consumo de servicios informáticos como Netflix) es una opción mucho más barata.

Genere confianza y reutilización para impulsar la adopción y la ampliación

Debido a que a muchas personas les preocupa la IA generativa, el listón para explicar cómo funcionan estas herramientas es mucho más alto que para la mayoría de las soluciones. Las personas que utilizan las herramientas quieren saber cómo funcionan, no sólo qué hacen. Por eso es importante invertir más tiempo y dinero para generar confianza, garantizando la precisión del modelo y facilitando la verificación de las respuestas.

Una aseguradora, por ejemplo, creó una herramienta de IA generativa para ayudar a gestionar las reclamaciones. Como parte de la herramienta, enumeró todas las barreras que se habían establecido, y para cada respuesta proporcionó un enlace a la frase o página de los documentos pertinentes de la póliza. La empresa también utilizó un LLM para generar muchas variaciones de la misma pregunta y garantizar la coherencia de las respuestas. Estos pasos, entre otros, fueron fundamentales para ayudar a los usuarios finales a generar confianza en la herramienta.

Parte de la capacitación de los equipos de mantenimiento que utilizan una herramienta de IA generativa debería consistir en ayudarles a comprender las limitaciones de los modelos y la mejor manera de obtener las respuestas correctas. Eso incluye enseñar a los trabajadores estrategias para llegar a la mejor respuesta lo más rápido posible, comenzando con preguntas amplias y luego reduciéndolas. Esto proporciona al modelo más contexto y también ayuda a eliminar cualquier sesgo de las personas que puedan pensar que ya conocen la respuesta. Contar con interfaces de modelo que tengan el mismo aspecto que las herramientas existentes también ayuda a que los usuarios se sientan menos presionados a aprender algo cada vez que se introduce una nueva aplicación.

Llegar a escala significa que las empresas tendrán que dejar de crear soluciones únicas que son difíciles de utilizar para otros casos de uso similares. Una empresa global de energía y materiales, por ejemplo, ha establecido la facilidad de reutilización como un requisito clave para todos los modelos de IA generativa, y ha descubierto en las primeras iteraciones que entre el 50 y el 60 por ciento de sus componentes pueden reutilizarse. Esto significa establecer normas para desarrollar activos de IA generativa (por ejemplo, prompts y contexto) que puedan reutilizarse fácilmente en otros casos.

Si bien muchas de las cuestiones de riesgo relacionadas con la IA generativa son evoluciones de debates que ya se estaban gestando –por ejemplo, la privacidad de los datos, la seguridad, el riesgo de sesgo, el desplazamiento laboral y la protección de la propiedad intelectual–, la IA generativa ha ampliado enormemente ese panorama de riesgos. Solo el 21 por ciento de las empresas que reportan sobre la adopción de la IA afirman que han establecido políticas que regulen el uso de las tecnologías de IA generativa por parte de los empleados.

Del mismo modo, debería establecerse un conjunto de pruebas para soluciones de IA/IA generativa con el fin de demostrar que se respetan la privacidad de los datos, la eliminación de prejuicios y la protección de la propiedad intelectual. De hecho, algunas organizaciones proponen lanzar modelos acompañados de documentación que detalle sus características de rendimiento. Documentar sus decisiones y fundamentos puede ser especialmente útil en las conversaciones con los reguladores.


En cierto modo, este artículo es prematuro: están cambiando tantas cosas que probablemente dentro de un año tengamos una idea muy diferente de la IA generativa y sus capacidades. Pero las verdades fundamentales de encontrar valor e impulsar el cambio seguirán siendo válidas. Qué tan bien las empresas hayan aprendido esas lecciones puede determinar en gran medida su éxito a la hora de capturar ese valor.

Explore a career with us