Los grandes modelos de negocio (LAM) están revolucionando el mundo de la IA en comparación con los modelos tradicionales.

La aparición de chatbots generativos impulsados por IA ha dado lugar al concepto de un “modelo de lenguaje grande” (LLM), una tecnología de IA avanzada que analiza y comprende el lenguaje natural para generar respuestas significativas basadas en las consultas de los usuarios. Los modelos de lenguaje de gran tamaño son capaces de generar contenido consistente y similar al humano, dando la impresión de que la IA tiene algún tipo de “pensamiento” propio.

Sin embargo, los modelos lingüísticos no son la única tecnología que contribuye al desarrollo de la inteligencia artificial; Los grandes modelos de negocio (LAMs) pueden ser el siguiente paso. Estos modelos se centran en mejorar las capacidades analíticas y de toma de decisiones en contextos prácticos, transformando potencialmente áreas como la automatización y la gestión empresarial. En este artículo, aprenderemos cómo funcionan los LLM y los LAM, y su creciente impacto en la mejora de las aplicaciones de IA y la expansión de su alcance.

Los grandes modelos de negocio (LAM) están revolucionando el mundo de la IA.

¿Qué es un Modelo de Gran Negocio (LAM)?

Un modelo de acción grande (LAM) es un modelo de inteligencia artificial que es capaz de comprender la entrada humana y realizar la acción correspondiente, lo que le permite interactuar con el mundo de forma humana. Este es un enfoque ligeramente diferente a los modelos de IA que se centran únicamente en generar respuestas. El término "gran modelo de negocio" fue introducido por primera vez por Rabbit Inc, desarrollador del Rabbit R1. En el vídeo de lanzamiento de Rabbit R1 de la compañía, se dice que LAM es un nuevo modelo fundamental que ayuda a que la IA pase de las palabras a la acción.

¿Qué es un Modelo de Gran Negocio (LAM)?

Los LAM se entrenan con grandes conjuntos de datos de acciones del usuario; Por tanto, aprenden imitando acciones humanas o mediante demostraciones. A través de la demostración, el modelo LAM puede comprender y navegar por las interfaces de usuario de diferentes sitios web o aplicaciones móviles y realizar acciones específicas según sus instrucciones. De acuerdo a ConejoLAM puede lograr esto incluso si la interfaz se cambia ligeramente.

Se puede pensar en los LAM como una extensión de las capacidades existentes de los LLM. Mientras que las salidas de texto o medios generativos en LLM dependen de la entrada del usuario al predecir la siguiente palabra o token (usted hace una pregunta y el modelo LLM proporciona salidas de texto o medios), los LAM lo llevan más allá al agregar la capacidad de realizar acciones complejas en su nombre.

¿Qué pueden hacer los LAM?

Los LAM consisten en realizar acciones complejas en su nombre. Sin embargo, el punto crucial a tener en cuenta es la capacidad de realizar procedimientos complejos. Esto hace que los LAM sean más útiles para tareas avanzadas, pero eso no significa que no puedan realizar procedimientos más simples.

En teoría, esto significa que podrías, por ejemplo, pedirle al modelo LAM que haga algo en tu nombre, como pedir un café en tu cafetería local o un viaje en Uber, e incluso hacer una reserva de hotel. Por lo tanto, es diferente a realizar tareas simples como pedirle al Asistente de Google, Siri o Alexa que enciendan el televisor o las luces de la sala.

Bajo el capó, según la visión compartida por Rabbit Inc., el modelo LAM puede acceder a un sitio web o aplicación relevante como Uber y navegar a través de su interfaz para realizar una acción, como solicitar un viaje o cancelarlo si cambia de opinión.

Los LAM superarán a los LLM, pero no están listos (aún)

El concepto de LAM es apasionante, quizás más que el de LLM. Los grandes modelos de acción (LAM) serán el futuro después de la IA generativa, lo que nos permitirá compensar tareas mundanas y centrarnos en otras actividades satisfactorias. Sin embargo, por muy emocionante que parezca, los LAM aún no están listos.

El primer producto comercial que prometió aprovechar LAM (Rabbit r1) no cumplió plenamente su promesa de marketing de realizar acciones en nombre de sus usuarios. El dispositivo falló tanto en su punto de venta principal que muchas revisiones de primera mano lo describieron como bastante inútil.

Peor aún, una investigación realizada por el YouTuber Coffeezilla, en colaboración con un grupo selecto de ingenieros de software con acceso a parte de la base de Rabbit r1, encontró que Rabbit usaba scripts Playwright para ejecutar acciones en lugar de LAM. Entonces, en lugar de que una máquina ejecutara un modelo de IA único, en realidad solo estaba ejecutando un montón de declaraciones If > then; Muy lejos del prometido modelo LAM.

Si hay algo que se puede sacar del Rabbit r1 es que sí, la visión está ahí. Sin embargo, el trabajo debe realizarse antes de la implementación, así que no te emociones todavía.