Es posible que pronto Gemini de Google pueda hacer tu trabajo.

Los informes indican que Google está trabajando en una importante actualización de su asistente de inteligencia artificial generativa. GeminiEsto podría transformarlo de un simple asistente conversacional en algo más cercano a un auténtico agente comercial. Un análisis experimental reciente del código de la aplicación de Google realizado por [nombre del autor] 9to5GoogleLos desarrolladores han descubierto fragmentos de código que apuntan a una función conocida internamente como "automatización de pantalla". Esto sugiere que Gemini pronto podrá realizar acciones directamente en tu nombre dentro de ciertas aplicaciones de Android, como realizar pedidos o reservar vuelos, sin necesidad de que el usuario toque manualmente las pantallas.

Es posible que pronto Gemini de Google pueda realizar tus tareas.

Si bien Gemini ya gestiona tareas conversacionales como redactar correos electrónicos o crear planes de investigación, esta actualización parece estar diseñada para permitirle interactuar con las interfaces de las aplicaciones, pulsando botones y navegando por las pantallas para completar tareas que normalmente realizaría usted mismo. Las primeras pruebas de la versión beta sugieren que estas funciones se limitarán inicialmente a unas pocas aplicaciones compatibles y priorizarán la supervisión del usuario. Google advierte que "Gemini puede cometer errores" y que los usuarios son responsables de las acciones que se tomen en su nombre.

¿Cómo esta actualización transforma la IA de asistente a agente?

El concepto detrás de la automatización de pantallas representa un paso significativo para otorgarle a la IA mayor autonomía en los flujos de trabajo digitales cotidianos. En lugar de simplemente sugerirte lo que puedes hacer, Gemini pronto podría implementar esas opciones directamente en tus aplicaciones. Los primeros fragmentos de código de la versión beta de Google también indican precauciones de privacidad, como recomendar a los usuarios no ingresar información de inicio de sesión o de pago en las conversaciones de IA y advertir que las capturas de pantalla podrían revisarse para mejorar la función. Google ya ofrece algunas capacidades de agente a través de su plataforma Gemini Agent en Workspace y en la web, donde la IA puede gestionar flujos de trabajo complejos y coordinar servicios. Sin embargo, la automatización de pantallas podría llevar esas capacidades directamente a los smartphones y al uso diario de las aplicaciones.

Si estas funciones se implementan ampliamente, podría representar un cambio en la forma en que las personas interactúan con los dispositivos móviles, pasando de tocar y deslizar la pantalla por sí mismas a permitir que las herramientas de IA actúen en su nombre. Esto podría agilizar las rutinas diarias, pero también plantea interrogantes sobre el control, la seguridad y la supervisión, especialmente cuando la automatización afecta a tareas sensibles como las reservas o las transacciones financieras.

Según informes, Google está posicionando estas actualizaciones como opcionales y supervisadas, lo que permite a los usuarios desactivar o anular Gemini en cualquier momento. Sin embargo, la función de automatización de pantalla aún está en desarrollo y aún no ha alcanzado las versiones estables.

Gemini