Alibaba de China supera a Meta con los nuevos modelos de IA Qwen 3

Resumen:

El gigante tecnológico chino Alibaba ha lanzado una familia de modelos de inteligencia artificial Qwen 3 de código abierto. La colección incluye 8 nuevos modelos.
El modelo líder, Qwen3-235B-A22B MoE, se entrenó con 235 mil millones de parámetros, con 22 mil millones de parámetros activados.
El modelo más pequeño, Qwen3-30B-A3B MoE, que tiene solo 3 mil millones de parámetros activados, supera a GPT-4o por un amplio margen.

El gigante tecnológico chino Alibaba ha lanzado ocho nuevos modelos de inteligencia artificial (IA) de código abierto en su serie Qwen 3. Los nuevos modelos Qwen 3 incluyen dos modelos MoE (Mixture of Experts), Qwen3-235B-A22B y Qwen3-30B-A3B. El Qwen3-235B-A22B es el modelo más grande y líder, con un total de 235 mil millones de parámetros y 22 mil millones de parámetros activados.

El Qwen3-30B-A3B es un modelo MoE más pequeño con un total de 30 mil millones de parámetros y 3 mil millones de parámetros activados. Además, hay seis modelos densos dentro de la serie Qwen 3, incluidos Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B y Qwen3-0.6B. Estos nuevos modelos Alibaba Qwen 3 AI fortalecen aún más la posición de la compañía en el campo de la inteligencia artificial.

¡Presentamos Qwen3!

Lanzamos y abrimos Qwen3, nuestros últimos modelos de lenguaje de gran tamaño, incluidos 2 modelos MoE y 6 modelos densos, que van desde 0.6 B a 235 B. Nuestro modelo insignia, Qwen3-235B-A22B, logra resultados competitivos en evaluaciones de referencia de codificación, matemáticas, general… foto.twitter.com/JWZkJeHWhC

- Qwen (@Alibaba_Qwen) 28 de Abril de 2025

Todos los modelos Qwen 3 admiten modos de pensamiento híbrido, lo que significa que son modelos de IA inferencial y modelos de lenguaje grande (LLM) tradicionales al mismo tiempo. En el “modo de pensamiento”, el modelo puede inferir paso a paso, mientras que en el “modo de no pensamiento”, el modelo proporciona una respuesta rápida. Esta característica mejora la flexibilidad de uso del modelo en diversas aplicaciones.

además de, Apoyo Los modelos Qwen 3 admiten más de 119 idiomas y dialectos de todo el mundo. Es uno de los modelos multilingües más versátiles. Además, Alibaba ha mejorado la compatibilidad con el Protocolo de Contexto de Modelo (MCP) para los modelos Qwen 3, lo que permite capacidades adicionales de agencia. Esta mejora permite a los modelos comprender mejor el contexto y tomar decisiones más inteligentes.

En términos de rendimiento, el modelo más grande Qwen3-235B-A22B ofrece resultados competitivos en línea con Búsqueda profunda R1 y Grok 3 Beta y Géminis 2.5 Pro y OpenAI o1. Lo que me parece interesante es que el modelo más pequeño Qwen3-30B-A3B, que tiene solo 3 mil millones de parámetros activos, supera al modelo GPT-3o de DeepSeek V4 y OpenAI. Esto indica una alta eficiencia de recursos y la capacidad de lograr un rendimiento excepcional con un tamaño de modelo más pequeño.

Alibaba dice que los modelos Qwen 3 funcionan bien en programación, matemáticas, ciencias y habilidades generales. En general, Qwen 3 representa una familia de modelos de IA avanzados y altamente capaces de China. Ahora, con el próximo DeepSeek R2, China está bien posicionada para competir con los laboratorios de inteligencia artificial occidentales. Este desarrollo refleja el rápido progreso de China en el campo de la inteligencia artificial.