Según informó la compañía en su cuenta oficial de WeChat, la herramienta ha superado en varias pruebas a Llama de Meta, GPT-4 de OpenAI y al modelo V3 de DeepSeek, mostrando mejores resultados.
Alibaba acaba de presentar Qwen 2.5, una nueva versión de su modelo de inteligencia artificial, asegurando que supera al reconocido DeepSeek-V3.
El lanzamiento en Año Nuevo Lunar, un momento inusual, refleja la presión que DeepSeek ha ejercido en la industria tras su rápido ascenso en las últimas semanas.
«Estamos desarrollando Qwen2.5-Max, un modelo MoE a gran escala que ha sido entrenado previamente en más de 20 billones de tokens y entrenado posteriormente con metodologías seleccionadas de ajuste fino supervisado (SFT) y aprendizaje de refuerzo a partir de retroalimentación humana (RLHF). Hoy, estamos emocionados de compartir los resultados de rendimiento de Qwen2.5-Max y anunciar la disponibilidad de su API a través de Alibaba Cloud», escribió la compañía en un comunicado.
Alibaba afirmó que Qwen 2.5-Max supera en casi todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B, destacando su liderazgo en IA.
«Qwen2.5-Max supera a DeepSeek V3 en pruebas de referencia como Arena-Hard, LiveBench, LiveCodeBench y GPQA-Diamond, al tiempo que demuestra resultados competitivos en otras evaluaciones, incluida MMLU-Pro», agregó la compañía.
DeepSeek-R1, presentado el 20 de enero, sacudió Silicon Valley y generó dudas sobre los costos de desarrollo de grandes empresas tecnológicas en EE.UU.
La competencia se intensificó cuando ByteDance actualizó su IA, afirmando que superaba al modelo de OpenAI en pruebas de referencia clave.