首页 > 国际动态 > 正文
2024-09-19 15:49:38

通义千问开源Qwen2.5,性能超越Llama

2024年9月19日,在云栖大会上,阿里云CTO周靖人发布了通义千问新一代开源模型Qwen2.5,这一模型的旗舰版本Qwen2.5 - 72B性能超越Llama 405B,引起了业界的广泛关注。

Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新了业界纪录。这些模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,展现出更多的知识储备、更强的编程和数学能力。

具体来看,Qwen2.5 - 72B模型在MMLU - rudex基准(考察通用知识)、MBPP基准(考察代码能力)和MATH基准(考察数学能力)的得分高达86.8、88.2、83.1。并且,Qwen2.5支持高达128K的上下文长度,可生成最多8K内容。

该模型还拥有强大的多语言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等29种以上语言。它能够丝滑响应多样化的系统提示,在指令跟随、理解结构化数据(如表格)、生成结构化输出(尤其是JSON)等方面进步明显,可实现角色扮演和聊天机器人等任务。

截至2024年9月中旬,通义千问开源模型累计下载量已突破4000万,成为仅次于Llama的世界级模型群。同时,阿里云还宣布通义千问推荐模型全线降价,最高降幅可达85%。通义千问Qwen2.5的开源,无疑将在人工智能领域掀起新的浪潮,其超越Llama的性能表现也将为众多开发者和企业提供更强大的工具,推动相关领域的进一步发展。