日期:2025-07-30 05:42:24
适逢AI大模型厂商在AI编程领域的竞争逐渐白热化之际,7月23日清晨,阿里云通义团队投下了一颗“重磅炸弹”:全新的通义千问AI编程大模型Qwen3-Coder正式开源。阿里巴巴表示,“这是我们迄今为止最具代理能力的代码模型,编程能力登顶全球开源模型阵营。”如此表态,足以证明阿里巴巴对这款产品的重视程度。
Qwen3-Coder正式开源
据介绍,Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型。技术细节显示,模型总参数量达4800亿,激活参数为350亿,原生支持256Ktoken上下文,并可通过YaRN技术扩展至1Mtoken,这意味着它可完整解析大型代码仓库或整本学术专著。
Qwen3-Coder在Agent能力多项评测中获得最佳性能(SOTA)表现
在多项关键评测表现中,Qwen3-Coder不仅超越GPT4.1等闭源模型,更直接比肩当前全球公认最强的编程模型Claude4,堪称惊艳:
在衡量智能体能力的WebArena(浏览器调用)和BFCL(工具调用)评测中,刷新开源模型纪录,超越GPT4.1;
Qwen3-Coder在代码占比70%的7.5T数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及Agent能力的飞升:在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1;
更具突破性的是SWE-Bench评测——在这项考察模型自主规划解决编程任务的权威测试中,Qwen3-Coder与Claude4打成平手。要知道Claude4此前是编程领域的王者,而开源的Qwen3-Coder实现了零差距超越。
Qwen3-Coder的实战表现更令人震撼:在执行复杂任务时,Qwen3-Coder调用工具数量是Claude的数倍。这种多工具协同能力使其在网页开发、AI搜索等场景中表现卓越。“借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。”
目前,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。
为方便开发者更好地使用Qwen3-Coder,阿里云通义团队还开源了一款命令行工具QwenCode,可充分发挥Qwen3-Coder在代理式编程上的潜力。此外,Qwen3-Coder的API也可以和ClaudeCode、Cline等工具协同使用。
2025世界人工智能大会展区,阿里巴巴展示“全栈AI”能力
“2019年,我们还在讨论单点突破的语言模型,到2025年的今天,大模型已呈现‘周级迭代’的爆发态势。”7月27日,阿里云副总裁、大数据和智能实验室负责人叶杰平在2025世界人工智能大会(WAIC2025)上表示,当前AI模型技术正经历从“渐进式创新”到“指数级跃迁”的历史性转变,以通义千问为代表的开源模型已成为这场变革的重要力量。
在年报股东信中,阿里表示,要将“Al+云”为核心的科技业务打造成阿里巴巴的第二增长曲线;未来十年,最大的增量和变量都是以AI为核心的驱动力带来的变革。2025财年年报显示,阿里云财年收入突破双位数增长,AI相关产品收入连续七个季度实现三位数同比增长。
(大众新闻·经济导报记者石潇懿)
正规股票配资排名提示:文章来自网络,不代表本站观点。