
阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新,推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。这一新版本的亮点在于它采用了非思考模式(Non-thinking),并且大幅提升了长文本处理的能力,扩展到256K 的文本长度。这一升级无疑将大幅提升模型的应用潜力,特别是在需要处理大量信息的场景中。
Qwen3模型的更新在魔搭社区和 HuggingFace 平台上开源,允许开发者和研究者自由使用与修改。这一举动不仅体现了阿里在开源领域的前瞻性,还为广大 AI 爱好者提供了丰富的实践机会。开发者们可以利用这一强大的模型进行各类应用开发,从文本生成到数据分析,几乎涵盖了当前热门的 AI 应用领域。
以下引用公众号正和岛的部分评价内容:

01
全球最强,当之无愧!
关于Qwen3-Coder的能力,可以用一句话来形容,超越GPT4.1,比肩全球最强的编程模型Claude4。
如果觉得这句话还不够直白,你也可以这样理解,借助于Qwen3-Coder,一个刚入行的程序员一天就能完成一个资深程序员一周的工作,一个品牌官网仅用5分钟的时间就能生成,乃至一句话就能生成一个3D物理模拟动画。
这里,很多人可能就要问了,这是真的吗?它是怎么实现的?还有哪些让人眼前一亮的地方?结合Qwen3-Coder已公布的信息,我们可以将这些问题的答案梳理为以下几点:
1. 卓越的技术架构框架
从代码模型来看,Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型,总参数达480B,激活35B参数。
通俗点来说,我们可以将MoE架构理解为一个各领域专家的集合体。比如,当遇到某个专业问题时,Qwen3-Coder就可以调动该领域的专家进行解决,当遇到一个复杂问题时,它就可以联动各领域的专家来共同解决。
所以,采用MoE架构的Qwen3-Coder可以根据任务类型动态地选择合适的“专家模块”进行处理,模型的任务处理速度和复杂任务的处理能力得到大大提升。
此外,Qwen3-Coder还原生支持256K token的上下文,并可通过技术手段扩展至1M长度。
于编程模型而言,能够理解和记忆多少上下文是衡量其能力的一个硬指标。Qwen3-Coder的这组数据相当于大大扩充了模型的脑容量,让模型的理解力和记忆力得到了极大地提升,能够更好地理清代码之间的逻辑关系,避免“短视”问题。
还有,Qwen3-Coder在代码占比70%的7.5T数据上预训练,庞大且专业的数据量为模型通用能力、代码能力和Agent能力的提升奠定了坚实的基础。
评测结果显示,在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1。在考察模型自主规划解决编程任务的SWE-Bench评测中,Qwen3-Coder取得了开源最佳效果,可媲美Claude4。
2. Agent能力取得重大突破
出色的Agent能力也是Qwen3-Coder的一大亮点,它不只能用来写代码,还可以自主规划工作流程并调用工具来解决多步骤的复杂任务。实测数据显示,在执行任务时,Qwen3-Coder能够调用的工具数量比Claude多出几倍,效果非常出色。
此外,从阿里云百炼平台公布的价格来看,Qwen3-Coder的API远比Claude4便宜。以约200K输入为例,Claude 4输入价格为21.48元/百万Tokens,输出价格约107.41元/百万Tokens,而Qwen3-Coder输入为5元/百万Tokens,输出价格为21.48元/百万Tokens,分别为Claude4的1/4和1/5。
所以,有业内人士就指出,开源的Qwen3-Coder有望取代昂贵的Claude,成为Agent领域最受欢迎的编程模型。
3. 程序员的“福音”
于广大程序员而言,Qwen3-Coder无疑是一个“福音”般的存在。
Qwen3-Coder不但可以写代码、补全代码、修Bug,还可以将代码测试、查询生成等工作从人工编写的数小时骤降至数分钟,极大提升了程序员的工作效率。
当程序员们不用再一行行盯着代码找bug,不用再一遍遍地做代码测试和优化,他们就可以从基础的编程工作中解脱出来,将更多的精力放在系统架构和业务逻辑梳理等更高维度的工作上,人的创造力得以进一步发挥。
多说一句,其实不只是程序员,Qwen3-Coder的出现其实也大大降低了普通人接触编程的门槛。试想,只要用一句话来描述自己的想法,比如制作一个赛车小游戏,Qwen3-Coder就能生成相应的游戏代码,这样的编程方式显然不存在任何难度。
4. 开源、开源、还是开源
目前,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。最新消息显示,Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。
此外,为方便开发者更好地使用Qwen3-Coder,通义团队还同步开源了一款命令行工具Qwen Code,可以利用其充分发挥Qwen3-Coder在代理式编程上的潜力。
总结下来,Qwen3-Coder可谓集卓越性能、实用价值、社会价值于一身,称其为全球最好的编程模型自然当之无愧!
02
一场连锁反应或将发生
更深层来看,Qwen3-Coder发布所带来的变革绝不仅仅局限在编程领域,它很可能还会引起一场AI Agent的连锁反应,乃至重构千行百业。
不要忘了,AI之所以能够与物理世界产生交互,之所以能够应用到各行各业,这一切都有赖于编程技术,或者说,编程技术才是那个支撑AI落地的底座所在。当这个底座发生重大变化时,具体的AI应用势必也会随之发生改变。
目前可以预见的是,当Qwen3-Coder极大提升编程效率后,那些能够与AI产生联系的行业,其生产力将得到巨大释放,行业面貌或将焕然一新。
比如医疗行业,过去这些年,医疗行业积累了海量的数据,像病历、影像、检验报告等等,这些数据中其实蕴藏着巨大的医学价值。
过去,受制于有限的技术条件,这些数据无法得以充分挖掘,但如果借助于Qwen3-Coder的模型能力,有理由相信,医疗行业的海量数据将会被精准、快速地分析,进而为医生提供辅助诊断建议,让疾病的诊断变得更加精确。
比如金融行业,长期以来金融行业以风险和不确定性著称,但如果建立起一个能够对市场行情、交易数据、宏观经济指标等数据实时分析的风险预测模型,并制定相应的风险应对方案,行业中的风险和不确定性很可能就会大大降低。
如果要建立这样一个金融行业的风险预测模型,很显然,Qwen3-Coder在这个过程中将大有可为。
再比如教育行业,当Qwen3-Coder深度应用到教学场景后,智能教学系统会更加全面地掌握每个学生的学习情况、学习进度和知识熟练程度等信息,进而为学生提供个性化的学习方案,传统“一刀切”的教学模式将被大大改变。
所以,表面上看,Qwen3-Coder大大提升了编程效率,可能会引发一场编程革命。但深层来讲,它很可能会引起一个又一个行业变革,且这些行业变革将在Qwen3-Coder的助力下朝着更好地满足市场和用户需求的方向演进。
从这个角度来看,Qwen3-Coder的想象空间和未来前景可以说是无限大的。
03
结语
最后想说的一点是,在这场愈演愈烈的全球AI竞赛中,Qwen3-Coder的重磅发布,不仅是中国科技企业技术实力的有力证明,更彰显了中国科技企业在这场竞争中的韧性、格局与担当。
韧性无需多言,面对美国科技巨头的技术封锁,一大批中国科技企业以其独特的智慧和创新力突出重围,乃至愈发呈现出赶超之势,这一点阿里等科技企业的领先产品就是最好的回应。
那份格局与担当则更为人称道。例如,当美国科技巨头想着靠闭源来垄断AI进步的路径时,中国科技企业的眼光显然更长远、更务实、更具普世性。
如阿里般,一直以来它想的都是尽可能地通过开源来降低模型训练成本,让模型真正能够低成本的部署和使用,进而让AI技术成为驱动千行百业、惠及千家万户的“共同财富”。
一切,也正如马云所言:
“高科技绝不仅是征服星辰大海,更应该呵护人间烟火。科技人员的责任,不是让AI取代人类,而是让AI更懂人类、更好地服务人类。”
这次Qwen3-Coder的发布也让我们更加相信,中国科技企业不仅无惧封锁与打压,还将以更加开放和创新的姿态,为全球AI发展提供更具包容性的“中国方案”。
至此,必须要说一句,阿里AI,好样的!
最后说一句,加油吧中国大模型!



发表回复