把握未来，YunGEO！

阿里通义发布最新模型Qwen3-235B-A22B-Instruct-2507-FP8，几乎是地表最强！

发布：

时间：

2025年7月25日

阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新，推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。这一新版本的亮点在于它采用了非思考模式（Non-thinking），并且大幅提升了长文本处理的能力，扩展到256K 的文本长度。这一升级无疑将大幅提升模型的应用潜力，特别是在需要处理大量信息的场景中。

Qwen3模型的更新在魔搭社区和 HuggingFace 平台上开源，允许开发者和研究者自由使用与修改。这一举动不仅体现了阿里在开源领域的前瞻性，还为广大 AI 爱好者提供了丰富的实践机会。开发者们可以利用这一强大的模型进行各类应用开发，从文本生成到数据分析，几乎涵盖了当前热门的 AI 应用领域。

以下引用公众号正和岛的部分评价内容：

01

全球最强，当之无愧！

关于Qwen3-Coder的能力，可以用一句话来形容，超越GPT4.1，比肩全球最强的编程模型Claude4。

如果觉得这句话还不够直白，你也可以这样理解，借助于Qwen3-Coder，一个刚入行的程序员一天就能完成一个资深程序员一周的工作，一个品牌官网仅用5分钟的时间就能生成，乃至一句话就能生成一个3D物理模拟动画。

这里，很多人可能就要问了，这是真的吗？它是怎么实现的？还有哪些让人眼前一亮的地方？结合Qwen3-Coder已公布的信息，我们可以将这些问题的答案梳理为以下几点：

1. 卓越的技术架构框架

从代码模型来看，Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型，总参数达480B，激活35B参数。

通俗点来说，我们可以将MoE架构理解为一个各领域专家的集合体。比如，当遇到某个专业问题时，Qwen3-Coder就可以调动该领域的专家进行解决，当遇到一个复杂问题时，它就可以联动各领域的专家来共同解决。

所以，采用MoE架构的Qwen3-Coder可以根据任务类型动态地选择合适的“专家模块”进行处理，模型的任务处理速度和复杂任务的处理能力得到大大提升。

此外，Qwen3-Coder还原生支持256K token的上下文，并可通过技术手段扩展至1M长度。

于编程模型而言，能够理解和记忆多少上下文是衡量其能力的一个硬指标。Qwen3-Coder的这组数据相当于大大扩充了模型的脑容量，让模型的理解力和记忆力得到了极大地提升，能够更好地理清代码之间的逻辑关系，避免“短视”问题。

还有，Qwen3-Coder在代码占比70%的7.5T数据上预训练，庞大且专业的数据量为模型通用能力、代码能力和Agent能力的提升奠定了坚实的基础。

评测结果显示，在浏览器调用（WebArena）、工具调用（BFCL）等Agent能力评测中，Qwen3-Coder刷新开源模型纪录，超越GPT4.1。在考察模型自主规划解决编程任务的SWE-Bench评测中，Qwen3-Coder取得了开源最佳效果，可媲美Claude4。

2. Agent能力取得重大突破

出色的Agent能力也是Qwen3-Coder的一大亮点，它不只能用来写代码，还可以自主规划工作流程并调用工具来解决多步骤的复杂任务。实测数据显示，在执行任务时，Qwen3-Coder能够调用的工具数量比Claude多出几倍，效果非常出色。

此外，从阿里云百炼平台公布的价格来看，Qwen3-Coder的API远比Claude4便宜。以约200K输入为例，Claude 4输入价格为21.48元/百万Tokens，输出价格约107.41元/百万Tokens，而Qwen3-Coder输入为5元/百万Tokens，输出价格为21.48元/百万Tokens，分别为Claude4的1/4和1/5。

所以，有业内人士就指出，开源的Qwen3-Coder有望取代昂贵的Claude，成为Agent领域最受欢迎的编程模型。

3. 程序员的“福音”

于广大程序员而言，Qwen3-Coder无疑是一个“福音”般的存在。

Qwen3-Coder不但可以写代码、补全代码、修Bug，还可以将代码测试、查询生成等工作从人工编写的数小时骤降至数分钟，极大提升了程序员的工作效率。

当程序员们不用再一行行盯着代码找bug，不用再一遍遍地做代码测试和优化，他们就可以从基础的编程工作中解脱出来，将更多的精力放在系统架构和业务逻辑梳理等更高维度的工作上，人的创造力得以进一步发挥。

多说一句，其实不只是程序员，Qwen3-Coder的出现其实也大大降低了普通人接触编程的门槛。试想，只要用一句话来描述自己的想法，比如制作一个赛车小游戏，Qwen3-Coder就能生成相应的游戏代码，这样的编程方式显然不存在任何难度。

4. 开源、开源、还是开源

目前，Qwen3-Coder已在魔搭社区、HuggingFace等平台开源，全球开发者都可以免费下载使用。最新消息显示，Qwen3-Coder很快将接入阿里的AI编程产品通义灵码，API也已上线阿里云百炼。

此外，为方便开发者更好地使用Qwen3-Coder，通义团队还同步开源了一款命令行工具Qwen Code，可以利用其充分发挥Qwen3-Coder在代理式编程上的潜力。

总结下来，Qwen3-Coder可谓集卓越性能、实用价值、社会价值于一身，称其为全球最好的编程模型自然当之无愧！

02

一场连锁反应或将发生

更深层来看，Qwen3-Coder发布所带来的变革绝不仅仅局限在编程领域，它很可能还会引起一场AI Agent的连锁反应，乃至重构千行百业。

不要忘了，AI之所以能够与物理世界产生交互，之所以能够应用到各行各业，这一切都有赖于编程技术，或者说，编程技术才是那个支撑AI落地的底座所在。当这个底座发生重大变化时，具体的AI应用势必也会随之发生改变。

目前可以预见的是，当Qwen3-Coder极大提升编程效率后，那些能够与AI产生联系的行业，其生产力将得到巨大释放，行业面貌或将焕然一新。

比如医疗行业，过去这些年，医疗行业积累了海量的数据，像病历、影像、检验报告等等，这些数据中其实蕴藏着巨大的医学价值。

过去，受制于有限的技术条件，这些数据无法得以充分挖掘，但如果借助于Qwen3-Coder的模型能力，有理由相信，医疗行业的海量数据将会被精准、快速地分析，进而为医生提供辅助诊断建议，让疾病的诊断变得更加精确。

比如金融行业，长期以来金融行业以风险和不确定性著称，但如果建立起一个能够对市场行情、交易数据、宏观经济指标等数据实时分析的风险预测模型，并制定相应的风险应对方案，行业中的风险和不确定性很可能就会大大降低。

如果要建立这样一个金融行业的风险预测模型，很显然，Qwen3-Coder在这个过程中将大有可为。

再比如教育行业，当Qwen3-Coder深度应用到教学场景后，智能教学系统会更加全面地掌握每个学生的学习情况、学习进度和知识熟练程度等信息，进而为学生提供个性化的学习方案，传统“一刀切”的教学模式将被大大改变。

所以，表面上看，Qwen3-Coder大大提升了编程效率，可能会引发一场编程革命。但深层来讲，它很可能会引起一个又一个行业变革，且这些行业变革将在Qwen3-Coder的助力下朝着更好地满足市场和用户需求的方向演进。

从这个角度来看，Qwen3-Coder的想象空间和未来前景可以说是无限大的。

03

结语

最后想说的一点是，在这场愈演愈烈的全球AI竞赛中，Qwen3-Coder的重磅发布，不仅是中国科技企业技术实力的有力证明，更彰显了中国科技企业在这场竞争中的韧性、格局与担当。

韧性无需多言，面对美国科技巨头的技术封锁，一大批中国科技企业以其独特的智慧和创新力突出重围，乃至愈发呈现出赶超之势，这一点阿里等科技企业的领先产品就是最好的回应。

那份格局与担当则更为人称道。例如，当美国科技巨头想着靠闭源来垄断AI进步的路径时，中国科技企业的眼光显然更长远、更务实、更具普世性。

如阿里般，一直以来它想的都是尽可能地通过开源来降低模型训练成本，让模型真正能够低成本的部署和使用，进而让AI技术成为驱动千行百业、惠及千家万户的“共同财富”。

一切，也正如马云所言：

“高科技绝不仅是征服星辰大海，更应该呵护人间烟火。科技人员的责任，不是让AI取代人类，而是让AI更懂人类、更好地服务人类。”

这次Qwen3-Coder的发布也让我们更加相信，中国科技企业不仅无惧封锁与打压，还将以更加开放和创新的姿态，为全球AI发展提供更具包容性的“中国方案”。

至此，必须要说一句，阿里AI，好样的！

最后说一句，加油吧中国大模型！

掌柜微信

一对一服务

添加客服微信

评论

发表回复取消回复

更多文章