Happy QwensWeek 尽然名不虚传。 Qwen 的基础模子接连开源,咫尺全新非想考模子 Qwen3-30B-A3B-Instruct-2507 也闪电上线。 仅激活3B参数,就能获得忘形 Gemini 2.5-Flash(non-thinking)、GPT-4o 等顶尖闭源模子的超强性能。 相较前代的非想考模子 Qwen3-30B-A3B Non-Thinking,此次"小更新"使模子的通用才能方面得到了要道栽植。 其中,模子的推理才能(AIME25)栽植了 183.8%,而对其才能
Happy QwensWeek 尽然名不虚传。
Qwen 的基础模子接连开源,咫尺全新非想考模子 Qwen3-30B-A3B-Instruct-2507 也闪电上线。
仅激活3B参数,就能获得忘形 Gemini 2.5-Flash(non-thinking)、GPT-4o 等顶尖闭源模子的超强性能。
相较前代的非想考模子 Qwen3-30B-A3B Non-Thinking,此次"小更新"使模子的通用才能方面得到了要道栽植。
其中,模子的推理才能(AIME25)栽植了 183.8%,而对其才能(Arena-Hard v2)则栽植了 178.2%。此外,模子的长文本处理才能也由前代的 128K 栽植至 256K。
不错说,这款新模子就像 Qwen 团队说的:"更轻、更强、更好用!"
这样一波操作下来,网友都合计"太纵容":哥,你慢点!
小更新、大不同
正如发轫提到的,相较于前代非想考模子,Qwen3-30B-A3B-Instruct-2507 在推理才能和对都才能方面完了了大幅跃升,长文本处理才能也从 128K 栽植至 256K。
除此以外,模子在多讲话长尾学问笼罩、主不雅与怒放任务的文实质地、代码生成、数学蓄意、器用使用等通用才能上也发扬出全面高出,展现出更强的通用性与实用性。
四肢 Qwen3 系列 Qwen3-30B-A3B的高质地教导微调版块,其不再有块,都备以非想考款式驱动。
相较于基础模子,Qwen3-30B-A3B-Instruct-2507 更提神稳态输出与一致性,符合瓦解分娩环境部署。具备更强的对都性、教导慑服才能和长文本处理才能,符合径直作事于更复杂、更的确的东说念主机交互诓骗。
在网友的里面基准测试中,直不雅地体现了 Qwen3-30B-A3B-Instruct-2507 的上述上风:
濒临从海量文档中索求援手某一主题的沿路凭证这一任务,Qwen3-30B-A3B-Instruct-2507 不仅越过了网友此前使用过的所有模子,还有用科罚了诸如对话轮次消耗、器用调用失败、信息遗漏与误检等常见问题。
比拟之下,其他模子时常会在处理长文本时出现大面积内容丢失,而 Qwen3-30B-A3B-Instruct-2507 在极点情况下也仅偶尔遗漏极少文档,展现出惊东说念主的瓦解性和精度。
这一性能的背后,恰是 Qwen3-30B-A3B-Instruct-2507 在长文本处理才能方面的中枢上风。收成于其援手 256K 的坎坷文窗口以及窜改经的长程依赖建模才能,模子简略"读懂并记着"弘大的输入信息,保持语义连贯、细节昭着。
同期,它还具备更强的推理才能与检索调用计谋,从而在复杂任务中完了高效、精确的信息整合与输出,的确体现了其在大界限文档瓦解和多步推理场景下的实用价值。
Qwen3 家眷
在最近的一周多时辰里,Qwen 连结放出了好几款模子:
07.30:Qwen3-30B-A3B-Instruct-2507 ( Qwen3-30B-A3B 非想考款式的更新版块 )
07.25:Qwen3-235B-A22B-Thinking-2507 ( Qwen3-235B-A22B 想考款式的更新版块 )
07.22:Qwen3-Coder-480B-A35B-Instruct ( Qwen3-Coder )
07.21:Qwen3-235B-A22B-Instruct-2507 ( Qwen3-235B-A22B 非想考款式的更新版块 )
在网友们惊叹阿里速率的同期,Qwen 系列的定名乍一看也让东说念主眼花头晕。
不外,若是你仔细不雅察,就会发现 Qwen 的定名朴素得像一份显卡驱动版块号,毫无厚谊,只好信息。
以今天的主角 Qwen3-30B-A3B-Instruct-2507 为例,这个定名抒发的是:
Qwen3:第三代千问模子
30B:总参数目为 30B(Billion= 十亿)
A3B:激活参数为 3B
Instruct-2507:教导微调版块,发布时辰为 2025 年 7 月。
若是咱们追想所有这个词 Qwen3(Qwen3-2504)系列,基础模子又根据参数目和激活参数目分为两条干线:
旗舰模子 Qwen3-235B-A22B:235B 总参数,22B 激活参数。
较小的 MoE 模子 Qwen3-30B-A3B:30B 总参数,3B 激活参数(另有预考验版块 Qwen3-30B-A3B-Base)
针对不同的理场景和硬件资源,Qwen3 系列还包含了不同大小的密集(Dense)模子(从 0.6B 到 32B)。
此外,为冒失不同的场景,Qwen3 还推出了不同的量化计谋版块,如 FP8、Int4、AWQ、GGUF、GPTQ 等。
不错说,只须能细化,Qwen3 就毋庸你动手(颗粒度这一块,拿抓!)
是以,与其说 Qwen3 是一个模子系列,不如说它是一个"模子矩阵":规格全、定名清、版块多。
横跨参数界限、精度才能、考验类型险些所有维度,适配了从征询到诓骗、从大厂集群到边际部署的各式需求。
一句话总结:你只管问,Qwen3 还是准备好了。
参考流畅:
[ 1 ] https://x.com/Alibaba_Qwen/status/1950227114793586867
[ 2 ] https://www.reddit.com/r/LocalLLaMA/comments/1mcg4qt/qwen330ba3b_small_update/
[ 3 ] https://modelscope.cn/models/Qwen/Qwen3-30B-A3B-Instruct-2507
[ 4 ] https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507
一键三连「点赞」「转发」「严防心」
迎接在磋商区留住你的意见!
— 完 —
量子位「AI 100」产物榜单启动招募!
快来提名你心目里的百强产物~
� � 点亮星标 � �
科技前沿进展逐日见亚bo体育网