阿里开源全新架构Qwen3-Next,80B参数新模型只需激活3B即可实现旗舰性能。
9月12日,阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B ,包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和深度思考的推理(Thinking)模型 。
据介绍,相比Qwen3的MoE(混合专家)模型结构 ,Qwen3-Next进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制(简称MTP,Multiple-Token Prediction)。
在核心技术方面 ,新模型采用全球首创混合架构,75%用Gated DeltaNet(线性注意力),25%用原创Gated Attention(门控注意力) ,总参数80B只需激活3B,就可以在性能上媲美Qwen3旗舰版235B模型,算力利用率约为3.7% ,帮助用户“极致省钱”。
在训练成本方面,Qwen3-Next模型较今年4月发布的密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上 。新模型在Qwen3预训练数据的子集15T tokens上进行预训练,仅需Qwen3-32B所用GPU计算资源的9.3% ,便能训练出性能更好的Qwen3-Next-Base基座模型,大幅提升了训练效率。
阿里通义团队指出,高稀疏MoE架构是Qwen3-Next面向下一代模型的最新探索。当前 ,MoE是主流大模型都采用的架构,通过激活大参数中的小部分专家完成推理任务 。此前,Qwen3系列的MoE专家激活比约为1比16 ,而Qwen3-Next通过更精密的高稀疏MoE架构设计,实现了1比50的极致激活比,创下业界新高。
在性能表现方面 ,Qwen3-Next指令模型的性能表现与参数规模更大的Qwen3-235B-A22B-Instruct-2507持平,思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。
Qwen3-Next-80B-A3B-Instruct指令模型性能评测图 。来源:阿里通义
目前,新模型已在魔搭社区和HuggingFace开源 ,开发者也可通过Qwen Chat免费体验,或直接调用阿里云百炼平台提供的API服务。
关于Qwen3-Next模型值得注意的创新点,Pine AI联合创始人 、首席科学家李博杰对澎湃新闻记者表示,Qwen3-Next采用了混合注意力机制和高稀疏MoE架构 ,从而大幅提升效率;除了这两大创新点以外,Qwen3-Next还在预训练时采用了多Token预测技术MTP(Mutiple-Token Prediction),模型推理速度大幅提升。
李博杰表示 ,虽然以上三种技术创新在学界已有研究,但阿里证明了其在工业界的实用性,同时还保持了开源:“Qwen3-Next第一次证明了这些技术能够放在一起共同运作 ,并且能够在实际的业务场景中展现出很好的能力表现 。从评测结果和模型架构来看,Qwen3-Next已经达到了谷歌Geimini 2.5 flash的水平。”
近期,阿里通义动作频频 ,包括推出超万亿参数的Qwen3-Max-Preview、文生图及编辑模型Qwen-Image-edit、语音识别模型Qwen3-ASR-Flash等。全球AI开源社区HuggingFace的最新数据显示,通义千问Qwen衍生模型数已超17万,稳坐全球第一开源模型。
9月1日 ,国际权威市场调研机构沙利文(Frost&Sullivan)发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》,报告显示,中国企业级大模型调用呈爆发式增长 ,2025年上半年日均调用量较2024年底实现363%的增长,目前超10万亿Tokens 。其中,阿里通义占比17.7%位列第一 ,是中国企业选择最多的大模型。
(文章来源:澎湃新闻)
哪个平台股票开户佣金低:新开户能买哪些开头的股票-6月13日晚间上市公司利好消息一览(附名单)
合法股票配资平台:股票软件哪个最好前十名-7月29日晚间沪深上市公司重大事项公告最新快递
股票账户融资利率多少:股票委托买入没成功怎么办-9月2日晚间沪深上市公司重大事项公告最新快递
线上配资开户论坛:申宝策略配资股票配资平台-顶格处罚!这家上市公司,或触及重大违法类强制退市情形
股票配资是什么意思啊:股票平台排行前十名-协助他人骗取出口退税2.42亿元 从中“收费”1600多万元!上市公司子公司被罚800万元
股票可以杠杆:股票配资平台平台-苹果据悉考虑使用Gemini模型来升级Siri 谷歌大涨4%刷新历史新高
线下股票配资:股票的平台-阿里巴巴港股市值重回3万亿港元!马云现身阿里园区酒吧 众人大喊“马老师”并拍照!今年已多次在国内现身
益通网-股票配资风控_最专业股票配资提示:文章来自网络,不代表本站观点。
益通网-股票配资风控_最专业股票配资⑯我们以客户利益为首要考虑,通过严格的资金管理和风险控制措施,确保客户的投资安全,实现稳健收益。
记者辛圆国务院总理李强周三在政府工作报告中介绍今年政府工作任务时提出,推动标志性改革举措加快落地,更好...
3月24日,业内权威专家表示,MLF(中期借贷便利)不再有统一的中标利率,标志着MLF利率的政策属性完全退出。3月24日...
中证协对《证券公司文化建设实践评估指标》进行修订,最新发布2025年修订稿。新评估指标对推动文化建设国际交流作出贡献的证...
沪深两市成交额连续第44个交易日突破1万亿,较昨日此时缩量超900亿。...
乘联分会3月10日发布数据,2月新能源乘用车批发销量达到83.0万辆,同比增长79.6%,环比下降6.7%;1-2月累计...
上海创兴资源开发股份有限公司(证券代码:600193,简称“创兴资源”)于2025年3月21日发布公告,称其为全资子公司...
2025年4月12日,萤石网络(688475.SH)发布2025年一季报。 公司营业总收入为1...
3月7日下午,亚振家具(603389.SH)发布公告称,预计2024年度归母净利润将为负值,且扣除与主营业务无关的收入后...
10年期美国国债收益率现日内上涨17个基点至4.43%。...
李强主持召开国务院常务会议,研究建立健全涉企收费长效监管机制有关举措。会议指出,加强涉企收费监管是降低企业经营成本、优化...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
记者|张乔遇火锅丸子等速冻食品“一哥”安井食品近日披露了向香港联交所递交了境外发行上市申请,拟在联交所主...
汇丰晋信慧鑫六个月持有期债券型证券投资基金截至2025年3月19日,已连续40个工作日基金资产净值低于5000万元,可能...
1. ST吉药(300108.SZ):因2023年期末净资产为负值且审计报告被出具无法表示意见,公司股票自2024年4月...
央行公告,为保持银行体系流动性充裕,更好满足不同参与机构差异化资金需求,自本月起中期借贷便利(MLF)将采用固定数量、利...