阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。
千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。
作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。
在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。
千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 从习主席引用的歌感悟历史力量 7904185
- 2 中美双方降低超100%关税 7808853
- 3 中美日内瓦经贸会谈联合声明 7713607
- 4 中美经贸高层会谈达成重要共识 7615737
- 5 中美各取消91%关税 暂停24%关税 7522505
- 6 暴涨近13000点 巴基斯坦股市熔断 7429137
- 7 利用工作之便出售公民个人信息?罚 7327777
- 8 奇瑞高管评吉利新车:烂车 鉴定完毕 7234884
- 9 港股大涨 恒生科技指数涨超5% 7137445
- 10 “中国可没要让加拿大变成一个省” 7041553