消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。

报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 习近平同马克龙交流互动的经典瞬间 7903968
- 2 公考枪手替考89次敛财千万 7809491
- 3 15岁高中生捐赠南京大屠杀日军罪证 7714300
- 4 2025你的消费习惯“更新”了吗 7618230
- 5 流拍4次的百达翡丽再挂拍 估值4千万 7521984
- 6 一身塑料过冬?聚酯纤维真是塑料瓶吗 7428067
- 7 危险信号!俄数百辆保时捷突然被锁死 7331593
- 8 今日大雪 要做这些事 7236216
- 9 李幼斌20年后重现《亮剑》名场面 7143663
- 10 中疾控流感防治七问七答 7048351







白靖寒
