曲子龙:DeepSeek到底强在哪?

动态 来源:0XUCN原创 2025-02-06 19:17:54

今年春节基本就两个主题,一个是DeepSeek、另一个是《哪吒》,每当互联网某个东西爆火后,各种营销号就开启了大明白模式,管它技术懂不懂先写几篇“冲突文”蹭上流量再说,以讹传讹越传越多....

大年初四发表《红盟只会蹭!》打假了红盟后,逼着对方周五赶紧发文澄清和DeepSeek无合作....但是丝毫没影响其它小骗子,继续开直播丢垃圾软件、卖课,更有甚者跑过来直接贴脸开大!说我们还叫什么网络尖刀....问我们懂安全?懂黑客?懂技术么?

懒得和SB争论,我怕分不清到底谁是SB,算了。

DeepSeek的是一直想写的,拖到现在主要俩原因,一个是我懒、另外一个是技术迭代的太快了,出现了太多新东西,虽然网络尖刀从17年开始成立人工智能实验室,从NLP开始搞,但去年休息了大半年啥也没干,平时搞点小研究在安全的事儿上没掉队,但是在人工智能这方面很多东西我确实是没跟上的。

春节的这段时间在家一直啃paper,看各种论文,再对照网上那些乱七八糟的爆火科普,发现里面很多东西都是断章取义存在错误和误解的,我想还是把我个人理解的东西做一个记录,也算和大家有一些小分享。

先说攻击事件

相信这种AI合成的内容,春节的时候大家在朋友圈还有抖音都刷到过:

DeepSeek被攻击这个事情确实是真的!但是网上各种霸屏的“红客反击”、“华为与360守护”,乱七八糟的信息全部都是假的!

事情的开端是DeepSeek被攻击时,某数字公司大R在抖音发言,声称愿意提供技术协助,把网络攻击直接直指到“某个国家”,视频中从头到尾全是在推广自己,无论是反复提及的“自有AI产品”,还是扬言自己的专线机房多厉害,甚至声称“能攻破其的黑客还没出生”,连续几天蹭着热度一顿操作。

接着爱蹭一蹭就是啥也攻进不去的红盟,果然出现开始发各种公告、声明!随后就开启了惯用套路开直播、卖课!公益捐款!321上连接!

自媒体也不能闲着,于是大家就铺天盖地的看到了这些大概率是通过AI生成的假新闻!

假到离谱!假到令人哭笑不得!甚至发指!说真话可能会被各种营销号、无脑的带节奏说我是“叛徒”,但是我相信大部分人还是有自己的思考能力的。

关于上面这些我想说明几点:

  1. 把DeepSeek被攻击直接上升到国与国,声称某个国家的行为来攻击它,挺打脑壳的!如果是漂亮国以国家行为发起这场网络战!作为DeepSeek来说根本扛不住!也不可能抗住!

  2. DeepSeek让华尔街、纳斯达克扑街!光英伟达就暴跌16.97%,市值一个交易日蒸发5926.58亿美元,欧美科技股市值蒸发了1.2万亿美元!这其中有多少资本家?投资者不恨的牙痒痒?这个规模的流量攻击,其实就是单纯的报复罢了!

  3. 我说流量攻击,是因为根据奇安信的报告[1]中,1月28日3点开始还伴随了大量暴力破解攻击,这些攻击IP全部来自美国!这部分攻击可能和上面的流量攻击是两波不同的攻击者,他们更倾向于Z治,甚至可以归纳为“商业竞争”目的!海外AI巨头OpenAI、Meta...哪一个在这个时间点不想窥探DeepSeek的核心技术呢?

  4. 所谓的能攻破XX系统的黑客还没出生,这句话是极其不负责任的,国内外各互联网厂商都有自己的安全应急响应中心(SRC),来接收、处理自己的安全问题!在安全这件事上没有绝对的安全!无非是一群又一群有原则的人,前赴后继的坚持着自己的初心罢了!搜索厂商名+安全应急响应中心,贡献榜单可以说明一切!这样的言论挺寒这些人的心的!

至于数字公司声称的提供技术支持,我在前面的文章就提过,是单方面的喊话罢了!DeepSeek在1月28日凌晨00:53:29做了一次IP切换:

这个切换的IP是华为云(疑似华为云高防IP)、海外防御用的是CloudFlare。

数字公司玩完这波流量后,股市咔咔上涨,于是拖到昨天“大方”的回应市值波动,声明:暂未向DeepSeek提供任何服务。

至于红盟,真不想回应了,上一篇文章碍于面子不想说那么透!直白一点来说红盟的价值是红盟的思想!而创建红盟的人只是一个组织者!现在的红盟是纠葛不清的商业利益!也是毫无技术的一群碰瓷、骗子罢了!

很多人干了一些事是不能公开承认的,他们用各种暗示口吻去冒领完,再发声明说无关罢了。

从乌云到现在的各厂安全应急响应中心,如果关注网络安全的,可以多关注关注0x557、安全焦点、KEEN、启明星辰、绿盟、奇安信、盘古、四叶草、知道创宇、安恒、长亭,到现在网络尖刀(KNOWSAFE)、PKAV(无糖安全)、ChaMd5、Day1、芳华绝代、米斯特、晴天组织、白帽100.....前赴后继在背后努力的安全公司和安全团队太多了,但不好意思真没你红盟的位置。

一直贩卖爱国情怀,把它作为商业化手段,迟早会被反噬。

关于绕过CUDA

最近看到最多的就是DeepSeek绕过了NVIDIA CUDA,彻底摆脱了对英伟达的依赖的言论,依据的则是DeepSeek采用了PTX编程替代了CUDA C/C++编程的相关信息。

研究了一下NVIDIA CUDA程序的编译流程:

CUDA C/C++ (.cu) → PTX(通过nvcc前端生成) → SASS(通过驱动程序JIT生成目标GPU机器码)

我想描述更准确的应该是,DeepSeek为了解决H800 GPU性能以及跨芯片通信的瓶颈,跳过了CUDA C/C++,直接从更复杂的PTX这一层开始写。

PTX(Parallel Thread Execution)是NVIDIA定义的虚拟中间表示(IR)在硬件抽象层提供面向SIMT架构的类汇编指令(如`ld.global.v4.f32`用于向量化全局内存加载),但未绑定具体GPU微架构(如Turing/Ampere)。

通过驱动程序的即时编译(JIT)转换为目标GPU的机器码(SASS),实现“一次编写,多架构运行”实现跨代兼容。

PTX是CUDA编译器将源代码(如 CUDA C/C++)转换为低级别、硬件相关的机器指令之前的一个中间件,PTX代码仍然需要CUDA的编译、运行和管理机制来执行,它本身就是NVIDIA CUDA程的一部分。

总结一下:

DeepSeek创新如果从技术角度来说其实就是通过直接操作PTX层对寄存器、线程、内存进行各种压缩优化,实现了:每个流处理器的寄存器使用率从78%提升至92%、计算单元闲置时间减少40%、全局内存访问延迟从600周期降至450周期。

从中间件直接下手,编译都少了一个环节肯定是提速的,只是DeepSeek攻克了其中的每一个困难,实现了巨大的效率提升。

按这个思路接下来肯定还有对汇编语言直接搞SASS优化的空间,预计半年内可能就会有新的发现。

当然面临的挑战就是,现在还能从汇编开始写的程序员,再多说几句都是年代感和沧桑感了。

突破

DeepSeek技术创新点真的太多了,写完上面一段后我发现如果全用大白话去写,这将是一个很长很长的文章,可能对很多普通人并不需要知道那么深,而对于追求技术的人来说,我又多此一举,还是去抠论文要好一些。

按哲学的角度来说,创新了一个新事情,就要思考N个老的事情怎么和新的事情配合!于是就要因为一个创新,实现诸多创新与改进。

比如在DeepSeek-R1-Zero中为了通过纯强化学习(RL)而不用任何监督微调(SFT)激发 LLM 的推理能力,实现让模型自己探索解决复杂问题的 CoT,生成能自我验证(self-verification)、反思(reflection)的 long-CoT。

就产生了虽然能力提升了,但是出现了各种格式、语种混杂、影响阅读性的问题,于是就在DeepSeek-R1中先构建几千条long-CoT作为强化学习(RL)初始化actor,再定义输出的格式为:

|special token|<思考过程>|special token|<答案总结>

然后又有了新的挑战,接下来再去蒸馏.....

就在我写文章的过程里,又看到了文章推送李飞飞带领的研究团队,使用16个英伟达H100 GPU进行了26分钟的训练,以不到50美元的云训练成本,通过蒸馏Gemini 2.0 Flash Thinking Experimental 得到了一个在数学和编码能力测试中的表现与OpenAI-o1以及DeepSeek-R1推理模型类似的模型。

可以预见的是今年上半年,RL强化学习、蒸馏法一定是听不完的话题。

凭什么是DeepSeek

相比Meta Llama3 405B 花了3930万H100 GPU小时,DeepSeek-v3 671B,仅用了278.8万H800 GPU小时就实现了比其花钱更少,参数更大的结果。

使用略差一点的显卡(DeepSeek H800对标 Meta H100),用了更短的时间、花更少的钱,拉开这么大差距怎么能不振奋人心呢?

量化的本质就是通过学、统计学和计算机科学的方法,将投资决策过程系统化、模型化和程序化,以提高投资决策的科学性和效率啊!

搞过套利的都清楚,技术上扣的就是如何低延迟!争的不就毫秒级的高频交易吗?至于数学模型、机器学习、成本计算确实是人家的看家本领!

DeepSeek虽然成立才2年,但其背后依托的是幻方,私募巨头、量化大佬,08年开始搞量化(人工辅助)、15年拿到基金牌照、16年推出第一个AI模型、17年就已经将所有的量化策略,通过AI模型用实盘开干!

当所有AI应用,除了提供助手陪你唠嗑外,还在探索商业化怎么落地时,人家的AI模型已经在“金融”的实盘场景中打了整整七年了!

对比其管理规模,15年5亿,17年30亿,19年200亿,21年1000亿.....自然就能对比出其AI模型能力的重要性了。

DeepSeek完全是一个有积累、有实盘经验的AI,破茧而立的!从不服真的不行!

参考链接:

1.DeepSeek遭受大量海外攻击,奇安信:面临前所未有安全考验,攻击将持续https://baijiahao.baidu.com/s?id=1822581876894009442&wfr=spider&for=pc2.DeepSeek R1技术报告 https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf3.NVidia GPU指令集架构-Load和Cache https://zhuanlan.zhihu.com/p/6924451454.NVidia GPU指令集架构-浮点运算 https://zhuanlan.zhihu.com/p/6956670445.NVidia GPU指令集架构-整数运算 https://zhuanlan.zhihu.com/p/7009219486.NVidia GPU指令集架构-比特和逻辑操作 https://zhuanlan.zhihu.com/p/7123568847.NVidia GPU指令集架构-Warp级和Uniform操作 https://zhuanlan.zhihu.com/p/712357647

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接
百度热搜榜
排名 热点 搜索指数