酷应用

曲子龙：DeepSeek到底强在哪？

动态来源：0XUCN原创 2025-02-06 19:17:54

今年春节基本就两个主题，一个是DeepSeek、另一个是《哪吒》，每当互联网某个东西爆火后，各种营销号就开启了大明白模式，管它技术懂不懂先写几篇“冲突文”蹭上流量再说，以讹传讹越传越多....

大年初四发表《红盟只会蹭！》打假了红盟后，逼着对方周五赶紧发文澄清和DeepSeek无合作....但是丝毫没影响其它小骗子，继续开直播丢垃圾软件、卖课，更有甚者跑过来直接贴脸开大！说我们还叫什么网络尖刀....问我们懂安全？懂黑客？懂技术么？

懒得和SB争论，我怕分不清到底谁是SB，算了。

DeepSeek的是一直想写的，拖到现在主要俩原因，一个是我懒、另外一个是技术迭代的太快了，出现了太多新东西，虽然网络尖刀从17年开始成立人工智能实验室，从NLP开始搞，但去年休息了大半年啥也没干，平时搞点小研究在安全的事儿上没掉队，但是在人工智能这方面很多东西我确实是没跟上的。

春节的这段时间在家一直啃paper，看各种论文，再对照网上那些乱七八糟的爆火科普，发现里面很多东西都是断章取义存在错误和误解的，我想还是把我个人理解的东西做一个记录，也算和大家有一些小分享。

先说攻击事件

相信这种AI合成的内容，春节的时候大家在朋友圈还有抖音都刷到过：

DeepSeek被攻击这个事情确实是真的！但是网上各种霸屏的“红客反击”、“华为与360守护”，乱七八糟的信息全部都是假的！

事情的开端是DeepSeek被攻击时，某数字公司大R在抖音发言，声称愿意提供技术协助，把网络攻击直接直指到“某个国家”，视频中从头到尾全是在推广自己，无论是反复提及的“自有AI产品”，还是扬言自己的专线机房多厉害，甚至声称“能攻破其的黑客还没出生”，连续几天蹭着热度一顿操作。

接着爱蹭一蹭就是啥也攻进不去的红盟，果然出现开始发各种公告、声明！随后就开启了惯用套路开直播、卖课！公益捐款！321上连接！

自媒体也不能闲着，于是大家就铺天盖地的看到了这些大概率是通过AI生成的假新闻！

假到离谱！假到令人哭笑不得！甚至发指！说真话可能会被各种营销号、无脑的带节奏说我是“叛徒”，但是我相信大部分人还是有自己的思考能力的。

关于上面这些我想说明几点：

把DeepSeek被攻击直接上升到国与国，声称某个国家的行为来攻击它，挺打脑壳的！如果是漂亮国以国家行为发起这场网络战！作为DeepSeek来说根本扛不住！也不可能抗住！
DeepSeek让华尔街、纳斯达克扑街！光英伟达就暴跌16.97%，市值一个交易日蒸发5926.58亿美元，欧美科技股市值蒸发了1.2万亿美元！这其中有多少资本家？投资者不恨的牙痒痒？这个规模的流量攻击，其实就是单纯的报复罢了！
我说流量攻击，是因为根据奇安信的报告[1]中，1月28日3点开始还伴随了大量暴力破解攻击，这些攻击IP全部来自美国！这部分攻击可能和上面的流量攻击是两波不同的攻击者，他们更倾向于Z治，甚至可以归纳为“商业竞争”目的！海外AI巨头OpenAI、Meta...哪一个在这个时间点不想窥探DeepSeek的核心技术呢？
所谓的能攻破XX系统的黑客还没出生，这句话是极其不负责任的，国内外各互联网厂商都有自己的安全应急响应中心（SRC），来接收、处理自己的安全问题！在安全这件事上没有绝对的安全！无非是一群又一群有原则的人，前赴后继的坚持着自己的初心罢了！搜索厂商名+安全应急响应中心，贡献榜单可以说明一切！这样的言论挺寒这些人的心的！

至于数字公司声称的提供技术支持，我在前面的文章就提过，是单方面的喊话罢了！DeepSeek在1月28日凌晨00:53:29做了一次IP切换：

这个切换的IP是华为云（疑似华为云高防IP）、海外防御用的是CloudFlare。

数字公司玩完这波流量后，股市咔咔上涨，于是拖到昨天“大方”的回应市值波动，声明：暂未向DeepSeek提供任何服务。

至于红盟，真不想回应了，上一篇文章碍于面子不想说那么透！直白一点来说红盟的价值是红盟的思想！而创建红盟的人只是一个组织者！现在的红盟是纠葛不清的商业利益！也是毫无技术的一群碰瓷、骗子罢了！

很多人干了一些事是不能公开承认的，他们用各种暗示口吻去冒领完，再发声明说无关罢了。

从乌云到现在的各厂安全应急响应中心，如果关注网络安全的，可以多关注关注0x557、安全焦点、KEEN、启明星辰、绿盟、奇安信、盘古、四叶草、知道创宇、安恒、长亭，到现在网络尖刀（KNOWSAFE）、PKAV（无糖安全）、ChaMd5、Day1、芳华绝代、米斯特、晴天组织、白帽100.....前赴后继在背后努力的安全公司和安全团队太多了，但不好意思真没你红盟的位置。

一直贩卖爱国情怀，把它作为商业化手段，迟早会被反噬。

关于绕过CUDA

最近看到最多的就是DeepSeek绕过了NVIDIA CUDA，彻底摆脱了对英伟达的依赖的言论，依据的则是DeepSeek采用了PTX编程替代了CUDA C/C++编程的相关信息。

研究了一下NVIDIA CUDA程序的编译流程：

CUDA C/C++ (.cu) → PTX（通过nvcc前端生成） → SASS（通过驱动程序JIT生成目标GPU机器码）

我想描述更准确的应该是，DeepSeek为了解决H800 GPU性能以及跨芯片通信的瓶颈，跳过了CUDA C/C++，直接从更复杂的PTX这一层开始写。

PTX（Parallel Thread Execution）是NVIDIA定义的虚拟中间表示（IR）在硬件抽象层提供面向SIMT架构的类汇编指令（如`ld.global.v4.f32`用于向量化全局内存加载），但未绑定具体GPU微架构（如Turing/Ampere）。

通过驱动程序的即时编译（JIT）转换为目标GPU的机器码（SASS），实现“一次编写，多架构运行”实现跨代兼容。

PTX是CUDA编译器将源代码（如 CUDA C/C++）转换为低级别、硬件相关的机器指令之前的一个中间件，PTX代码仍然需要CUDA的编译、运行和管理机制来执行，它本身就是NVIDIA CUDA程的一部分。

总结一下：

DeepSeek创新如果从技术角度来说其实就是通过直接操作PTX层对寄存器、线程、内存进行各种压缩优化，实现了：每个流处理器的寄存器使用率从78%提升至92%、计算单元闲置时间减少40%、全局内存访问延迟从600周期降至450周期。

从中间件直接下手，编译都少了一个环节肯定是提速的，只是DeepSeek攻克了其中的每一个困难，实现了巨大的效率提升。

按这个思路接下来肯定还有对汇编语言直接搞SASS优化的空间，预计半年内可能就会有新的发现。

当然面临的挑战就是，现在还能从汇编开始写的程序员，再多说几句都是年代感和沧桑感了。

突破

DeepSeek技术创新点真的太多了，写完上面一段后我发现如果全用大白话去写，这将是一个很长很长的文章，可能对很多普通人并不需要知道那么深，而对于追求技术的人来说，我又多此一举，还是去抠论文要好一些。

按哲学的角度来说，创新了一个新事情，就要思考N个老的事情怎么和新的事情配合！于是就要因为一个创新，实现诸多创新与改进。

比如在DeepSeek-R1-Zero中为了通过纯强化学习（RL）而不用任何监督微调（SFT）激发 LLM 的推理能力，实现让模型自己探索解决复杂问题的 CoT，生成能自我验证（self-verification）、反思（reflection）的 long-CoT。

就产生了虽然能力提升了，但是出现了各种格式、语种混杂、影响阅读性的问题，于是就在DeepSeek-R1中先构建几千条long-CoT作为强化学习（RL）初始化actor，再定义输出的格式为：

|special token|<思考过程>|special token|<答案总结>

然后又有了新的挑战，接下来再去蒸馏.....

就在我写文章的过程里，又看到了文章推送李飞飞带领的研究团队，使用16个英伟达H100 GPU进行了26分钟的训练，以不到50美元的云训练成本，通过蒸馏Gemini 2.0 Flash Thinking Experimental 得到了一个在数学和编码能力测试中的表现与OpenAI-o1以及DeepSeek-R1推理模型类似的模型。

可以预见的是今年上半年，RL强化学习、蒸馏法一定是听不完的话题。

凭什么是DeepSeek

相比Meta Llama3 405B 花了3930万H100 GPU小时，DeepSeek-v3 671B，仅用了278.8万H800 GPU小时就实现了比其花钱更少，参数更大的结果。

使用略差一点的显卡（DeepSeek H800对标 Meta H100），用了更短的时间、花更少的钱，拉开这么大差距怎么能不振奋人心呢？

量化的本质就是通过学、统计学和计算机科学的方法，将投资决策过程系统化、模型化和程序化，以提高投资决策的科学性和效率啊！

搞过套利的都清楚，技术上扣的就是如何低延迟！争的不就毫秒级的高频交易吗？至于数学模型、机器学习、成本计算确实是人家的看家本领！

DeepSeek虽然成立才2年，但其背后依托的是幻方，私募巨头、量化大佬，08年开始搞量化（人工辅助）、15年拿到基金牌照、16年推出第一个AI模型、17年就已经将所有的量化策略，通过AI模型用实盘开干！

当所有AI应用，除了提供助手陪你唠嗑外，还在探索商业化怎么落地时，人家的AI模型已经在“金融”的实盘场景中打了整整七年了！

对比其管理规模，15年5亿，17年30亿，19年200亿，21年1000亿.....自然就能对比出其AI模型能力的重要性了。

DeepSeek完全是一个有积累、有实盘经验的AI，破茧而立的！从不服真的不行！

参考链接：

1.DeepSeek遭受大量海外攻击，奇安信：面临前所未有安全考验，攻击将持续https://baijiahao.baidu.com/s?id=1822581876894009442&wfr=spider&for=pc2.DeepSeek R1技术报告 https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf3.NVidia GPU指令集架构-Load和Cache https://zhuanlan.zhihu.com/p/6924451454.NVidia GPU指令集架构-浮点运算 https://zhuanlan.zhihu.com/p/6956670445.NVidia GPU指令集架构-整数运算 https://zhuanlan.zhihu.com/p/7009219486.NVidia GPU指令集架构-比特和逻辑操作 https://zhuanlan.zhihu.com/p/7123568847.NVidia GPU指令集架构-Warp级和Uniform操作 https://zhuanlan.zhihu.com/p/712357647

关注公众号：拾黑（shiheibook）了解更多

[广告]赞助链接：

*文章为作者独立观点，不代表爱尖刀立场

本文由思念祈愿于风发表，转载此文章须经作者同意，并请附上出处( 爱尖刀 )及本页链接。

原文链接 https://www.ijiandao.com/2b/master/478223.html

曲子龙 DeepSeek CloudFlare 华为云

图库