中美AI竞赛跟踪与资本震荡

AI
把这段时间的AI事件都串起来,发现中美竞争特别激烈
2025年1月20日特朗普上台,同一天DeepSeek发布R1模型,也是同一天梁文锋参加了专家、企业家和教科文卫体等领域代表座谈会(会议级别很高),并在会上发言。

2025年1月21日特朗普签署5000亿美元的“星际之门”计划,强化美国AI算力霸权。

春节期间DeepSeek凭借开源策略和低成本优势引爆全球市场,并迅速出圈,登顶中美应用商店下载榜,推动中国科技股开启估值修复行情。

2025年2月24日DeepSeek启动“开源周”,连续5天开放性能优化项目,通过算法改进降低算力需求,直指英伟达核心业务。

2025年2月26日英伟达收盘后要发布财报,从24号DeepSee计划启动“开源周”开始英伟达已连续下跌3天,市场担忧其业绩受DeepSeek技术冲击及全球算力需求萎缩双重打击,美股可能会剧烈波动。

DeepSeek给起的标题《中美AI博弈升级:DeepSeek开源突围引发美股震荡,英伟达财报成关键战场》

先持续跟踪后续
发表时间 2025-02-26 13:57     来自北京

赞同来自: JMS002

0

更名了jxjx - 分级基金好

赞同来自:

@kiencity
韭菜的自我感动,要不得。
1.而现在一台H800服务器就能部署满血版DS
答:人工智能的核心在于算力,算法和数据。算法的改进只能缓解对算力的渴求,目前市面上想要满血版的ds,就要10张A100芯片,且并发量少。更何况在民族主义叙事下,ds已经超越了本该有的价值,甚至过于被神话了。例如潞晨科技官微发文宣布将暂停DeepSeek API服务,为什么?投入与收益完全不成比例。
2.DeepSeek开源的...
  1. 潞晨科技亏钱关dp什么事,再说了潞晨在AI里能排多少?一家注册资本100万的公司。
    2.这个汇编语言不是英伟达还能是谁的?单就语言来说,c/c++,还是汇编更接近底层?越底层的语言性能越好,当然使用起来也是越难,用汇编难度比用c/c++高出几个数量级。
2025-03-04 15:25 来自山东 引用
0

Skyzh1

赞同来自:

@kiencity
韭菜的自我感动,要不得。
1.而现在一台H800服务器就能部署满血版DS
答:人工智能的核心在于算力,算法和数据。算法的改进只能缓解对算力的渴求,目前市面上想要满血版的ds,就要10张A100芯片,且并发量少。更何况在民族主义叙事下,ds已经超越了本该有的价值,甚至过于被神话了。例如潞晨科技官微发文宣布将暂停DeepSeek API服务,为什么?投入与收益完全不成比例。
2.DeepSeek开源的...
根据公开信息,DeepSeek 在技术实现中确实涉及通过汇编语言优化底层硬件性能,但其使用的汇编语言并非英伟达(NVDA)产品专用的语言,而是针对 英伟达 GPU 架构的低级指令集(如 PTX 或 SASS)进行的优化。以下是综合分析:

1. 技术背景与绕过 CUDA 的逻辑

- CUDA 是英伟达为 GPU 计算设计的并行计算平台和编程模型,通常需依赖其上层封装接口。而 DeepSeek 通过直接操作 GPU 底层指令集(如汇编级别的优化),绕过了 CUDA 的抽象层,从而提升计算效率和成本控制。
- 这种优化方式类似于直接编写针对特定硬件架构的机器码,能够更高效地利用 GPU 资源,减少因 CUDA 中间层带来的性能损耗。

2. 汇编语言的具体类型

- 英伟达 GPU 的底层指令集主要包括 PTX(Parallel Thread Execution)SASS(Shader Assembly)。前者是虚拟指令集,可跨代兼容;后者是硬件直接执行的二进制指令,与具体 GPU 架构(如 Ampere、Hopper)强相关。
- DeepSeek 的技术文档提到其优化涉及“解码内核、通信库、GEMM 库”等底层组件,结合其使用英伟达 A100 GPU 的硬件配置(如网页6所述),推测其汇编优化可能基于 SASS 或 PTX 指令集,而非通用 CPU 汇编语言。

3. 技术争议与英伟达的回应

- 部分媒体称此举可能削弱英伟达 CUDA 生态的护城河,但实际影响仍存争议。例如:
- DeepSeek 的训练仍依赖英伟达 A100 GPU,且其优化技术并未完全脱离英伟达硬件架构。
- 英伟达官方对 DeepSeek 的技术进步表示认可,认为其展示了如何利用“完全符合出口管制的计算资源”实现创新。
- 技术文档(网页8)也澄清,DeepSeek 并未完全绕过 CUDA,而是在 混合精度训练、内核优化 等方面结合了 CUDA 生态与自主优化策略。

4. 实际效果与行业意义

- 通过底层优化,DeepSeek 在训练成本上显著降低(例如 Janus-Pro 模型仅用 256 块 A100 GPU 训练两周),但其性能优势主要集中在特定任务(如多模态生成),通用算力需求仍依赖英伟达硬件。
- 这种技术路径更多是 “软硬件协同优化” 的体现,而非彻底替代 CUDA。长远来看,可能推动英伟达进一步开放底层接口或优化工具链。

结论

DeepSeek 使用的汇编语言是 针对英伟达 GPU 架构的底层指令集(如 SASS/PTX),通过直接操作硬件资源提升效率。这种技术并未脱离英伟达的硬件体系,但展示了算法与硬件协同优化的可能性,对 CUDA 生态的长期影响仍需观察。
2025-03-04 15:24 来自广东 引用
0

问心

赞同来自:

@山的那段
DeepSeek不需要做到非常优秀(其实它很优秀),它只要做到够用就行了。在它出现之前,主流声音就是more and more,算力越大越好,大家巴不得堆万卡集群甚至10万卡集群,Altman说过大模型训练一次要数千万美刀。所以我们看到企鹅向NVDA下订单都是几十亿美刀,AI成了事实上的寡头垄断游戏。想超过我,直接不给你最新的芯片;你有新的创意和私密数据但是需要算力做辅助?乖乖用我的API,给我...
汇编更加底层,各个卡区别更大。deepseek在n卡上花了这么多心思,更加不可能换平台用其他家的卡,不然投入精力全部打水漂了?
实际上开源这些,对n卡来说,如虎添翼,指望deepseek把在n卡上投入的精力,再在华为的卡,或者其他家的卡上复制一遍,那怎么追赶openai?
2025-03-04 15:02 来自广东 引用
0

kiencity

赞同来自:

@山的那段
DeepSeek不需要做到非常优秀(其实它很优秀),它只要做到够用就行了。在它出现之前,主流声音就是more and more,算力越大越好,大家巴不得堆万卡集群甚至10万卡集群,Altman说过大模型训练一次要数千万美刀。所以我们看到企鹅向NVDA下订单都是几十亿美刀,AI成了事实上的寡头垄断游戏。
想超过我,直接不给你最新的芯片;你有新的创意和私密数据但是需要算力做辅助?乖乖用我的API,给我...
韭菜的自我感动,要不得。
1.而现在一台H800服务器就能部署满血版DS
答:人工智能的核心在于算力,算法和数据。算法的改进只能缓解对算力的渴求,目前市面上想要满血版的ds,就要10张A100芯片,且并发量少。更何况在民族主义叙事下,ds已经超越了本该有的价值,甚至过于被神话了。例如潞晨科技官微发文宣布将暂停DeepSeek API服务,为什么?投入与收益完全不成比例。
2.DeepSeek开源的技术细节里使用了汇编,绕过了上层CUDA的封装,有人说它不还是依赖NVDA吗?
答:新闻告诉你前半句,没告诉你的后半句是,他用的汇编语言,是英伟达另一种语言罢了。
其他就不一一反驳了,理智才能在投资里活下来
2025-03-04 14:17 来自浙江 引用
2

山的那段

赞同来自: superwo TheQuietNomad

DeepSeek不需要做到非常优秀(其实它很优秀),它只要做到够用就行了。在它出现之前,主流声音就是more and more,算力越大越好,大家巴不得堆万卡集群甚至10万卡集群,Altman说过大模型训练一次要数千万美刀。所以我们看到企鹅向NVDA下订单都是几十亿美刀,AI成了事实上的寡头垄断游戏。
想超过我,直接不给你最新的芯片;你有新的创意和私密数据但是需要算力做辅助?乖乖用我的API,给我交着钱还用你的数据来喂我的大模型。
所以当DeepSeek出现后,它都不用做任何动作,甚至在短期内它还能促进NVDA卡的销售,但是老美试图垄断的意图就被打破了。AI原本应该是铲子的角色,利用AI辅助设计/生产的才是挖金子的人。可是老美试图让所有挖金子的人都给它们打工,卖铲子的人要拿最大头的利润。而现在一台H800服务器就能部署满血版DS,大多数中小型企业都能负担得起,它们都用得起了,也不用拿自己的私密数据去喂那些寡头的大模型了。
DeepSeek开源的技术细节里使用了汇编,绕过了上层CUDA的封装,有人说它不还是依赖NVDA吗?并不是,能用汇编说明DeepSeek的这群小伙子们是真的理解自己的工作内容,也吃透了自己的算法需要怎么去调度硬件来达到更好的效果。只要假以时日,他们完全有能力移植到别的算力平台上,所以苏妈才笑得那么开心,是的,短期内老黄的卡会卖得更好更多,但是随着其它平台移植成功,大家会有更多的选择,NVDA不再是唯一的那个。
最可乐的是,老美AI行业寡头们被打得有苦难言,而DeepSeek却一脸无辜的说:啊,我们只是在开源社区受益良多,现在轮到我们来回馈社区了。
2025-03-04 11:55修改 来自广东 引用
1

问心

赞同来自: superwo

@superwo
最近Deepseek开源周真是指着英伟达鼻子开大招
这只是说明,deepseek比英伟达,更清楚,这卡应该怎么用
2025-03-04 11:03 来自广东 引用
1

aiplus

赞同来自: TheQuietNomad

@zhangre
楼主:对潞晨科技的做法及尤洋的说法如何评价?
潞晨科技尤洋这人纯纯小丑,他自家的公司搞卖TOKEN的模式亏不起钱了就臆想DeepSeek肯定也亏不起

结果:1、DeepSeek公布了自己的理论利润率,离亏钱还远得很
2、但凡读过梁文峰的两篇访谈都知道DeepSeek就不是冲着卖TOKEN赚钱去的,是为了探索更基础更底层的架构,目前的DeepSeek API收费模式只是为了保本罢了

上周DeepSeek 开源周公布的一系列成果,甚至到了优化GPU底层代码的地步,连CUDA都绕开了,把英伟达本来该干却没干的活都给干了,这是一种纯粹的开源精神

DS开源的这些东西,压根就不是给一般个人用户准备的,用来尽可能榨取出硬件的潜力,属于最上游的部份了
2025-03-04 10:07 来自浙江 引用
1

superwo

赞同来自: chuxingfei

@双叶bloom
但是部署ds满血版 人家配置写了 最低配置要英伟达的什么级别的独立显卡..只能说是刷了一下存在感 真要对英伟达造成实质上的冲击 还是得造出同样性能的芯片.
在这里的什么级别英伟达芯片,显然是将英伟达当作计量单位,谁也无法否认英伟达是最强的,我表述的是英伟达在逐步丧失垄断地位
2025-03-04 08:29 来自北京 引用
0

superwo

赞同来自:

开会期间中美博弈会更加激烈,目前追加10%关税和禁售英伟达新加坡抓人只是开始
2025-03-04 08:20 来自北京 引用
1

superwo

赞同来自: 思则有备

@kiencity
你猜为什么他们还买a100不买华为?
华为昇腾良品率低,导致产能也不足
2025-03-03 14:53 来自北京 引用
0

zhangre

赞同来自:

@superwo
腾讯科技:读懂DeepSeek开源周:一场技术普惠的嘉年华,极限提升大模型效率https://mp.weixin.qq.com/s/FsB5ZFt1jbbNMASZpwNtBQ
楼主:对潞晨科技的做法及尤洋的说法如何评价?
2025-03-03 14:05 来自河北 引用
0

双叶bloom

赞同来自:

但是部署ds满血版 人家配置写了 最低配置要英伟达的什么级别的独立显卡..

只能说是刷了一下存在感
真要对英伟达造成实质上的冲击 还是得造出同样性能的芯片.
2025-03-03 13:54 来自天津 引用
0

kiencity

赞同来自:

@superwo
如果只是本地化部署DS,英伟达已经没有垄断了,华为昇腾完全支持本地化部署DS
你猜为什么他们还买a100不买华为?
2025-03-03 13:38 来自浙江 引用
0

superwo

赞同来自:

腾讯科技:读懂DeepSeek开源周:一场技术普惠的嘉年华,极限提升大模型效率
https://mp.weixin.qq.com/s/FsB5ZFt1jbbNMASZpwNtBQ
2025-03-03 13:07 来自北京 引用
0

思则有备

赞同来自:

DS算是“整合优化”现有技术的产物,而ai本身尚有明显需要解决的问题。宣传意义大于实际用处,目前而言,这就够了。
2025-03-02 07:04 来自四川 引用
0

superwo

赞同来自:

@zhangre
但具财经社报道目前国内H20需求激增,价格又回到一年以来的高位了。
目前算力肯定是短缺的,但在部署大模型这个领域,国产已经在快速替代了,等国产芯片产能上来一定会快速挤压英伟达,甚至出现过剩
2025-03-01 22:33 来自北京 引用
0

zhangre

赞同来自:

@superwo
如果只是本地化部署DS,英伟达已经没有垄断了,华为昇腾完全支持本地化部署DS
但具财经社报道目前国内H20需求激增,价格又回到一年以来的高位了。
2025-03-01 21:12 来自河北 引用
0

superwo

赞同来自:

@kiencity
低价的ds给了多少单位本地化部署的需要,催生了多少a100芯片的需求,英伟达笑都笑死了
如果只是本地化部署DS,英伟达已经没有垄断了,华为昇腾完全支持本地化部署DS
2025-03-01 18:13 来自北京 引用
4

kiencity

赞同来自: 阳光下生命 zhangre TheQuietNomad 地理科代表

低价的ds给了多少单位本地化部署的需要,催生了多少a100芯片的需求,英伟达笑都笑死了
2025-03-01 16:23 来自浙江 引用
0

kiencity

赞同来自:

@农村娃淘金
美股正式开始启动熊市,牛了10几年了,这次纳斯达克怎么也得跌50%。
做梦也要有个限度
2025-03-01 16:22 来自浙江 引用
0

smellybear

赞同来自:

算力还是很重要的,英伟达的最新显卡运行效率不是可以提高25倍
2025-03-01 15:31 来自北京 引用
0

superwo

赞同来自:

@x8410
Deepseek的官方api接口现在回一句话至少要等1分钟 你给我说算力过剩?

你的回复我只能看到当前这一条,去你主页才知道之前回复过,可见集思录会自动屏蔽无逻辑且宣泄情绪的回复,建议你仔细阅读上下文,欢迎心平气和带着逻辑来交流探讨
2025-03-01 13:53 来自北京 引用
2

superwo

赞同来自: 醉梦 胜珠

用终局思维去想的话,算力并不需要那么高,AI最重要的三个点:算力、算法、数据。
同时我们都知道AI大模型就是在模拟人类思考,以人类为例子算力就是大脑,大家大脑构造都一样,差异在算法和数据上,同样数据的情况下,差异在算法。Deepseek优化算法的方向是对的。
虽然算力目前是短缺的,但只要优化算法,算力一定会出现过剩。如果不优化算法,算力会一直短缺下去,永远做不到GAI。
2025-02-28 22:04 来自北京 引用
2

qtc26

赞同来自: 地理科代表 x8410

都瞎JB扯。
英伟达再垃圾也比寒武纪强吧。底层硬件控制了整个下游设计和开发链。国内GPU还在涨价呢。4090这种老古董都涨疯了。
1,预期的预期,几年后,等人手一个的时候,就会跌成白菜价,还没人买。
2,ZZ博弈。美跟俄走太近了,昔日盟友资金在撤离。说不定才刚刚开始。
2025-02-28 17:10修改 来自重庆 引用
1

zhangre

赞同来自: 地理科代表

@农村娃淘金
美股正式开始启动熊市,牛了10几年了,这次纳斯达克怎么也得跌50%。
继续看好美股不变!跌50%,纳斯达克平均市盈率多少?美股科技公司不盈利了吗?竞争中落败了吗?都没有。
2025-02-28 15:53 来自河北 引用
2

lockyz

赞同来自: 问心 superwo

@lockyz
但听报道说deepseek绕开了英伟达CUDA的50%。这个才是给了其他GPU崛起的机会。
但点文章进去看,deepseek是直接利用nvidia芯片的汇编语言编程,但汇编语言意味着注定要捆绑硬件,这其实也不算脱离了nvidia。
而一种GPU的汇编语言移植到另一种GPU,这难度相当于给你一个X86的exe,不给你C源代码,你将它改成ARM的程序。
2025-02-28 15:17修改 来自广东 引用
1

农村娃淘金

赞同来自: wdwonderone

美股正式开始启动熊市,牛了10几年了,这次纳斯达克怎么也得跌50%。
2025-02-28 14:07 来自湖北 引用
0

superwo

赞同来自:

@lockyz
nvidia的护城河是CUDA生态。假如deepseek依旧100%依赖CUDA的话,ndivia就不会有问题。但听报道说deepseek绕开了英伟达CUDA的50%。这个才是给了其他GPU崛起的机会。
最近Deepseek开源周真是指着英伟达鼻子开大招
2025-02-28 12:37 来自北京 引用
4

lockyz

赞同来自: 阳光下生命 地理科代表 happysam2018 superwo

nvidia的护城河是CUDA生态。假如deepseek依旧100%依赖CUDA的话,ndivia就不会有问题。
但听报道说deepseek绕开了英伟达CUDA的50%。这个才是给了其他GPU崛起的机会。
2025-02-28 08:42 来自广东 引用
2

superwo

赞同来自: happysam2018 hao8000

之前就预期英伟达会有大波动,计划在英伟达出财报之前做期权大波动套利,但美国金融市场太过于发达,期权的定价提前上升,没有利润空间了,就放弃了这个套利。早上翻看了一下,因为资本市场提前定价了大波动,导致这次暴跌8.5%都赚不到钱
2025-02-28 08:18 来自北京 引用
0

superwo

赞同来自:



英伟达在一众认为业绩符合预期的情况下暴跌8.5%,英伟达AI芯片领域还是最强的,
但垄断神话被Deepseek戳破了,
垄断的时候可以给你科技公司估值,
不垄断只能给制造公司估值。
2025-02-28 07:41 来自北京 引用
7

superwo

赞同来自: happus 阿戒1899 coolchan 地理科代表 happysam2018 冯天舒 yjjkwxf更多 »

美国这段时间的混乱最终指向一件事,手里没钱了

1.美国因为手里没钱并且收不上来税,富豪的税他收不到,贸易战其实是变相的给普通民众加税(关税如果是为了制造业回流,应该先等回流之后再加关税),退群也是为了缩减开支,马斯克效率部门降本增效也是为了缩减开支,让盟友们自己承担军费也是缩减开支。

2.美国现在国债利率很高,导致目前很多长期贷款到期后,重新发行的长期国债利息太高,所以耶伦在的时候大幅增加短期国债的规模(因为美国政府的国债发行后不允许提前结清赎回),就是想等以后利率降低后,再将短期国债置换为低息长期国债,以降低成本。
2025-02-26 17:50 来自北京 引用
0

superwo

赞同来自:

@更名了jxjx
刚刚开始, 这是要高位引爆美股?
有可能,但还是要等英伟达出财报,看算力需求是否受影响
2025-02-26 16:31 来自北京 引用
2

更名了jxjx - 分级基金好

赞同来自: happysam2018 yjjkwxf

刚刚开始, 这是要高位引爆美股?
2025-02-26 15:02 来自山东 引用

要回复问题请先登录注册

发起人

问题状态

  • 最新活动: 2025-03-04 15:25
  • 浏览: 5563
  • 关注: 35