DeepSeek开源第三弹：核心代码仅300行，榨干GPU！“宇宙最重要财报”明早来袭，英伟达能否顶得住？

菲龙网编辑部7 发表于 2025-2-27 09:54

DeepSeek开源第三弹：核心代码仅300行，榨干GPU！“宇宙最重要财报”明早来袭，英伟达能否顶得住？

每经记者：宋欣悦每经编辑：兰素英
2月26日，DeepSeek宣布开源支持稠密和MoE模型的DeepGEMM（通用矩阵乘法）计算库，可为V3/R1模型的训练和推理提供强大支持。

图片来源：X
DeepGEMM最大的特点就是简洁高效，仅有300行核心代码。但在性能上，DeepGEMM的表现非常出色，在某些情况下甚至能够超越专家精心调优的计算库，可以说是极致榨干GPU的性能潜力。
据介绍，DeepGEMM库具有以下特征：
1.同时支持密集布局和两种MoE（混合专家模型）布局；
2.使用CUDA（统一计算架构）编写，无需编译即可安装；
3.完全即时编译，即用即跑；
4.专为NVIDIA Hopper张量核心设计；
5.使用CUDA核心两级累加解决FP8张量核心累加不精确的问题。
GEMM是线性代数中的基本运算，是科学计算、机器学习、深度学习等领域中最常见的计算操作，也是许多高性能计算任务的核心。简单来说，它计算两个数据表格（矩阵）相乘的结果。这看似简单，但在AI计算中，这些矩阵可能非常庞大，含有数百万个元素，使得矩阵乘法成为整个系统中最耗时的部分之一。
然而，这样的解释对于非专业人士而言，仍然不够通俗易懂。《每日经济新闻》记者让DeepSeek-R1模型用生活场景中的示例，把DeepGEMM讲得明明白白。

在DeepGEMM计算库开源的前一天，据外媒报道，DeepSeek计划提前发布其新一代AI模型R2。据知情人士透露，R2原定于5月初发布，但现在公司希望尽快推出。据悉，新模型将在编程能力和多语言推理方面有所提升。
此前，有行业人士在Reddit中发帖表示，“DeepSeek-R2将是一次优化飞跃，而不是算法飞跃。如果说DeepSeek证明了什么，那就是他们解决优化问题的能力。”
事实上，自2月21日DeepSeek官宣将启动“开源周”以来，英伟达股价一直“跌跌不休”，三个交易日（指的是21日、24日和25日）已经累跌近10%。
而美东时间周三（北京时间2月27日凌晨）美股盘后，英伟达还将公布2025财年第四季度财报。这份号称是“宇宙最重要的财报”也是今年1月末DeepSeek横空出世后，英伟达公布的首份财报。
那么，在DeepSeek的冲击下，黄仁勋是否能够交出一份令人满意的答卷？DeepSeek的崛起对于英伟达而言，又会有什么影响？
带着上述问题，我们请出了DeepSeek，看看这位“当事人”是怎么解读的。

不仅如此，DeepSeek还给了一份“赛博韭菜味”的轻松解读：

看来
不管是一本正经分析行业趋势
还是玩创意脑洞
DeepSeek统统拿捏！
但Please！！！
别再“服务器繁忙，请稍后再试”了
还好每日经济新闻APP火速前来“救场”
最近，每经APP接入了DeepSeek
响应速度快到飞起，使用起来非常丝滑！
不管是问公司、问投资、问基金，还是自由对话，都轻松拿捏！
目前使用量已经超14万次了！
咋用呢？超简单！
https://www.nbd.com.cn/corp/2016app/index.html
再往下看
一、在每日经济新闻App首页，点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。

二、进入“每经大模型平台”页面，即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。

最近，每经“136计划”还增加了新功能：
大模型解读投资热榜。

只需点击投资热榜中的任意新闻
立即就能得到大模型的全面分析
还能一键生成图片分享给朋友。

告别“服务器繁忙”
快用每日经济新闻App吧！

页: [1]

菲龙网's Archiver

DeepSeek开源第三弹：核心代码仅300行，榨干GPU！“宇宙最重要财报”明早来袭，英伟达能否顶得住？