收起左侧
发新帖

DeepSeek启示录:AI巨头烧掉千亿美元,很多都是浪费

时间:2025-2-27 09:53 0 34 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x
2月25日消息,今年1月份,人工智能初创公司DeepSeek通过其新模型R1发布了两项突破性进展,悄然重新定义了人工智能经济学。该模型以仅为之前模型1/40的成本实现了顶级性能。而就在2024年12月份,DeepSeek的V3大语言模型已将训练成本降低了90%以上。
DeepSeek的两项突破性进展引发了广泛关注:首先,DeepSeek披露,要求AI模型阐述其推理过程——这一研究方法被称为“思维链提示(chain-of-thought prompting)”——提高了准确性和效率。其次,DeepSeek利用人工智能自主生成数据集,完全不依赖人工标注数据。虽然有观点认为DeepSeek的成本并非如其所言那样低,但这些突破性进展无疑开启了人工智能经济的新纪元。
人工智能的成本结构正在发生急剧变化。每一美元性能的飙升对初创企业、企业应用和基础设施投资都产生了深远影响。这种转变可能颠覆市场力量,最终帮助灵活的初创公司在短期内赶超科技巨头,同时提高利润空间。
科技巨头们已累计投入超过1000亿美元用于人工智能基础设施开发,且还在持续增加。现在,它们必须考虑如何从这些巨额投资中获取回报,并维持对算法的优势,以应对更加灵活的小型市场竞争者。面对快速变化的环境,无论是科技巨头还是初创企业,都面临一个明确的信号:迅速抓住技术进步的机会,否则将被淘汰。
DeepSeek之前与之后的AI市场格局
在DeepSeek崛起之前,初创企业难以与科技巨头在基础设施支出上抗衡,这些巨头每季度投入巨额资金建设大型数据中心,并从人工智能技术进步中获得了巨大优势。这些巨头不仅拥有海量的数据资源,还聚集了大量的博士人才,并且算法的进步也依赖于它们强大的技术实力。此外,长期建立的分销网络使它们能够将产品快速推向现有客户,并通过反馈循环加速技术进步。
然而,如今初创公司已足以与科技巨头竞争。仅2025年,模型的训练成本就将下降了95%,科技巨头的基础设施优势被大幅削弱。过去三年,推理成本骤降近千倍,预计未来还将进一步下降。算法优势的持续时间已缩短至45至100天,并可能继续缩短。
当训练成本不再是关键瓶颈时,推理性能(即AI模型在实时应用中的运行表现)成为新的焦点。我们正进入一个新的阶段:更小、更便宜的模型可以提供与大型模型相媲美的能力,并且可以在性能较低的GPU上运行,延长旧版GPU的使用寿命。如果更智能的AI产品能以极低成本交付,那么初创企业终有机会超越科技巨头,同时提高利润。
高效的人力配置进一步强化了挑战者的优势。随着不再需要雇佣大量博士级人才来组建一个具有竞争力的人工智能团队,初创公司可以以远低于科技巨头的成本开发、优化和分发模型。而且,由于它们主要集中在应用层面,挑战者能够享受更高的利润空间,这与15年前云计算初创公司通过改善单位经济效益获得优势一样。
这种趋势不仅仅对初创公司有利。它也使得像Nvidia这样的公司面临更大的风险。在DeepSeek宣布之后,Nvidia的股价下跌了12%,尽管随后有所反弹。芯片制造商面临的风险加剧,因为市场需求正在从侧重训练的硬件转向更加高效的推理解决方案。消费级神经处理单元(NPU)的崛起可能会加速这一转变,使得AI模型能够在智能手机和笔记本电脑等设备上本地运行。
人工智能开支
对挑战者的利好,正是科技巨头的利空。人工智能巨头们几乎本能地将DeepSeek的主导地位与国家安全影响挂钩,试图为其开发类似技术争取支持,但却忽略了包括斯坦福大学在内的美国研究人员已经能够复制甚至超越了DeepSeek的技术。展望未来,那些在数据基础设施项目上投入巨额资金的企业可能会问:投入人工智能模型研发的巨额支出是否浪费了?如果便宜的技术效果和昂贵的技术一样好,为什么要花这么多钱?
历史趋势表明,大多数人工智能进展确实是依赖于对规模的过度资本投入。Transformer架构之所以能成功,正是因为过度训练,即超出了当时认为算法上最理想的训练量。而新的技术进步则证明,在更低成本的情况下,我们能够实现相同的性能。尽管像DeepSeek这样的高效方案显著提高了效率,但即使如此,超大规模云服务商的推陈出新仍然需要更大的数据中心,并且必须承受不断膨胀的推理成本。
然而,科技巨头并未坐以待毙。我们已经看到了一场争夺DeepSeek成就的军备竞赛,包括谷歌的Gemini模型、微软的Azure AI Foundry(AI模型工厂)和Meta的开源LLaMA等都在争夺主导地位。开源模型可能发挥关键作用。Meta首席执行官马克·扎克伯格(Mark Zuckerberg)强调了个性化人工智能的重要性——即根据个人用户的需求、文化和偏好量身定制的模型。这一愿景与人工智能开发的更广泛趋势一致:更小、更专业的模型能够在无需庞大云基础设施的情况下提供高性能。
初创公司赢得新筹码
与此同时,开源与封闭源代码巨头的目标不同,进一步增强了挑战者的优势。Meta等公司创建的开源模型将持续竞争,并降低整个生态系统的成本,而闭源模型则试图通过更好的技术收取更高的费用。初创企业可借两大阵营的竞争博弈,在每次使用中实现最佳性价比,同时提高利润率。
无论企业规模大小,都面临一个明确的信息:迅速利用其可用的特定优势——市场动态、算力和人才——否则将面临失败。技术进步的周期越来越短,从以前需要几个月甚至几年的时间来设立新的性能标准,到DeepSeek的技术突破表明,现在可能只需要41天。创新正以前所未有的速度推进,而容错空间也在迅速缩小。(小小)

                    
               
               
               
               
               
               
                    
                        延伸阅读
                        
                           
                           
                           
                                特斯拉"FSD"真来了 比亚迪华为们怎么接招
                           
                           
                           
                           
                                2月25日外媒科学网站摘要:地球躲过一劫?但未来危机或更大
                           
                           
                           
                           
                                刚刚,特斯拉官宣在华正式发布FSD功能
                           
                           
                        
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部