菲龙网编辑部7 发表于 2025-3-5 10:53

外媒再议DeepSeek:太爱编故事,但仍然是潜力股

2月27日消息,中国人工智能公司DeepSeek在1月发布其最新模型DeepSeek-R1后迅速崛起,短暂取代OpenAI的ChatGPT成为苹果应用商店下载量第一的免费应用。与此同时,幕后推动AI发展的“赋能者”(即开发AI基础设施与应用的公司)则感受到市场震荡的冲击。
DeepSeek的出现让人工智能行业的许多人重新评估人工智能模型开发所需的资源,市场意识到人工智能模型的开发可以用更低的成本、更少的算力来完成,这导致英伟达的股票在单日内跌幅超过15%。不过,这些人工智能基础设施供应商依然在继续开发专为人工智能设计的半导体芯片,扩展计算能力,并为基础模型提供运行平台。
企业人工智能平台Kolena的联合创始人兼首席执行官穆罕默德·埃尔根迪(Mohamed Elgendy)表示:“DeepSeek的方案证明,通过优化模型构建流程可大幅减少算力需求,这对英伟达来说是个糟糕的消息。然而,现在会有更多公司开始构建基础模型,而不再被那些拥有大量基础设施预算的顶级公司所垄断。”
英伟达股价在2025年迄今下跌了近9%,但这是在过去两年股价飙升近500%之后的回调。英伟达于美国当地时间周三收盘后发布了第四季度财报,华尔街分析师和投资者正密切关注DeepSeek及其对“超大规模企业”(如谷歌、甲骨文、亚马逊和微软)未来支出的潜在影响。这些企业购买了英伟达近一半的人工智能芯片。
埃尔根迪认为,DeepSeek发布的模型标志着人工智能行业的转折点,未来将朝着更加民主化的方向发展。研究人员表示,市场上已经出现了低至50美元的LLM(大语言模型)。他特别强调:“DeepSeek问世前后的行业格局已截然不同。”
基础世界模型公司Integral AI的首席执行官贾德·塔里夫(Jad Tarifi)在其2024年著作《超级智能的崛起》中写道:“尽管许多研究人员专注于提高人工智能模型的计算和数据效率,但对强大基础设施的需求仍将至关重要。即便模型趋向轻量化,预期中的实际部署仍将确保对强大算力资源的需求持续增长。”
企业AI智能体公司Vectara的首席执行官艾姆尔·阿瓦达拉(Amr Awadallah)则有略微不同的看法。他认为:“这是人工智能模型构建者和大型人工智能基础设施提供商利润率压缩的开始。整个行业收入将继续增长,甚至大幅增长,但这些大公司能够提取的利润将显著下降,因此会带来一定的压力。”
近期有报道称微软正在缩减其人工智能数据中心的建设规模,这引发了投资者的担忧。但微软对此予以否认,表示仍致力于实施其800亿美元的支出计划,但可能会“根据需要在某些基础设施领域进行战略性调整”。
阿瓦达拉将这一转变比作闪存驱动器的发展史:早期需要大量设计和开发,但如今已成为利润较低的普通商品。他认为,DeepSeek能够在低端硬件上训练其模型,而无需依赖美国大公司使用的高端硬件,实质上加速了市场商品化进程。
DeepSeek的模型运行在英特尔的Xeon和Gaudi处理器上。英特尔发言人表示,这些处理器“帮助客户以更低的成本获得强劲性能”。英特尔的Gaudi还被用于Denvr Dataworks,该公司提供兼顾性能和数据隐私的人工智能解决方案。
英特尔发言人补充称:“新的人工智能模型带来了令人兴奋的机会,但也提出了重要的考量。它们可以推动创新、提高效率并解锁新的可能性,但扩展人工智能的规模,仍然面临成本、能源使用和负责任部署等挑战。”不过,英特尔表示,其产品和服务已考虑到这些障碍。
一个有潜力的“不完美”模型
尽管业界预期DeepSeek模型会随时间推移逐步改进,但其准确性缺陷已广为人知。Vectara测试显示,DeepSeek-R1的“幻觉”率高达14.3%,远超OpenAI GPT-4的约2%,甚至高于其自身不具备推理能力的前代模型DeepSeek-V3。Kolena首席执行官埃尔根迪指出:“在对比测试中,DeepSeek在多数对抗性攻击(如越狱型攻击)中表现脆弱。这类问题曾是GPT-3数年前的短板,但主流厂商现已全面解决。”
尽管如此,埃尔根迪认为DeepSeek(或其代表的路径)犹如未经雕琢的璞玉。他表示:“我们已看到一种更高效的大型模型训练方法,且该方法确实有效。”
阿瓦达拉则认为,DeepSeek宣称仅用600万美元训练其模型的说法并不准确。他说:“我们都认为它的实际成本远高于此。也许最终模型的训练只花了600万美元,但通常需要进行许多次训练才能获得一个有效的模型。我估计它的训练成本至少为5000万美元,甚至更多。”不过,这与谷歌Gemini的1.49亿美元相比仍然要便宜很多,这甚至还未计算谷歌员工薪水。
埃尔根迪断言,以有限预算和低算力构建的基础模型将加速涌现:“此前我们认为基础模型需天量资源,但DeepSeek让遥不可及之事成为现实。此举或使开发者数量增长10倍、用户规模扩大100倍。”
他特别期待在医疗、研究、制药、会计、金融等特定领域出现更多基础模型。埃尔根迪说:“基础设施或将回归早期机器学习阶段——专业公司开发垂直领域基础模型,而这一切仍需底层支持。我相信测试和验证将成为最重要的部分,因为其他组件已经商品化。”
关于测试,埃尔根迪表示:“随着提供商增多,竞争也会加剧。DeepSeek一经发布,全行业即展开测试,其能力边界与漏洞迅速暴露无遗。”他认为,市场竞争将起到监督作用,因为“市场现在就在充当监管者的角色” 。
英伟达首席执行官黄仁勋在最近的一次预录采访中表示:“市场对R1的反应是,‘天哪,人工智能开发已经完成了’,认为人工智能不再需要更多计算了。但事实恰恰相反。”
考虑到DeepSeek及类似模型的巨大潜力,阿瓦达拉认为,人工智能基础设施提供商(如英伟达)之间的竞争将更加激烈。他表示:“只有那些能够在利润率下降的情况下依然屹立不倒的公司,方可立于不败之地。”(小小)

                  
               
               
               
               
               
               
                  
                        延伸阅读
                        
                           
                           
                           
                              英伟达营收利润仍在狂飙,老黄笑纳R1助攻
                           
                           
                           
                           
                              2月27日外媒科学网站摘要:发现癌症细胞致命弱点
                           
                           
                           
                           
                              国产报价打三折,成熟芯片行业感受中国震撼
                           
                           
                        
页: [1]
查看完整版本: 外媒再议DeepSeek:太爱编故事,但仍然是潜力股