AI 37% high 2026-05-31

Zhang Weiwei's 'This Is China' Episode 333: DeepSeek's Another Shock

张维为《这就是中国》第333集:DeepSeek的再次震撼-张维为、汪涛

观察者网 guancha
This episode analyzes the impact of DeepSeek V4's release on the global AI ecosystem, highlighting its introduction of a virtual hardware layer that reduces dependence on Nvidia chips and enables cross-platform AI model operation.
Document Text 2,558 characters
前段时间DeepSeek V4发布,那一天专业媒体都在进行热烈的讨论。可能大家也很想知道,DeepSeek V4究竟是什么?它的出现,又该如何理解我们中国在人工智能领域的“突围”? <br> 在东方卫视5月25日播出的《这就是中国》节目中,复旦大学中国研究院院长张维为教授与复旦大学中国研究院的特邀研究员、通信专家汪涛先生共同剖析DeepSeek V4对世界人工智能生态的重要影响,以及中国人工智能如何突出重围。 <br> 《这就是中国》第333集 <br> 汪涛演讲 <br> 4月24日,DeepSeek V4发布,再次引发全球震撼。为什么我们要用“再次震撼”这个词呢?因为一年前的2025年1月,DeepSeek-R1开源,引发了第一次的震撼。这次V4版本发布,可以说是再次“出圈”了。很重要的原因是它对整个产业生态产生了重大影响。 <br> 一年前DeepSeek第一次“出圈”引发的震撼,主要原因是两个:第一个是它带来了算法效率的颠覆性革命;第二个是开源带来的基本商业模式的改变。这两个其实是连在一起的,因为它并不是第一个开源的(大模型)。之前美国Meta的Llama、Google的Gemma、Databricks的DBRX等都是开源的。DeepSeek R1是算法效率上获得数量级提升的通用大模型,它还是开源,还是中国公司研发的,又是在业界普遍认为美国人工智能已经领先全世界的情况下,DeepSeek在这个关键的时间点上开源。所有这些要素合在一起,才引发了第一次震撼。 <br> 这次推出的V4版本,在技术性能上当然也是有很多提升的。比如说1.6万亿参数、百万级词元的上下文,效率进一步提升,其推理成本仅为GPT-5.5的七十分之一。但这些技术性能的提升,都不是这次引发如此之大震撼的核心原因。这次颠覆性的突破,在于它引入了一个关键性的“虚拟硬件层”。那我们如何理解这个“虚拟硬件层”呢? <br> 前面谈到的第一次震撼,是效率获得极大提升,这使得英伟达芯片的需求减少。因为在这个硬件之上,还有一个“护城河”是叫CUDA,它是硬件基础上的开发平台。它在过去已经形成了事实上的主流软件开发平台。在这个平台上开发的软件,虽然理论上说它可以迁移到别的芯片硬件平台上,但成本会增加,因为比较复杂,耗时很长。所以CUDA对英伟达芯片有一定锁定作用。 <br> 软件效率提升之后,意味着你原来需要5万美元芯片完成的事情,现在可能只需1万美元英伟达芯片就可以完成,但只要你还是在CUDA平台上开发了软件,还是得用英伟达的芯片。 <br> “虚拟硬件层”这个概念,并不是DeepSeek的首创,只不过DeepSeek的确是第一个在人工智能平台引入这一设计理念的。有了“虚拟硬件层”以后,软件开发就可以最大限度地脱离对底层芯片的依赖,相当于在不同的算力芯片上加了一个通用的软件平台。我们过去就把它称为操作系统。有了这个人工智能的操作系统之后,以后人们开发人工智能软件时,就可以很容易地在不同厂家的芯片上运行。 <br> 你的人工智能模型,当然可以继续用英伟达的芯片,但也可以很容易采用其他厂家如华为昇腾、寒武纪、海光、阿里、摩尔线程、沐曦股份、壁仞科技、天数智芯、燧原科技、昆仑芯、清微智能等一大批中国算力芯片。所以这些不同厂家的芯片,都变成无差异的标准算力单元。模型无需修改核心代码,就可以在任意芯片上高效运行。对客户来说,这就实现了算力的自由。也就是英伟达原来的CUDA这个“护城河”很大程度上消失了。 <br> 为了实现这一目标,DeepSeek完成了从CUDA到全栈异构的重构。业界形容这个难度“就像在万米高空换飞机的发动机一样”。它把底层代码的全栈重写了,重写了200多个核心计算单元,摆脱了对CUDA算子的依赖,核心代码同时兼容CUDA、CANN、ROCm。 <br> CANN是华为开发的神经网络计算库,ROCm是AMD(超威半导体)的人工智能开发平台。除了这些,多芯片的原生适配,是在V4发布当天,华为昇腾、寒武纪、海光等8家国产AI芯片厂商同步宣布完成全链路适配。华为昇腾950芯片,实现20毫秒超低延迟推理,单卡吞吐量达4700TPS。 <br> 华为昇腾(Ascend)团队实现了对DeepSeek-V4的Day0首发支持 <br> DeepSeek还在一些细粒度上的并行兼容,首次在正式的技术文档中,将华为与英伟达并列,验证细粒度专业并行方案,实现不同芯片集群之间的无缝协同调度。 <br> V4版本的跨芯片平台、应用程序接口(API)的标准化、开放性等,可以使软件开发人员基本上不再过多地关心底层的硬件,充分兼容现有的软硬件资源。这可以使开发和部署人工智能的软件的成本显著降低,开发周期也可以极大地缩短。有人认为,它的成本相比以前降低了70%,开发周期缩短到原来的60%。当然这个对不同的软件可能有差异,但这可以作为一个重要的参考。这样一来,将会形成一个非常重要的趋势,就是中国企业会越来越占据行业标准制定和引领方向的地位。而这个生态的地位,过去一直是由美国公司或者欧洲公司来主导。 <br> 技术和产业上的影响,其实只是一个方面。DeepSeek带来的两次震撼,还有一个是在时间点把握上带来的社会心理方面的震撼。2025年初是什么时间点呢。特朗普第二次当选美国总统,他于1月20日正式上任。他上任当天全面扩大了对中国贸易和芯片业的遏制。 <br> 然后DeepSeek-R1于1月20日当天宣布开源,并迅速冲上下载量榜首。这极大地稀释了特朗普贸易战和科技战带来的影响。今年3月,美国通过了《芯片安全法案》;4月22日,又通过了《硬件技术控制多边协调法案》,也称《MATCH法案》。这全面升级了对中国芯片的遏制。DeepSeek V4是在《MATCH法案》通过后的2天,即4月24日发布。 <br> 可以说,在时间点上,反手给美国新遏制措施一记重拳回击。在社会心理效果上,这是有相当大戏剧性的,也成为它再次“出圈”的一个重要原因,给美国的精英层带来心理上的巨大震撼。他们老是以为还可以遏制中国,但中国总是能够在出乎他们意料的方向上,迅速给予致命的还击。这就叫“你打你的,我打我的”。我们总是能够让他们的遏制措施迅速地成为全世界的笑料。这就是中国。 <br> 1 <br> 2 <br> 3 <br> 下一页 <br> 余下全文
Topics
artificial intelligence technology competition semiconductors
Metadata
Publisher 观察者网
Site guancha
Date 2026-05-31
Category report
Policy Area 人工智能
CMS Category 媒体报道