DeepSeek V4将完全运行于华为AI芯片之上

凤凰网科技 ifeng
Document Text 642 characters
DeepSeek正在开发其下一代AI模型——V4,而最新技术将完全运行于华为最新的AI芯片之上。一份新报告揭示了这一动态大语言模型的准备情况,并披露了其中最重要的要点。<br> 据TheInformation报道,即将推出的中国先进AI大语言模型——DeepSeek V4将采用华为AI芯片。这听起来或许只是寻常消息,因为许多中国AI初创公司如今都在转向华为。<br> 然而,这绝非一条小新闻!<br> 根据细节,V4模型将仅且完全使用华为最新的AI芯片。阿里巴巴集团、字节跳动和腾讯等公司近期已批量订购了昇腾950PR半导体。<br> V4 AI模型预计将采用近1万亿参数的架构,可能搭配数十万颗昇腾950PR芯片,以实现1.8倍的推理加速、100万token的上下文窗口,并通过Engram技术提升效率。<br> 更多细节显示,DeepSeek已与华为以及寒武纪(中国芯片制造商)合作数月,对模型的核心代码组件进行了重写和测试。<br> DeepSeek和华为均未证实这一消息。但该信息极有可能是真实的。长期以来,DeepSeek一直在其AI模型中使用昇腾芯片。因此,在中美关于英伟达H20出口的冲突背景下,这家AI初创公司完全转向华为并不令人意外。<br> DeepSeek V4预计将在未来几周内发布,并以其高性能编码与推理能力著称。此外,该公司还在开发另外两个V4变体(均使用国产芯片),可能会在今年晚些时候首次亮相。<br> 届时,我们或许能了解更多关于DeepSeek V4 AI模型中将搭载多少颗昇腾950PR芯片的信息。敬请关注。
Metadata
Publisher 凤凰网科技
Site ifeng
Date N/A
CMS Category 媒体报道
Keywords 芯片 华为 模型 中国 公司 语言 细节 效率 组件 高性能 架构 核心 能力 对模型 参数 编码 代码 初创 寒武纪 消息 国产 制造商 字节 动态 情况 腾讯 集团 技术 信息 证实 新闻 变体 中将 批量