Document Text
642 characters
DeepSeek正在开发其下一代AI模型——V4,而最新技术将完全运行于华为最新的AI芯片之上。一份新报告揭示了这一动态大语言模型的准备情况,并披露了其中最重要的要点。<br>
据TheInformation报道,即将推出的中国先进AI大语言模型——DeepSeek V4将采用华为AI芯片。这听起来或许只是寻常消息,因为许多中国AI初创公司如今都在转向华为。<br>
然而,这绝非一条小新闻!<br>
根据细节,V4模型将仅且完全使用华为最新的AI芯片。阿里巴巴集团、字节跳动和腾讯等公司近期已批量订购了昇腾950PR半导体。<br>
V4 AI模型预计将采用近1万亿参数的架构,可能搭配数十万颗昇腾950PR芯片,以实现1.8倍的推理加速、100万token的上下文窗口,并通过Engram技术提升效率。<br>
更多细节显示,DeepSeek已与华为以及寒武纪(中国芯片制造商)合作数月,对模型的核心代码组件进行了重写和测试。<br>
DeepSeek和华为均未证实这一消息。但该信息极有可能是真实的。长期以来,DeepSeek一直在其AI模型中使用昇腾芯片。因此,在中美关于英伟达H20出口的冲突背景下,这家AI初创公司完全转向华为并不令人意外。<br>
DeepSeek V4预计将在未来几周内发布,并以其高性能编码与推理能力著称。此外,该公司还在开发另外两个V4变体(均使用国产芯片),可能会在今年晚些时候首次亮相。<br>
届时,我们或许能了解更多关于DeepSeek V4 AI模型中将搭载多少颗昇腾950PR芯片的信息。敬请关注。
Metadata
| Publisher | 凤凰网科技 |
| Site | ifeng |
| Date | N/A |
| CMS Category | 媒体报道 |
| Keywords | 芯片 华为 模型 中国 公司 语言 细节 效率 组件 高性能 架构 核心 能力 对模型 参数 编码 代码 初创 寒武纪 消息 国产 制造商 字节 动态 情况 腾讯 集团 技术 信息 证实 新闻 变体 中将 批量 |
Verification