high 2026-06-18

In the Second Half of AI, the Competition Is Not About 'How Much You Know' but 'What You Can Do'

AI下半场，比的不是“懂多少”而是“能干啥”

人民邮电报 xinhua

This article discusses the National Data Administration's 'Action Implementation Plan for Promoting the Construction of High-Quality Industry Datasets', which aims to build high-quality datasets across key sectors by 2028 and drive AI innovation through data-driven applications. It highlights a strategic shift in China's AI development from model scale to practical industrial application.

Document Text 1,134 characters

国家数据局日前印发的《关于推进行业高质量数据集建设的行动实施方案》（以下简称《方案》）提出，到2028年底建成一批覆盖重点领域、经过应用验证的行业高质量数据集，打造一批数据驱动人工智能创新发展的典型应用场景。国家数据局的这份《方案》，给AI发展备足了“燃料”。但燃料堆在仓库里不会自动产生动力，还需要产业端的“发动机”来点燃。当数据集建设从政策文件变成车间里的生产力、从实验室的指标变成市场上的现金流，中国AI才算真正跑完了产业化的“最后一公里”。 截至2026年第一季度，全国已建成高质量数据集超过11.6万个，总体量超过960PB，日均词元调用量突破140万亿。这组数字放在全球AI竞赛的背景下看，传递的信号很清晰：中国AI的发展逻辑正在发生一次关键转向。过去两三年，业界热衷于比拼模型参数、算力规模和通用对话能力，某种程度上是一场“大力出奇迹”的竞赛。而如今，11.6万个行业数据集的布局，意味着竞争重心从“谁能聊天更溜”转向“谁能真正扎进产业里干活”。 这种转向有其必然性。通用大模型再聪明，进了工厂、农田、医院、驾驶舱，面对的都是高度专业化的场景。没有经行业数据“喂养”的模型，就像拿着百科全书去修发动机，知识渊博却无从下手。《方案》聚焦工业制造、智慧能源、交通运输，乃至低空经济、具身智能、智能驾驶等创新领域，正是因为看到了这一点——AI的下半场，比的不是“懂多少”，而是“能干啥”。 不过，数据集建起来只是第一步。960PB的数据体量已经相当可观，但真正的瓶颈不在于“有没有”，而在于“转不转得起来”。《方案》提出要形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的数据飞轮，这个表述值得细品。飞轮要转起来，靠的不是一次性把燃料堆满，而是每个环节都能持续产生动力。眼下行业数据分散沉淀、标准不一、模型适配不强，本质上就是飞轮的齿轮还没咬合好。 更深层的变化藏在“词元交易”这个提法里。《方案》提出探索词元交易等新型交易模式，构建可量化、可定价的数据价值体系。这意味着数据正从传统的“生产资料”变成可流通的“数字资产”。一旦数据的价值可以被精确计量和顺畅流通，整个AI产业的协作方式都将被重塑。数据标注企业、模型开发商、行业应用方之间的关系，将从松散的合作变成紧密的价值链条。 当然，从文件到现实还有距离。低空经济需要多模态的物理交互数据，具身智能需要高精度的仿真数据，智能驾驶需要海量的场景测试数据，这些都不是靠行政命令就能快速催生的，需要企业在真实场景中反复试错、持续回流。换句话说，高质量数据集不是“建”出来的，而是“用”出来的。只有让数据在产业应用里不断打磨、迭代、验证，才能真正称得上“高质量”。 （作者：吴霞）

Topics

artificial intelligence data governance industrial policy

Metadata

Publisher	人民邮电报
Site	xinhua
Date	2026-06-18
Category	report
Policy Area	人工智能
CMS Category	媒体报道
Keywords	数据,方案,模型,行业,应用

Verification

Original URL
https://www.news.cn/tech/20260618/7cc222f4f0ab4f668b99c7c54c9b5422/c.html

Compare with archived HTML