AI 50%
high
2026-05-11
Token Economy Development Must Go Beyond Data Scale
词元经济发展,不能止于数据规模
科技日报
xinhua
This article discusses the rise of the 'token economy' in China's AI industry, highlighting challenges such as data quality, data silos, regulatory gaps, and business model uncertainty, and calls for systematic improvements to unlock the full value of tokens.
Document Text
1,017 characters
近来,“词元”(Token)在互联网上频频“出圈”,对“词元经济”的讨论热度也持续不减。日前发布的《全国数据资源调查报告(2025年)》显示,2025年全国年度数据生产总量达52.26泽字节(ZB),全球占比超27%;词元调用量约21100万亿,呈指数级增长。<br>
所谓词元,是人工智能大模型处理信息的基本单元。它可以是单个汉字、标点符号,或一个词语片段。我们每次向人工智能大模型提问,以及大模型生成的文字、图片或视频等,都离不开词元的调用和运算。而词元经济,则是指在人工智能领域,围绕词元的生产、调用、分发与结算所衍生形成的新型经济形态。<br>
可以说,词元正成为人工智能产业发展的“晴雨表”。词元调用量的不断攀升,充分彰显了我国人工智能产业欣欣向荣的发展态势。“养龙虾”全网爆火,让人们切身感受到人工智能不仅会“聊天”,还能“干活”;DeepSeek-V4预览版本正式上线并同步开源,关键性能指标达到国内外领先水平;豆包大模型披露付费计划,尝试在免费版的基础上,推出包含更多增值服务的付费版本,打开国产大模型“价值变现”的商业化想象空间……<br>
当前,我国词元经济发展方兴未艾,但也面临诸多挑战。比如,在高端制造、金融投资等对精度和可靠性要求严苛的专业领域,从词元数据质量到模型推理过程,国产人工智能大模型的表现还“欠些火候”;“数据孤岛”现象依然存在,公共数据开发利用处于起步阶段,高质量数据集短缺,数据要素流通仍需“拆墙铺路”;利用人工智能大模型生成虚假信息、侵犯版权及肖像权等乱象层出不穷,亟须监管为其“套上缰绳”;人工智能大模型的商业模式尚在探索,清晰且可持续的“生意经”仍待市场验证。<br>
充分激发词元经济活力,关键在于找准制约词元价值释放的瓶颈所在,精准发力、协同推进,构建起良好的词元经济生态。例如,突破核心算法等方面的技术短板,助力国产大模型在更多实际应用场景中“落地生根”;打破“数据孤岛”,让数据要素更高效地“跑起来”;健全人工智能和数据安全领域的政策法规,为词元的生成、流转及交易划好“红线”;打通大模型商业价值闭环,培育“模型即服务”“智能体即服务”等新业态,实现技术创新与商业模式创新“双向奔赴”。<br>
推动词元经济健康发展,不应止步于词元规模的快速增长,更应着眼于发展质效的全面提升。唯有系统破解词元经济发展面临的堵点,充分释放数据要素的价值潜力,方能夯实我国人工智能产业高质量发展的根基。(文/刘园园)
Topics
artificial intelligence
data economy
token economy
Metadata
| Publisher | 科技日报 |
| Site | xinhua |
| Date | 2026-05-11 |
| Category | report |
| Policy Area | 人工智能 |
| CMS Category | 媒体报道 |
| Keywords | 词元,模型,人工智能,数据,经济 |
Verification