未来智造局 | Token经济升温,AI基础服务如何“明码标价”?
数据显示,中国日均Token调用量已突破140万亿。不过,用户也反映,Token在使用过程中,存在模型能力缩水“变笨”、计费不明等问题。在Token经济快速升温的背景下,AI基础服务如何实现真正意义上的“明码标价”,正成为行业关注的新问题。

新华财经上海6月26日电(记者 杜康)从普通用户订阅AI应用,到开发者调用大模型接口,再到企业将大模型嵌入业务流程,Token(词元)正成为人工智能时代越来越常见的计量单位。不过,用户也反映,Token在使用过程中,存在模型能力缩水“变笨”、计费不明等问题。在Token经济快速升温的背景下,AI基础服务如何实现真正意义上的“明码标价”,正成为行业关注的新问题。
买Token,容易遭遇的三个“坑”
国家数据局数据显示,中国日均Token调用量已突破140万亿。此外,据中国信息通信研究院监测显示,2025年我国公有云企业级Token调用量约2000万亿,而2026年仅第一季度便达到这一规模。
“Token已经成为计量智能服务的基本单位。未来它将像水、电、煤等公共服务一样被计量和使用。”中国信通院华东分院人工智能事业部主任常永波表示。
不过,与水、电、通信等成熟公共服务不同,Token服务虽然已有明确报价,但用户对“自己买到的到底是什么”并不总是清楚。目前,用户使用大模型服务大体有两种方式:一种是直接通过豆包、DeepSeek等平台使用;另一种则是通过云厂商、运营商以及第三方服务平台调用模型能力。
“包括大厂和创业公司在内,目前国内已经有不少Token服务商。与用电不同,Token的售卖允许众多私营企业参与,这导致中转流通环节供应商水平和Token质量参差不齐。”常永波说。
随着Token服务商数量增加,用户选择更加丰富,但体验差异也随之显现。
目前来看,Token服务已经出现几个“常见坑”。
——“同名模型,智力却有高低”。在用户看来,各大平台上标明接入的同款明星开源模型,使用效果理应接近。但实际交互中,用户常常会感觉“有的聪明、有的笨”。
——“看着便宜,未必真的省钱”。市场上有的服务商每百万Token标价1元,有的标价3元,用户直觉上前者更划算。但在实际完成同一个复杂任务时,前者可能最终耗费100元,后者可能只需50元。看似更低的Token单价,最终使用成本可能反而更高。
——“服务体验不稳定”。有消费者反映,有些模型服务调用顺畅,响应较快;有些则会出现卡顿、延迟升高,甚至一段时间内“变笨”的情况。对普通用户而言,这意味着同样付费,体验忽好忽坏;对开发者和企业用户而言,则可能影响应用响应速度和业务连续性。
模型会“变笨”、低价未必省钱 差异到底从哪来?
为什么表面上标准化的Token计费,会在实际落地中产生如此巨大的偏差?拆解技术与商业链路,上述乱象的根源在于大模型服务与计价仍处在“黑盒”中。
首先,模型为何会“变笨”?隐蔽的“降维部署”是一大主因。清程极智联合创始人、产品副总裁师天麾解释称,一些服务商为了节省算力成本,会将原本以FP16或FP8精度部署的高质量模型,进一步量化压缩为INT8或INT4等低精度格式进行部署。模型量化本身是提升推理效率的常见方式,但可能会导致模型在复杂推理、长文本理解、代码生成等任务上的表现受到影响。
然而,服务商在报价单上依然沿用原模型名称,对部署精度避而不谈,导致用户在完全不知情的情况下买到了“缩水版”模型。
成本为何只是表面低价,实际用下来费用超标?师天麾提到一个概念——“缓存命中率”。在智能体、多轮对话、代码开发等场景中,大量请求会反复使用相同的提示词前缀。这时,“缓存命中率”会直接影响最终成本。在不少平台的计费规则中,命中缓存后的输入Token价格往往明显低于普通输入Token价格,有些可降至原价的一至两成左右。
然而,并非所有服务商都有同样的缓存能力。一些平台虽然标价很低,但缓存命中率较低,甚至不提供缓存折扣。“客户本来能省下80%到90%的钱,最终却只能按原价全额付费,总花销反而更高。”师天麾表示。
体验为何不稳定?常永波解释称,首Token时延、输出速度、吞吐量、调用成功率、稳定性等关键性能指标,都会影响AI应用是否流畅。但这些信息通常并不像价格一样清晰展示给用户。
业内人士透露,即便购买的是同款模型,头部服务商与中小平台之间延迟和吞吐量差距也可能达到4到5倍;即便是同一家服务商,其在一天不同时间段内的服务质量波动也可能达到两三倍。
构建多维标尺 让AI服务价格“算得清”
随着Token调用量持续增长,行业已经开始探索如何让AI基础服务不只是“有价格”,更能让用户看得懂、算得清、用得放心。
可以看到,关于什么是“高质量Token服务”的评价标准正在不断完善。
中国信通院人工智能研究所所长魏凯从三个维度定义高质量Token服务:智能密度、服务稳定性和安全性。他表示,业界对Token服务的关注视角,已经从“调用量”向高质量转变,Token服务也正在从粗放管理走向精益运营。
前不久,由中国信通院发起建立的公有云“大模型Token服务性能监测平台”发布,对主流Token服务平台的Token吞吐率、时延等性能进行客观量化评估。
市场化机构也在进行相关评测。清程极智联合清华大学、中国软件评测中心等机构,通过自研的Token专业评测与一站式服务平台“AI Ping”,对国内30多家正规服务商的600至700个大模型开展不间断匿名评测,相关测试结果实时发布并进行排名,为服务商改进服务和用户选择平台提供参考。
“未来用户不会长期为调用了多少Token买单,而是会为问题被解决、流程被优化、效率被提升等实际成效买单。”师天麾说。
当用户购买AI服务时,不再只比较每百万Token多少钱,而是能够同时看清模型能力、服务质量、计费规则和安全边界,AI基础服务的“明码标价”才算真正落到实处。对于正在快速发展的Token经济而言,建立统一、透明、可比较的服务标准,正是迈向成熟的重要一步。
编辑:李一帆
声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115












