首页 > 股市 > 正文

未来智造局 | Token经济升温，AI基础服务如何“明码标价”？

新华财经|2026年06月26日

阅读量：

数据显示，中国日均Token调用量已突破140万亿。不过，用户也反映，Token在使用过程中，存在模型能力缩水“变笨”、计费不明等问题。在Token经济快速升温的背景下，AI基础服务如何实现真正意义上的“明码标价”，正成为行业关注的新问题。

未来智造局 logo.jpeg

新华财经上海6月26日电（记者杜康）从普通用户订阅AI应用，到开发者调用大模型接口，再到企业将大模型嵌入业务流程，Token（词元）正成为人工智能时代越来越常见的计量单位。不过，用户也反映，Token在使用过程中，存在模型能力缩水“变笨”、计费不明等问题。在Token经济快速升温的背景下，AI基础服务如何实现真正意义上的“明码标价”，正成为行业关注的新问题。

买Token，容易遭遇的三个“坑”

国家数据局数据显示，中国日均Token调用量已突破140万亿。此外，据中国信息通信研究院监测显示，2025年我国公有云企业级Token调用量约2000万亿，而2026年仅第一季度便达到这一规模。

“Token已经成为计量智能服务的基本单位。未来它将像水、电、煤等公共服务一样被计量和使用。”中国信通院华东分院人工智能事业部主任常永波表示。

不过，与水、电、通信等成熟公共服务不同，Token服务虽然已有明确报价，但用户对“自己买到的到底是什么”并不总是清楚。目前，用户使用大模型服务大体有两种方式：一种是直接通过豆包、DeepSeek等平台使用；另一种则是通过云厂商、运营商以及第三方服务平台调用模型能力。

“包括大厂和创业公司在内，目前国内已经有不少Token服务商。与用电不同，Token的售卖允许众多私营企业参与，这导致中转流通环节供应商水平和Token质量参差不齐。”常永波说。

随着Token服务商数量增加，用户选择更加丰富，但体验差异也随之显现。

目前来看，Token服务已经出现几个“常见坑”。

——“同名模型，智力却有高低”。在用户看来，各大平台上标明接入的同款明星开源模型，使用效果理应接近。但实际交互中，用户常常会感觉“有的聪明、有的笨”。

——“看着便宜，未必真的省钱”。市场上有的服务商每百万Token标价1元，有的标价3元，用户直觉上前者更划算。但在实际完成同一个复杂任务时，前者可能最终耗费100元，后者可能只需50元。看似更低的Token单价，最终使用成本可能反而更高。

——“服务体验不稳定”。有消费者反映，有些模型服务调用顺畅，响应较快；有些则会出现卡顿、延迟升高，甚至一段时间内“变笨”的情况。对普通用户而言，这意味着同样付费，体验忽好忽坏；对开发者和企业用户而言，则可能影响应用响应速度和业务连续性。

模型会“变笨”、低价未必省钱差异到底从哪来？

为什么表面上标准化的Token计费，会在实际落地中产生如此巨大的偏差？拆解技术与商业链路，上述乱象的根源在于大模型服务与计价仍处在“黑盒”中。

首先，模型为何会“变笨”？隐蔽的“降维部署”是一大主因。清程极智联合创始人、产品副总裁师天麾解释称，一些服务商为了节省算力成本，会将原本以FP16或FP8精度部署的高质量模型，进一步量化压缩为INT8或INT4等低精度格式进行部署。模型量化本身是提升推理效率的常见方式，但可能会导致模型在复杂推理、长文本理解、代码生成等任务上的表现受到影响。

然而，服务商在报价单上依然沿用原模型名称，对部署精度避而不谈，导致用户在完全不知情的情况下买到了“缩水版”模型。

成本为何只是表面低价，实际用下来费用超标？师天麾提到一个概念——“缓存命中率”。在智能体、多轮对话、代码开发等场景中，大量请求会反复使用相同的提示词前缀。这时，“缓存命中率”会直接影响最终成本。在不少平台的计费规则中，命中缓存后的输入Token价格往往明显低于普通输入Token价格，有些可降至原价的一至两成左右。

然而，并非所有服务商都有同样的缓存能力。一些平台虽然标价很低，但缓存命中率较低，甚至不提供缓存折扣。“客户本来能省下80%到90%的钱，最终却只能按原价全额付费，总花销反而更高。”师天麾表示。

体验为何不稳定？常永波解释称，首Token时延、输出速度、吞吐量、调用成功率、稳定性等关键性能指标，都会影响AI应用是否流畅。但这些信息通常并不像价格一样清晰展示给用户。

业内人士透露，即便购买的是同款模型，头部服务商与中小平台之间延迟和吞吐量差距也可能达到4到5倍；即便是同一家服务商，其在一天不同时间段内的服务质量波动也可能达到两三倍。

构建多维标尺让AI服务价格“算得清”

随着Token调用量持续增长，行业已经开始探索如何让AI基础服务不只是“有价格”，更能让用户看得懂、算得清、用得放心。

可以看到，关于什么是“高质量Token服务”的评价标准正在不断完善。

中国信通院人工智能研究所所长魏凯从三个维度定义高质量Token服务：智能密度、服务稳定性和安全性。他表示，业界对Token服务的关注视角，已经从“调用量”向高质量转变，Token服务也正在从粗放管理走向精益运营。

前不久，由中国信通院发起建立的公有云“大模型Token服务性能监测平台”发布，对主流Token服务平台的Token吞吐率、时延等性能进行客观量化评估。

市场化机构也在进行相关评测。清程极智联合清华大学、中国软件评测中心等机构，通过自研的Token专业评测与一站式服务平台“AI Ping”，对国内30多家正规服务商的600至700个大模型开展不间断匿名评测，相关测试结果实时发布并进行排名，为服务商改进服务和用户选择平台提供参考。

“未来用户不会长期为调用了多少Token买单，而是会为问题被解决、流程被优化、效率被提升等实际成效买单。”师天麾说。

当用户购买AI服务时，不再只比较每百万Token多少钱，而是能够同时看清模型能力、服务质量、计费规则和安全边界，AI基础服务的“明码标价”才算真正落到实处。对于正在快速发展的Token经济而言，建立统一、透明、可比较的服务标准，正是迈向成熟的重要一步。

编辑：李一帆

声明：新华财经（中国金融信息网）为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。如有问题，请联系客服：400-6123115

传播矩阵

主题

热点

首页

股票

债券

外汇

基金

期货

指数

研报金榜

合规评测

丝路数据库

新华财经

新华丝路

新华信用

新华指数

产品下载

未来智造局 | Token经济升温，AI基础服务如何“明码标价”？

传媒矩阵

友情链接