一人一周烧掉20亿Token，得到了三个“反常识”

每天使用超过1亿Token这个现象并非个例。2026年，随着模型能力提升、Token价格下降，越来越多企业一线知识工作者开始像使用水电、流量一样消费Token

一个人在一周之内烧掉超过20亿Token（词元）。

在2025年，这或许是一个不可思议的数字。当时在很多人的印象里，Token仍然是一种属于模型公司、云厂商和开发者的资源。

但过去一个月，《财经》研究员使用OpenAI旗下的代码生成工具Codex进行了一系列尝试。其中包括，搭建了一套覆盖亚马逊、微软、谷歌、阿里、甲骨文等主流云计算厂商的研究工作流。这套工作流其实是一个本地网页应用，它能够自动下载财报PDF文件，解析财报电话会内容，提取数十个财务指标，并自动生成图表。

在处理搭建工作流、生成报道图表等工作后，《财经》研究员的ChatGPT/Codex在5月24日-5月30日这一周消耗超过23亿Token。

按照OpenAI官网API（应用接口）定价粗略计算（输入占比99%，输出占比1%，缓存命中比例93%），这笔Token价格约合2550美元（约合1.8万元），但订阅ChatGPT/Codex每月实际花费只需200美元（约合1400元）。

Codex统计的Token使用情况

每天使用超过1亿Token这个现象并非个例。2026年，随着模型能力提升、Token价格下降，越来越多企业一线知识工作者开始像使用水电、流量一样消费Token。

《财经》近期密集调研了华为、阿里、腾讯、小米以及部分创业公司的多位一线产研、销售、运营人员。结论是，这些企业一线员工日均Token消耗量已经达到了1000万-3亿的规模。其中销售运营人员日均Token消耗量通常在千万级别。产研人员中等强度开发的日均Token消耗量达到了2亿-3亿，高强度开发可达到5亿以上。

在亲身体验和多方调研中，《财经》得到了一些“反常识”。

其一，对重度开发者来说，OpenAI很便宜。如果购买200美元/月订阅套餐并真正用满，OpenAI的Token均价低于大部分国产旗舰模型的价格。

其二，Coding（写代码）正在变成像使用Word、PPT、Excel一样简单。代码生成能力越来越不稀缺，真正稀缺的是软件架构的设计和审美能力。

其三，最终真正决定Token利用效率的并不是模型，而是人。AI降低了执行成本，却放大了判断的重要性。

对重度开发者来说，OpenAI很便宜

对绝大多数普通用户来说，每月200美元订阅ChatGPT/Codex很贵。但对重度开发者来说，它便宜到“反常”。

OpenAI的官网API定价中，GPT-5.5这款最新旗舰模型百万Token输入/输出定价是5美元/30美元。这个价格远超大部分国产旗舰模型。以DeepSeek-V4-Pro为例，百万Token输入/输出定价3元/6元。GPT-5.5官网定价是DeepSeek-V4-Pro的至少10倍以上。

但根据《财经》实际测试，OpenAI旗下Codex 200美元/月的周额度耗尽后，实际使用量超过23亿Token。若按照相同使用强度持续一个月，套餐内的Token使用规模将超过90亿——百万Token价格仅为0.16元。实际使用价格仅有官网API价格的2%左右。

《财经》调研了多位使用Codex的中国开发者发现，Codex 200美元/月的套餐内Token总额度约80亿/月-200亿/月不等。且OpenAI偶尔会刷新额度（也就是把已经使用的Token统计归零，相当于免费赠送），实际Token单价低于大部分国产旗舰模型。这几乎等于是用200美元撬动了官网API超过1万美元的Token用量。

为什么会出现这种Token单价看起来“异常低”的情况？

因为，OpenAI的商业模式像是健身房。绝大多数个人用户订阅了会员，但真正每天去锻炼的人只是少数。OpenAI的订阅分成四档——8美元/月、20美元/月、100美元/月、200美元/月。订阅后，用户既可以使用ChatGPT聊天，也可以拿Codex写代码。大型企业客户无法订阅，只能使用API，要为OpenAI付出更高的价格。

The Information今年2月援引OpenAI投资人披露的材料称，OpenAI整体毛利率约33%。这看起来并不高，但这是免费用户拖累的结果。OpenAI内部还会跟踪“Compute Margin”（计算毛利率）指标，即收入扣除推理成本（Inference Cost）后的利润率。如果仅看付费用户（包括订阅用户和API客户），这一指标已接近70%。

截至今年5月，ChatGPT周活跃用户超过10亿，个人付费订阅数突破5000万。截至今年6月，Codex周活跃用户也超过500万。换句话说，每200名ChatGPT周活跃用户中，只有1人使用Codex。每10个付费用户中，只有1人使用Codex。

OpenAI官网信息显示，截至2026年2月ChatGPT每天消息量约30亿条。照此估算，用户平均每天发送的消息仅为3.33条。

大部分用户订阅ChatGPT/Codex后，实际使用量远低于理论额度。有人每个月只进行数百、数千次对话，有人偶尔生成代码，还有人购买之后很快停止使用。真正能够每月持续消耗数十亿、数百亿Token，让Agent（智能体）工作数小时的重度用户，只是少数。

OpenAI不是根据单个用户的Token消耗量定价，而是基于整体用户池定价。OpenAI可以在大部分普通用户身上获得相对更高的利润率，补贴极少数使用Codex的重度开发者。

对OpenAI来说，Codex虽然利润不是最大的，但长远来看它是在投资开发者。

一位中国市场的模型平台从业者对《财经》表示，每月200美元的ChatGPT/ Codex订阅是用不到官网API 10%的Token价格补贴市场。它像是一个面向开发者的漏斗。OpenAI实际上是在用较低的订阅价格，筛选和吸引最有潜力的开发者客户。

他此前号召企业内的开发者每天消耗10亿Token。在他看来，在没有每天亲自消耗过数10亿Token之前，很难真正理解大规模Token使用会带来什么变化。“当你不再时时刻刻担心 Token消耗，而是允许自己持续试验时，会探索出很多过去无法想象的应用和工作模式”

Codex的低价Token其实也是在鼓励这件事情。因为，重度开发者容易影响企业的采购决策，他们可以撬动企业通过团队订阅、API付费使用Token。重度开发者甚至也是潜在的创业者，他们使用Token之后，会开发出新的AI应用，甚至会组建团队。这些Token单价更贵，消耗量更大，会为OpenAI带来更多收入。

代码能力不再稀缺，软件设计能力才稀缺

AI Coding（AI写代码）正在变得像使用Word、PPT、Excel办公三件套一样简单。

这在今天也被称为“Vibe Coding”（氛围编程）。Vibe形容的是——用户不再需要掌握编程语言，只需要凭着感觉通过聊天描述目标，AI便会自动生成代码并完成执行。

让人人都能成为Builder（建造者、开发者）。这是亚马逊AWS内部长期在思考的问题。因为软件的本质并不是编写代码。它是把不同组件、模块按照一定规则组织起来，最终解决现实世界的问题。过去，这项工作需要专业程序员完成。今天，随着AI Coding能力提升，越来越多普通人也开始具备这种能力。

今年4月，亚马逊AWS技术副总裁Mai-Lan Tomsen Bukovec（美兰·汤姆森·布科韦茨）在一场小规模沟通中对《财经》表示，AI推理正在成为一种常态化的应用。用户不必成为AI专家，任何Builder都能通过API搭建推理应用。

今年5月，阿里公共云事业部总裁刘伟光在一次规模沟通中对《财经》表示，随着2025年末，基础模型的Coding能力跨越临界点，它带来了巨大的分水岭。越来越多没有代码基础的普通人、企业内更多不懂IT的业务人员都在成为云的直接用户。

以《财经》今年5月搭建的这套研究工作流为例，研究员在缺乏代码基础情况下利用业余时间使用Codex搭建。Codex在三周内生成了254个文件、共61289行代码。这个工作流收集了五家中美云计算公司过去24个季度的财报PDF、财报电话会资料，并且解析成了图表。整个工作流的搭建、重构耗费了超过40亿Token。

一位软件工程师对《财经》表示，在2023年之前，如果完全依靠人工开发，254个文件、61289行代码的系统通常需要数月时间完成。如果是一个人从零开始设计、开发、调试和上线，至少需要半年时间。

看起来，基础模型能力跃升，它让代码能力不再稀缺。那么真正稀缺的能力是什么？答案是软件的架构设计、审美能力。

多位软件、算法工程师对《财经》表示，AI Coding用来写小应用问题不大，但随着应用复杂性不断提升，软件的架构设计、审美能力、复杂系统的管理能力变得更加重要。

这就像每个人都可以利用砖块搭建起一面墙，甚至是一个简陋的房子。但没办法像建筑师一样根据图纸进行设计，画清楚承重墙、线路图，最终指挥施工团队把建筑建成。

这是《财经》用Codex搭建研究工作流后，用Codex绘制的一张系统工作图，这还只是展现了其中的50%。图中每一个方框都是一个模块，每一条线代表一次调用、一次数据流转或一次状态依赖。红框中的部分，存在明显设计缺陷，它已经成了一个难以理清的线团。它包含了多个分支、文件、接口、任务队列、图表生成和发布链路。

研究工作流的系统工作图，红框为存在明显设计缺陷的部分

这说明，代码人人都可以用AI写，但系统复杂性并不会自动消失。

AI可以在数周内生成数万行代码、数百个文件时，软件开发的瓶颈会变成架构设计和系统管理能力。因为设计架构的目标不是把代码写得更多。它需要决定哪些模块应该存在，哪些链路应该合并，哪些路径应该删除。

否则，代码越多，系统越像一张看不懂的网。随着代码规模不断变大，它会直接导致中后期每一次生成新的代码，都会造成新的Bug（程序错误）。每修复一处，都会牵一发而动全身造成其他模块的Bug。工程师将这种现象称为“耦合”。系统越复杂，耦合越多，每一次修复Bug都可能在其他地方产生新的Bug。

一位算法工程师对《财经》表示，他在日常工作中发现，现在AI生成的代码量已经远远超过人工写代码的阶段。2023年之前，工程师写代码时，每一行代码几乎都经过思考、调试和Review（审查）。但在今天，一次任务就可能生成数百甚至上千行代码，工程师很难逐行检查。因此，“以前最大的成本是写代码，现在最大的成本是理解代码。”

人，才是决定Token效率的核心因素

从技术角度来看，最常见的理解是，芯片性能、模型能力、Agent成熟度共同决定了Token的使用效率。工程师几乎每天都在技术细节中不断提升每一枚芯片的单位Token吞吐量。单位算力成本是在这个过程中不断降低的。

不过，这些只是技术层面的问题。技术很重要，但在现实世界里，真正决定Token效率的，仍然是人。好的工程师可以直接省钱，但不够好的工程师只会浪费算力。

AI效率变高之后，人的判断力变得更重要了。指挥AI朝着正确方向走，可以提升效率。但指挥AI朝着错误的方向走，只会加速浪费Token。

《财经》在搭建研究工作流的过程中，出现了两次大方向的重构——这导致40亿Token至少有20亿被浪费在探索试错、推翻旧方案，以及系统代码重构的过程中。

“事先把问题想清楚变得更重要了。做任何一次大功能的增减之前，都需要和AI讨论清楚需求，事先写好PRD（Product Requirement Document，产品需求文档）。”一位中国头部软件公司前CEO（首席执行官）对《财经》表示，这样Token效率才能更高。

一位算法工程师对《财经》表示，技术水平高的工程师可以利用AI把问题拆清楚、设定边界、持续复盘，用更少的Token去解决更多问题。但技术水平有限的工程师则是只能用AI反复试错、生成冗余代码，不断浪费Token。

2026年初，包括阿里、腾讯、小米、美团等大型科技公司几乎都在鼓励员工使用Token。少数公司的业务部门甚至制定Token消耗排行榜，激励Token消耗量最大的员工。

部分公司的技术部门，工程师每月消耗Token的API价格甚至已在万元以上。极端情况下，单个员工的Token成本甚至接近人力成本。

一家员工数超过30万人的国际科技巨头人士对《财经》表示，他所在团队使用的Token是无限量的。他的工程师同事长期使用Claude系列模型写代码，一周Token成本高达2000美元-3000美元。

多位科技公司产研、销售和运营人员今年3月-5月对《财经》表示，企业内大规模推广AI工具后，微妙的心理变化正在出现。公司一方面鼓励员工更多使用Token，通过AI沉淀工作流程、业务经验。另一方面，不少员工担心，原本依赖个人经验形成的“隐性知识”，正在被逐步转化为Agent可调用的Skill（技能），公司正在降低对人的依赖程度。

不过，这些鼓励员工消耗Token的试验很快撞墙了。《财经》了解到的情况是，近半个月包括腾讯、小米在内的公司，都缩减了非技术岗位员工的Token额度。其中腾讯对部分非技术部门的Token缩减额度超过60%。

原因是，Token浪费严重。实际产出与消耗并不匹配。由于执行成本低，用AI不断尝试生成方案、修改方案、推翻方案现象开始变得普遍。大量Token最终浪费在无效试错。

一位中国云厂商高管此前曾对《财经》表示，从企业CIO（首席信息官）、CTO（首席技术官）的视角来看，Token消耗量并不能直接和业务价值挂钩，更多是和算力成本挂钩。

AI降低了执行成本，却没降低决策成本。Token越便宜，错误判断的放大成本越高。真正稀缺的，不是更多Token。关键是能把Token用在正确问题上的人。

无论是片面追求Token消耗量，还是追求Token收入增长，都只会扭曲真实业务价值。

216.73.217.63

一人一周烧掉20亿Token，得到了三个“反常识”

来源 | 《财经》杂志　文｜《财经》研究员吴俊宇　编辑 | 谢丽容

2026年06月05日 20:02