一个人在一周之内烧掉超过20亿Token(词元)。
在2025年,这或许是一个不可思议的数字。当时在很多人的印象里,Token仍然是一种属于模型公司、云厂商和开发者的资源。
但过去一个月,《财经》研究员使用OpenAI旗下的代码生成工具Codex进行了一系列尝试。其中包括,搭建了一套覆盖亚马逊、微软、谷歌、阿里、甲骨文等主流云计算厂商的研究工作流。这套工作流其实是一个本地网页应用,它能够自动下载财报PDF文件,解析财报电话会内容,提取数十个财务指标,并自动生成图表。
在处理搭建工作流、生成报道图表等工作后,《财经》研究员的ChatGPT/Codex在5月24日-5月30日这一周消耗超过23亿Token。
按照OpenAI官网API(应用接口)定价粗略计算(输入占比99%,输出占比1%,缓存命中比例93%),这笔Token价格约合2550美元(约合1.8万元),但订阅ChatGPT/Codex每月实际花费只需200美元(约合1400元)。

Codex统计的Token使用情况
每天使用超过1亿Token这个现象并非个例。2026年,随着模型能力提升、Token价格下降,越来越多企业一线知识工作者开始像使用水电、流量一样消费Token。
《财经》近期密集调研了华为、阿里、腾讯、小米以及部分创业公司的多位一线产研、销售、运营人员。结论是,这些企业一线员工日均Token消耗量已经达到了1000万-3亿的规模。其中销售运营人员日均Token消耗量通常在千万级别。产研人员中等强度开发的日均Token消耗量达到了2亿-3亿,高强度开发可达到5亿以上。
在亲身体验和多方调研中,《财经》得到了一些“反常识”。
其一,对重度开发者来说,OpenAI很便宜。如果购买200美元/月订阅套餐并真正用满,OpenAI的Token均价低于大部分国产旗舰模型的价格。
其二,Coding(写代码)正在变成像使用Word、PPT、Excel一样简单。代码生成能力越来越不稀缺,真正稀缺的是软件架构的设计和审美能力。
其三,最终真正决定Token利用效率的并不是模型,而是人。AI降低了执行成本,却放大了判断的重要性。
对重度开发者来说,OpenAI很便宜
对绝大多数普通用户来说,每月200美元订阅ChatGPT/Codex很贵。但对重度开发者来说,它便宜到“反常”。
OpenAI的官网API定价中,GPT-5.5这款最新旗舰模型百万Token输入/输出定价是5美元/30美元。这个价格远超大部分国产旗舰模型。以DeepSeek-V4-Pro为例,百万Token输入/输出定价3元/6元。GPT-5.5官网定价是DeepSeek-V4-Pro的至少10倍以上。
但根据《财经》实际测试,OpenAI旗下Codex 200美元/月的周额度耗尽后,实际使用量超过23亿Token。若按照相同使用强度持续一个月,套餐内的Token使用规模将超过90亿——百万Token价格仅为0.16元。实际使用价格仅有官网API价格的2%左右。
《财经》调研了多位使用Codex的中国开发者发现,Codex 200美元/月的套餐内Token总额度约80亿/月-200亿/月不等。且OpenAI偶尔会刷新额度(也就是把已经使用的Token统计归零,相当于免费赠送),实际Token单价低于大部分国产旗舰模型。这几乎等于是用200美元撬动了官网API超过1万美元的Token用量。
为什么会出现这种Token单价看起来“异常低”的情况?
因为,OpenAI的商业模式像是健身房。绝大多数个人用户订阅了会员,但真正每天去锻炼的人只是少数。OpenAI的订阅分成四档——8美元/月、20美元/月、100美元/月、200美元/月。订阅后,用户既可以使用ChatGPT聊天,也可以拿Codex写代码。大型企业客户无法订阅,只能使用API,要为OpenAI付出更高的价格。
The Information今年2月援引OpenAI投资人披露的材料称,OpenAI整体毛利率约33%。这看起来并不高,但这是免费用户拖累的结果。OpenAI内部还会跟踪“Compute Margin”(计算毛利率)指标,即收入扣除推理成本(Inference Cost)后的利润率。如果仅看付费用户(包括订阅用户和API客户),这一指标已接近70%。

截至今年5月,ChatGPT周活跃用户超过10亿,个人付费订阅数突破5000万。截至今年6月,Codex周活跃用户也超过500万。换句话说,每200名ChatGPT周活跃用户中,只有1人使用Codex。每10个付费用户中,只有1人使用Codex。
OpenAI官网信息显示,截至2026年2月ChatGPT每天消息量约30亿条。照此估算,用户平均每天发送的消息仅为3.33条。
大部分用户订阅ChatGPT/Codex后,实际使用量远低于理论额度。有人每个月只进行数百、数千次对话,有人偶尔生成代码,还有人购买之后很快停止使用。真正能够每月持续消耗数十亿、数百亿Token,让Agent(智能体)工作数小时的重度用户,只是少数。
OpenAI不是根据单个用户的Token消耗量定价,而是基于整体用户池定价。OpenAI可以在大部分普通用户身上获得相对更高的利润率,补贴极少数使用Codex的重度开发者。
对OpenAI来说,Codex虽然利润不是最大的,但长远来看它是在投资开发者。
一位中国市场的模型平台从业者对《财经》表示,每月200美元的ChatGPT/ Codex订阅是用不到官网API 10%的Token价格补贴市场。它像是一个面向开发者的漏斗。OpenAI实际上是在用较低的订阅价格,筛选和吸引最有潜力的开发者客户。
他此前号召企业内的开发者每天消耗10亿Token。在他看来,在没有每天亲自消耗过数10亿Token之前,很难真正理解大规模Token使用会带来什么变化。“当你不再时时刻刻担心 Token消耗,而是允许自己持续试验时,会探索出很多过去无法想象的应用和工作模式”
Codex的低价Token其实也是在鼓励这件事情。因为,重度开发者容易影响企业的采购决策,他们可以撬动企业通过团队订阅、API付费使用Token。重度开发者甚至也是潜在的创业者,他们使用Token之后,会开发出新的AI应用,甚至会组建团队。这些Token单价更贵,消耗量更大,会为OpenAI带来更多收入。
代码能力不再稀缺,软件设计能力才稀缺
AI Coding(AI写代码)正在变得像使用Word、PPT、Excel办公三件套一样简单。
这在今天也被称为“Vibe Coding”(氛围编程)。Vibe形容的是——用户不再需要掌握编程语言,只需要凭着感觉通过聊天描述目标,AI便会自动生成代码并完成执行。
让人人都能成为Builder(建造者、开发者)。这是亚马逊AWS内部长期在思考的问题。因为软件的本质并不是编写代码。它是把不同组件、模块按照一定规则组织起来,最终解决现实世界的问题。过去,这项工作需要专业程序员完成。今天,随着AI Coding能力提升,越来越多普通人也开始具备这种能力。
今年4月,亚马逊AWS技术副总裁Mai-Lan Tomsen Bukovec(美兰·汤姆森·布科韦茨)在一场小规模沟通中对《财经》表示,AI推理正在成为一种常态化的应用。用户不必成为AI专家,任何Builder都能通过API搭建推理应用。
今年5月,阿里公共云事业部总裁刘伟光在一次规模沟通中对《财经》表示,随着2025年末,基础模型的Coding能力跨越临界点,它带来了巨大的分水岭。越来越多没有代码基础的普通人、企业内更多不懂IT的业务人员都在成为云的直接用户。
以《财经》今年5月搭建的这套研究工作流为例,研究员在缺乏代码基础情况下利用业余时间使用Codex搭建。Codex在三周内生成了254个文件、共61289行代码。这个工作流收集了五家中美云计算公司过去24个季度的财报PDF、财报电话会资料,并且解析成了图表。整个工作流的搭建、重构耗费了超过40亿Token。
一位软件工程师对《财经》表示,在2023年之前,如果完全依靠人工开发,254个文件、61289行代码的系统通常需要数月时间完成。如果是一个人从零开始设计、开发、调试和上线,至少需要半年时间。


看起来,基础模型能力跃升,它让代码能力不再稀缺。那么真正稀缺的能力是什么?答案是软件的架构设计、审美能力。
多位软件、算法工程师对《财经》表示,AI Coding用来写小应用问题不大,但随着应用复杂性不断提升,软件的架构设计、审美能力、复杂系统的管理能力变得更加重要。
这就像每个人都可以利用砖块搭建起一面墙,甚至是一个简陋的房子。但没办法像建筑师一样根据图纸进行设计,画清楚承重墙、线路图,最终指挥施工团队把建筑建成。
这是《财经》用Codex搭建研究工作流后,用Codex绘制的一张系统工作图,这还只是展现了其中的50%。图中每一个方框都是一个模块,每一条线代表一次调用、一次数据流转或一次状态依赖。红框中的部分,存在明显设计缺陷,它已经成了一个难以理清的线团。它包含了多个分支、文件、接口、任务队列、图表生成和发布链路。

研究工作流的系统工作图,红框为存在明显设计缺陷的部分
这说明,代码人人都可以用AI写,但系统复杂性并不会自动消失。
AI可以在数周内生成数万行代码、数百个文件时,软件开发的瓶颈会变成架构设计和系统管理能力。因为设计架构的目标不是把代码写得更多。它需要决定哪些模块应该存在,哪些链路应该合并,哪些路径应该删除。
否则,代码越多,系统越像一张看不懂的网。随着代码规模不断变大,它会直接导致中后期每一次生成新的代码,都会造成新的Bug(程序错误)。每修复一处,都会牵一发而动全身造成其他模块的Bug。工程师将这种现象称为“耦合”。系统越复杂,耦合越多,每一次修复Bug都可能在其他地方产生新的Bug。
一位算法工程师对《财经》表示,他在日常工作中发现,现在AI生成的代码量已经远远超过人工写代码的阶段。2023年之前,工程师写代码时,每一行代码几乎都经过思考、调试和Review(审查)。但在今天,一次任务就可能生成数百甚至上千行代码,工程师很难逐行检查。因此,“以前最大的成本是写代码,现在最大的成本是理解代码。”
人,才是决定Token效率的核心因素
从技术角度来看,最常见的理解是,芯片性能、模型能力、Agent成熟度共同决定了Token的使用效率。工程师几乎每天都在技术细节中不断提升每一枚芯片的单位Token吞吐量。单位算力成本是在这个过程中不断降低的。
不过,这些只是技术层面的问题。技术很重要,但在现实世界里,真正决定Token效率的,仍然是人。好的工程师可以直接省钱,但不够好的工程师只会浪费算力。
AI效率变高之后,人的判断力变得更重要了。指挥AI朝着正确方向走,可以提升效率。但指挥AI朝着错误的方向走,只会加速浪费Token。
《财经》在搭建研究工作流的过程中,出现了两次大方向的重构——这导致40亿Token至少有20亿被浪费在探索试错、推翻旧方案,以及系统代码重构的过程中。
“事先把问题想清楚变得更重要了。做任何一次大功能的增减之前,都需要和AI讨论清楚需求,事先写好PRD(Product Requirement Document,产品需求文档)。”一位中国头部软件公司前CEO(首席执行官)对《财经》表示,这样Token效率才能更高。
一位算法工程师对《财经》表示,技术水平高的工程师可以利用AI把问题拆清楚、设定边界、持续复盘,用更少的Token去解决更多问题。但技术水平有限的工程师则是只能用AI反复试错、生成冗余代码,不断浪费Token。
2026年初,包括阿里、腾讯、小米、美团等大型科技公司几乎都在鼓励员工使用Token。少数公司的业务部门甚至制定Token消耗排行榜,激励Token消耗量最大的员工。
部分公司的技术部门,工程师每月消耗Token的API价格甚至已在万元以上。极端情况下,单个员工的Token成本甚至接近人力成本。
一家员工数超过30万人的国际科技巨头人士对《财经》表示,他所在团队使用的Token是无限量的。他的工程师同事长期使用Claude系列模型写代码,一周Token成本高达2000美元-3000美元。
多位科技公司产研、销售和运营人员今年3月-5月对《财经》表示,企业内大规模推广AI工具后,微妙的心理变化正在出现。公司一方面鼓励员工更多使用Token,通过AI沉淀工作流程、业务经验。另一方面,不少员工担心,原本依赖个人经验形成的“隐性知识”,正在被逐步转化为Agent可调用的Skill(技能),公司正在降低对人的依赖程度。
不过,这些鼓励员工消耗Token的试验很快撞墙了。《财经》了解到的情况是,近半个月包括腾讯、小米在内的公司,都缩减了非技术岗位员工的Token额度。其中腾讯对部分非技术部门的Token缩减额度超过60%。
原因是,Token浪费严重。实际产出与消耗并不匹配。由于执行成本低,用AI不断尝试生成方案、修改方案、推翻方案现象开始变得普遍。大量Token最终浪费在无效试错。
一位中国云厂商高管此前曾对《财经》表示,从企业CIO(首席信息官)、CTO(首席技术官)的视角来看,Token消耗量并不能直接和业务价值挂钩,更多是和算力成本挂钩。
AI降低了执行成本,却没降低决策成本。Token越便宜,错误判断的放大成本越高。真正稀缺的,不是更多Token。关键是能把Token用在正确问题上的人。
无论是片面追求Token消耗量,还是追求Token收入增长,都只会扭曲真实业务价值。
216.73.217.63
