近日,面向IC、ICT、AI全产业链,新紫光集团推出S80000超节点AI基础设施、N9端侧AI平台、商业航天芯片、“紫弦”三维近存架构、全栈智算互联方案、芯片设计智能体“紫灵”等多项创新成果,并宣布新紫光集团在36个细分领域处于国内或全球领先地位。
过去两年,行业资金主要流向大模型训练,上万张GPU集群、数月运转、数千万美元一次性的投入早已不是新鲜事。但进入2026年,推理算力已占到总算力需求的三分之二。
紫光展锐执行副总裁周晨算过一笔账,一个普通用户每天消耗约200万至300万Token,对应成本两三块钱,智能体普及后这一数字还会成倍增长。这意味着AI算力正从资本支出转变为日常运营支出,竞争焦点从“能不能炼出模型”转向“每Token成本能不能持续压低”。
要把Token成本压下来,行业首先面临的是物理天花板。制程逼近1纳米,先进封装成本急剧攀升,单卡性能的边际收益明显递减。更麻烦的是,单卡算力再强,也解不开大规模集群里的死结:数据搬运速度远远跟不上计算速度。
新华三集团首席技术官张弢透露,在传统以太网架构下,算力集群的模型利用率可能低至30%,超过三分之二的芯片在空转。采用高速互联方案后,这一数字可以提升到80%以上。新紫光集团董事长李滨提到,英伟达每一次系统级更新都是六个主要部件同步推进,反观国内不少芯片企业仍在走单卡升级的老路。
比互联更深层的瓶颈是内存。计算单元跑得飞快,数据却困在远处的存储器里,大量算力浪费在等待上。新紫光旗下OT公司负责人李莺表示,“紫弦”三维近存计算架构,采用3.5D封装将DRAM层、计算逻辑层和I/O芯片堆叠于一体。
据他介绍,这一架构访存延迟最大可降低18倍,在推理场景下Token吞吐率可达到英伟达B200系列的1.5至2倍。这条路线不依赖极紫外光刻机,靠先进封装和架构创新延续性能增长,对工艺线相对落后的国内产业而言,是一条务实的路。
技术之外,执行同样是关键。回看科技产业史,成熟企业擅长延续性创新,在现有轨道上持续改进;而能够改变游戏规则的技术,几乎总是从新进入者或边缘业务中生长出来。
李滨以本田摩托举例,进军北美时根据客户调研推出大排量产品,结果滞销;后来销售员骑50cc小型摩托车跑客户,反而被看中,从低端切入逐步向上,最终击败本土品牌。很多突破性创新不是听客户反馈做出来的,而是基于对市场盲区的判断。
IBM的经历更为直接。当年它把PC操作系统和处理器外包给微软和英特尔,自己专注大型机,结果把产业主导权拱手让出。大企业资源充沛,理应比小企业更适合创新,但现实往往相反。李滨分析得很直白:一个年营收千亿的部门,很难有动力去投入一个三年不盈利、前景不确定的新项目,中层管理者会倾向于保住基本盘。
老紫光集团曾陷入同样的困境。据李滨披露,重组前集团总负债近1500亿元,年利息支出约100亿元,业务横跨银行、保险、燃气、教育、地产,旗下200多家子公司各自为战。过去三年多,新紫光偿还超1100亿元本息,处置非核心资产,关停十余家子公司,处理上百起诉讼,负债降至约300亿元,重新聚焦芯片、ICT、AI三大主业。债务出清的代价高昂,但也说明:当历史包袱沉重到拖累未来时,取舍本身就是一种战略能力。
针对大型企业如何兼顾资源与创新的问题,新紫光正在尝试核心企业赋能加新设企业独立孵化的模式。前沿技术方向被拆分为独立公司,覆盖高性能CPU、3D堆叠GPU、高速互联芯片等十余个细分领域;团队持股,引入市场化投资机构;集团承担早期研发风险,核心企业作为新设公司的第一客户。
李滨坦言,你让一个年营收千亿的部门去搞一个可能三年不挣钱的新项目,部门负责人没有动力。所以我们把新公司拆出来,团队自己掏钱,集团给资源,市场给估值。
据他透露,多家新设企业成立仅两三年估值已达数十亿至近百亿元,部分公司预计最快明年申报上市。
在业内看来,AI算力竞赛正在从做出大模型,转向低成本、高效率地跑推理。这迫使技术路线、组织形态和资本逻辑进行全面调整。单卡性能的天花板使行业把目光转向互联、封装、架构创新;大型科技集团需要在规模化与灵活性之间找到平衡点;耐心和产业资源可能比单纯的资金规模更为关键。
(《财经》新媒体综编)
216.73.217.52
