开云体育APP
开云网址
电话:020-08980898
邮箱:admin@youweb.com
地址:广东省广州市
开云体育- 开云体育官方网站- APP下载从“卖铲子”到“开工厂”英伟达跃向“词元时代”
开云体育,开云体育官方网站,开云体育APP下载当词元成为统一计量单位,谁能以更低成本生产更多词元,谁就掌握新的定价权。
在2026年的英伟达年度开发者大会(GTC)上,CEO黄仁勋抛出一个判断:AI竞争的本质是词元(Token)生产效率的竞争。在GTC大会上,英伟达将词元定义为现代AI的基本单位,是支撑科学探索、虚拟世界以及物理世界机器运行的基石。
如今,这家靠GPU称霸AI时代的芯片巨头,正在将战场从“训练”转向“推理”,从“堆算力”转向“降成本”。
尽管GPU依然稀缺、依然重要,但“拥有算力”本身,正在让位于“如何使用算力”。综合科技媒体TechRadar发布的报告数据,当前部分企业场景算力利用率甚至不足10%,这意味着,AI产业的价值正在从“卖算力”向“用算力”转移。AWS、Microsoft Azure等云厂商,已开始从调度和计费方式入手争夺定价权。
这迫使英伟达调整战略,黄仁勋公开表示,英伟达不再只是卖GPU,而是构建“AI工厂”。《商学院》记者从英伟达方面获悉,英伟达正通过全栈架构,将数据中心重新定义为词元生产系统,使词元从技术单位逐渐变为产业计价单位。
行业开始用“每美元词元产出”和“每瓦词元产出”来衡量能力,词元不再只是模型内部变量,更成为AI经济中的基础单位。
衡量AI公司的标尺正在发生根本变化:计算的基本单位开始从GPU转向词元。
英伟达加速计算产品总监Dave Salvator认为,系统效率则取决于词元处理速度与单位成本。
《商学院》记者从英伟达方面获悉,其加速计算团队长期跟踪超大规模计算与AI数据中心演进,并判断AI正在进入以词元为核心计量单位的新阶段。在这一体系中,词元不再只是模型内部的中间变量,正在成为AI经济的基础单位。
中国社会科学院研究生院特聘导师柏文喜认为,词元经济下,商业天花板在“量”上被放大,但在“利润率”上开始承压。词元经济将算力的计量方式,从“卖硬件”转向“卖结果”,直接扩展了市场规模。当词元消耗从万亿级走向百万亿级,需求呈指数级增长。
这对英伟达而言,是典型的双刃剑:一方面,增量空间被显著打开,推理算力的需求规模正在向训练算力的百倍量级演进,叠加智能体带来的毫秒级高并发与长链路任务,底层算力基础设施必须重构,这为整个行业创造了新的增长曲线。
另一方面,利润结构正在被压缩。当前行业算力利用率普遍在30%—60%,大量GPU处于低效或闲置状态。当客户开始按词元付费,本质上只为“有效产出”买单,利用率压力将向上游传导。对英伟达来说,这意味着商业逻辑必须转变,不再是尽可能多地卖出GPU,而是让每一张卡产生更多词元。这也正是黄仁勋推动“AI工厂”的底层逻辑,把算力从静态资产变成持续运转的生产系统。
这一拐点的本质,是GPU厂商定价权的迁移,从过去依赖供给稀缺形成的“稀缺性溢价”,转向由系统效率决定的“效率溢价”。当词元成为统一计量单位,谁能以更低成本生产更多词元,谁就掌握新的定价权。
如今,行业开始用“每美元词元产出”和“每瓦词元产出”来衡量能力,词元不再只是模型内部变量,更成为AI经济中的基础单位。其直接结果是,竞争焦点从模型能力转向词元成本,在相同硬件条件下,不同系统的词元效率差异,足以拉开数量级的商业回报差距,AI产业由此进入“词元经济”阶段。
英伟达做的所有动作,本质上都是在嵌入生产过程本身,让自己不只是卖GPU,而是参与定义词元如何被生产出来。
英伟达并不直接卖词元,但它通过控制生成路径来参与定义词元。在“AI工厂”框架下,英伟达正祭出一套“组合拳”:
很多能力也在被软件化并开源,英伟达TensorRT-LLM接入各种框架,优化缓存和数据流动,本质都是在压低单位词元的浪费。
英伟达还在用一款面向“AI工厂”的逻辑仿真平台DSX Air做仿真,在硬件进数据中心之前就先跑一遍系统,对计算、网络、存储、编排与安全进行全栈模拟与验证,把可能的瓶颈提前暴露出来。这让优化不再发生在上线之后,而是提前在设计阶段完成。
据英伟达方面披露,这一机制带来三项直接变化:部署周期从数月缩短至数天;首个词元生成时间从数周压缩至数天甚至数小时;系统集成与故障排查被前移至仿真阶段完成。
汇生国际资本总裁黄立冲认为,如今,硬件已经从“卖卡”进入“被结果检验”的阶段。英伟达、云厂商、模型公司、Agent OS、算力优化平台都在同一条链上,但每一层利润点不同。AI产业不是单中心替代,而是多层护城河重估。英伟达做的所有动作,不管是开源软件还是系统化设计,本质上都是在嵌入生产过程本身,让自己不只是卖GPU,而是参与定义词元如何被生产出来。
英伟达2026财年第四季度收入达到681亿美元,同比增长约73%;数据中心收入623亿美元,同比增长约75%,仍然保持高速增长,需求主要来自Agentic AI和AI Factory(“AI工厂”)带来的持续计算负载。
但长期来看,黄立冲认为,一旦客户开始按词元、按任务、按结果来衡量成本,GPU就不再是“越多越好”的线性扩张,而要进入单位经济的比较框架。客户会直接问三个问题:同样100万词元,谁的成本更低;同样一个客服或投研Agent,谁的延迟更低、成功率更高;以及整个系统的账单是否足够透明。竞争从“供给多少算力”,转向“单位算力的经济效率”。
黄立冲表示,第一,采购语言的变化。企业是否从“买多少卡”转向“买多少词元产能、多少任务吞吐”。一旦发生这种变化,说明算力已经被产品化为服务能力,而不是硬件规模。第二,计量体系的变化。收入与成本指标是否从FLOPS转向cost per token、tokens per watt、tokens per dollar。第三,系统优化的外溢效应。包括软件调度、缓存机制、路由策略、小模型分流以及专用芯片设计,是否持续把同样任务的GPU消耗压低。如果单位任务越来越“省卡”,说明价值正在从硬件规模转向系统效率。
因此,黄立冲认为,英伟达的天花板并不是单向变化的,英伟达在AI总需求爆发阶段被放大,但在词元经济成为主导之后,又被重新拉回到单位效率约束之中。如果它只是一个GPU厂商,天花板会被压缩;但如果它把GPU、网络、软件、机柜与推理优化整合为“AI工厂”,那么它面对的就不再是芯片市场,而是整个AI生产系统的规模。
黄立冲说:“词元经济不是在削弱GPU,而是在淘汰低效GPU。最终决定定价权的,不是谁拥有更多算力,而是谁能让词元更便宜、更稳定、更可控。这个逻辑与AI经营系统是一致的:资本市场不会一直奖励我有AI项目,而会奖励可规模复制、可审计归因、可治理回滚的经营系统能力。”
词元经济并没有消解英伟达的护城河,但改变了其形态。过去,护城河建立在GPU性能与供给稀缺之上;而现在,则转向系统整合能力与成本控制能力。
英伟达并不直接销售词元,也不参与API定价,但通过GPU架构、NVLink互联、整机系统以及CUDA生态(英伟达的一套让开发者高效调用硬件算力的通用语言与工具包),深度影响词元的生成路径与成本函数。
因此,CUDA不只是工具,而是贯穿训练到推理的一整套体系,又通过GeForce连接开发者,再通过CUDA-X进入汽车、金融、医疗、工业等行业。英伟达做的事情其实很简单:尽量让不同产业运行在同一套计算框架里。黄仁勋在 GTC 2026 上提到一个例子:Fireworks AI 和 Lynn 两家公司在没有更换任何硬件的情况下,仅通过英伟达更新软件栈和推理算法,就把词元生成速度从每秒约 700 个提升到接近 5000 个。这说明,不增加硬件投入,仅靠调度和推理优化,也能把“产出效率”明显抬上去。
这种提升并不只来自芯片本身,更依赖软件体系的持续打磨。《商学院》记者从英伟达获悉,CUDA 平台目前已有约 600 万开发者。人越多,生态越丰富;生态一旦形成,后来者切换的难度也就跟着上来了。
这种“难”,不只是换个工具那么简单。主流框架对 CUDA 绑定很深,切换平台往往要重写代码,同时,开发、调试、优化的一整套流程也要跟着重来。更重要的是,工程师多年积累的调优经验,很难直接迁移。再加上围绕CUDA沉淀下来的开源项目和社区支持,一旦离开,效率和资源会大量流失。
在GitHub 上,与CUDA相关的项目已达数万,英伟达的工具链也逐渐成为AI研究中的通用选择。相比硬件,这套由开发者、工具和项目构成与成本函数的体系更难被替代。时间积累下来的使用习惯和安装基础,才是CUDA真正的护城河。
奥优国际董事长张玥更关注词元经济带来的商业变化。她提到一个很直接的转折:客户不再只是买GPU,而是开始直接买结果。算力从资产,变成服务,而且是持续消耗的那种。AI应用越多,这种消耗就越明显。在这个过程中,英伟达一边用CUDA稳住生态,一边用DGX往上走,慢慢把“卖芯片”变成“交付整套能力”。
知名财经作家、眺远影响力研究院院长高承远认为:客户一旦把算力、数据和开发环境都放进来,就很难再迁出去,收入形态也随之改变,更接近持续收费而不是一次易。价格怎么定,也不再完全跟着硬件周期走,而是看资源和效率情况。
护城河的变化也在这里得以体现。CUDA、TensorRT这些软件和GPU深度绑定,性能不再是单点突破,而是整套系统一起发挥作用,这让替代变得更难。与此同时,另一层竞争开始出现,比如调度能力、异构算力利用率、Agent的组织方式。人工智能基础设施及智算云提供商九章云极则选择把GPU用得更“满”,直接冲击按卡计费的模式。不过短期看,这类变化更多还是影响云厂商和边际需求,还没有真正动到最底层。
柏文喜认为,英伟达正从“卖GPU”走向“卖系统”,这既是其既有优势的延续,也是对产业竞争格局变化的主动重构。“AI工厂”战略本质上是将竞争维度从单一芯片性能上移至系统效率层面,即把AI基础设施从“存储与处理数据”的数据中心,重塑为“生产智能”的工厂,其核心指标也由硬件性能转向单位能耗对应的产出能力。
如今,行业开始出现分层。英伟达在高端训练上的优势仍然稳,但在推理和规模化应用这一侧,云厂商的话语权在变强。价格也不再由单一一方决定,而是分散在不同环节。
在这样的背景下,“AI工厂”成为黄仁勋重新定义数据中心的关键,它更像一个生产系统,而不是设备集合。DGX这类产品,本质上是把硬件、软件和运行环境一起交付,客户买到的,不再是一块GPU,而是一种持续产出能力。走到这一步,英伟达的位置也发生了变化,更接近基础设施本身,而不只是芯片供应商。

