AI 应用公司,是不是在替模型厂商打工
最近看到一种观点,讲得很直白:
很多下游 AI 应用公司看起来是在用 LLM 提效,实际上却很难量化 AI 带来的真实收益。功能是上线了,调用量也涨了,但客户到底省了多少钱、赚了多少钱、愿不愿意为 AI 功能长期付费,并不清楚。与此同时,模型 API、云资源、推理成本和交付成本却是真金白银先花出去的。
最后的结果可能是:应用公司负责教育市场、打磨场景、承担交付和客服成本,利润却越来越多流向了上游模型厂商和云厂商。
这个判断听起来有点悲观,但我觉得不能简单把它归为“唱衰 AI”。
它指出的是 LLM 产业里一个很现实的商业问题:
模型能力已经可用,但应用层的价值闭环还没有完全跑通。
先看钱流向哪里
讨论 AI 应用有没有价值,很容易陷入两个极端。
一种极端是只看 demo。只要模型能写代码、能总结文档、能处理客服、能做 Agent,就默认它一定会带来巨大商业价值。
另一种极端是只看成本。只要推理要花钱、模型 API 要付费、云资源要扩容,就认为下游应用公司注定没有利润。
我觉得这两个判断都太快了。
真正应该先看的不是“AI 有没有用”,而是钱在产业链里怎么流。
我在整理一份 AI LLM 全球产业报告时看到一组很能说明问题的数据:
- IDC 预计全球 AI 支出将从 2024 年的 2350 亿美元增长到 2028 年超过 6300 亿美元,CAGR 约 30%。
- GenAI 在 AI 支出中的占比预计从 2024 年的 17.2% 提升到 2028 年的 32%,五年 CAGR 约 60%。
- NVIDIA FY2026 Q1 数据中心收入达到 391 亿美元,同比 +73%。
- OpenAI 在 2025 年 6 月的年化收入 run-rate 达到 100 亿美元。
- Thomson Reuters 2025 年专业服务报告显示,仅 21% 的受访组织正在衡量 GenAI ROI,59% 没有衡量,20% 不知道。
这些数字放在一起,问题就浮出来了:
上游的钱已经开始变得具体,下游的收益还经常停留在“感觉有用”。
算力厂商的收入是具体的,云厂商的资本开支是具体的,模型厂商的 ARR 是具体的。可是到了应用企业这里,经常变成“员工效率提升”“客户体验改善”“知识管理更智能”。
这些当然也可能是真的。但如果没有对应到成本下降、收入增长、留存提升、处理时长缩短、错误率下降这类指标,就很难判断它到底是不是商业收益。
AI 应用和传统 SaaS 不一样
传统 SaaS 有一个很重要的优点:边际成本相对低。
软件开发出来以后,多服务一个用户当然也有成本,比如服务器、带宽、客服、销售、运维,但核心功能的每次使用通常不会持续消耗一笔明显的外部采购成本。
AI 原生应用不一样。
只要每一次用户操作都要调用模型,就意味着每一次输出背后都有推理成本。用户越活跃,模型调用越多,成本也会跟着涨。
这会直接改变 AI 应用公司的毛利结构。
在传统 SaaS 里,用户活跃通常是好事。活跃说明产品有粘性,续费概率更高,单位经济模型更容易改善。
但在 AI 应用里,活跃用户往往意味着调用量上升。如果产品没有设计好用量边界、分层定价、模型路由和缓存机制,活跃本身就可能变成成本压力。
很多文章提到的“inference trap”,说的就是这个问题。VentureBeat 在 2025 年讨论过类似现象,把推理成本称为新的“cloud tax”。TechCrunch 在分析 AI coding startups 时也提到,AI 编程工具虽然增长很快,但高成本和薄毛利会持续压迫这类公司的商业模式。
AI 应用公司不是不能赚钱,而是没法像传统 SaaS 那样默认享受接近零边际成本的扩张逻辑。
每次调用都在重新做一遍成本测试。
ROI 算不清楚,成本就会先赢
我最认同那个观点的地方,不是“利润都会被模型厂商拿走”,而是“很多企业根本不知道 AI 带来了多少收益”。
这比成本高更危险。
成本高,至少还能优化。可以换模型,可以做 prompt 压缩,可以用小模型,可以做缓存,可以把一部分任务放到端侧或私有化部署。
但 ROI 算不清楚,就很难决定该优化什么。
比如一个客服 AI 系统,到底该看什么?
- 平均响应时间有没有下降?
- 人工客服工单量有没有下降?
- 一次解决率有没有提升?
- 客诉率有没有降低?
- 用户满意度有没有变化?
- 单次会话成本有没有低于人工替代成本?
如果这些指标没有建立起来,只看“AI 回复了多少条消息”,就很容易变成热闹但没用。
代码助手也是一样。
不能只看它补全了多少代码、生成了多少行文本,而要看更靠近业务结果的指标:开发周期有没有缩短,缺陷率有没有变化,review 成本有没有下降,复杂任务是不是仍然需要人工反复返工。
MIT NANDA 那份被广泛讨论的 2025 年企业 GenAI 报告之所以引起这么大反应,也和这个有关。媒体转述的核心结论是,大量企业 GenAI pilot 没有带来可衡量的 P&L 影响。这个数字本身可以讨论,样本和口径也值得谨慎看待,但它戳中的问题是真实的:
很多 AI 项目停在 pilot、demo、内部试用和局部提效上,没有真正嵌进业务流程,也没有进入财务指标。
当收益还没进入财务指标时,成本已经进入账单了。
下游企业到底在承担什么
把“应用公司替模型厂商打工”这句话拆开看,里面压着几类成本。
最直接的是推理成本。
模型 API、云 GPU、向量数据库、RAG 检索、日志和监控,都会随着使用量上升而变成持续成本。
更重的是交付成本。
很多企业客户不是买一个聊天框就能解决问题。它们需要接入内部系统,整理知识库,配置权限,改造流程,培训员工,还要处理合规、安全和审计问题。
市场教育也要应用公司自己承担。
客户可能觉得 AI 很新鲜,但未必知道自己应该怎么买、怎么买才算值、该用什么指标验收。应用公司要花很大力气把一个技术能力翻译成业务价值。
还有一笔容易被忽略的失败成本。
一个 AI 项目如果没跑通,下游应用公司通常已经投入了销售、实施、模型调用、客户成功和支持成本。上游模型厂商则至少已经拿到了 API 或云资源收入。
产业报告里说的结构,对应的就是这个现实:
价值捕获前置,价值兑现滞后,风险承担下沉。
这句话比“模型厂商白白牟利”更准确。
模型厂商并不是没有成本。训练、推理、安全、研发、数据中心租赁和人才投入都很贵。云厂商也要承担 Capex、折旧、电力和算力利用率压力。Microsoft FY2025 物业和设备新增投入达到 645.51 亿美元,报告里也提到 Microsoft Cloud FY2025 毛利率降至 69%,AI 基础设施扩张是影响因素之一。
所以上游不是躺着赚钱。
但它们的位置更好。
只要下游要试错、要部署、要扩张,调用和云账单就会发生。至于最终客户有没有得到 ROI,那是下游更晚才会面对的问题。
不是所有应用都会被挤压
不过,不能因此得出“应用层没机会”的结论。
应用层当然有机会,只是机会不在“套一个模型壳”。
真正有价值的 AI 应用,通常有几个共同点。
它要进入高频流程。
低频炫技功能很难支撑利润。一个月用一次的 AI 功能,即使效果不错,也很难成为客户持续付费的理由。
它还要能绑定业务结果。
客服看降本和满意度,销售看转化率和客单价,研发看交付周期和缺陷率,法务看审查时间和风险遗漏率。指标越具体,AI 的价值越容易被确认。
更关键的是,它要沉淀客户数据和流程权限。
如果一个应用只是把用户输入转给通用模型,再把回答包装一下,它的壁垒很薄。一旦模型厂商自己下场,或者竞品接入更便宜的模型,它就很难守住定价权。
但如果它掌握客户的业务数据、审批流、工具权限、行业规则和执行闭环,它就不再只是模型入口,而是业务系统的一部分。
最后,模型成本必须被管理起来。
这件事会越来越像数据库、缓存、CDN 和云成本优化。不同任务用不同模型,简单任务用小模型,复杂任务才调用强模型;能缓存就缓存,能批处理就批处理;能本地部署就评估本地部署,不能让所有请求无脑打到最贵的模型上。
AI 应用公司的核心能力,不只是“会调用模型”,还包括“知道什么时候不该调用最贵的模型”。
这其实还是 Agent 和 Workflow 的问题
这个话题也能接回我前面写过的 Agent 和 Workflow。
很多 AI 应用失败,不是因为模型不够强,而是因为产品把太多不确定性直接扔给模型。
用户给一个模糊任务,Agent 自己规划、自己调用工具、自己循环执行。演示时很好看,但一到生产环境,就会遇到权限、日志、验收、异常恢复和成本控制问题。
如果一个流程本来可以拆成稳定步骤,用 Workflow 固定下来,成本和结果就都更容易测量。
比如客服场景,可以先分类,再检索知识库,再生成回复,再做合规检查,再决定是否转人工。每一步都可以统计耗时、成功率、调用成本和人工接管率。
如果直接让一个 Agent 从头到尾自由发挥,它也许能完成任务,但你很难知道成本花在哪一步,错误出在哪一步,优化应该从哪里开始。
商业上也是一样。
可控的 Workflow 更容易形成可控的单位经济模型。
不可控的 Agent 如果没有边界,就会把工程不确定性变成财务不确定性。
我会怎么看一家 AI 应用公司
如果要判断一家 AI 应用公司是不是在替模型厂商打工,我不会先看它用了哪个模型,也不会先看 demo 多惊艳。
我会先看四个指标,但重点不是把表格填满,而是看商业压力到底落在哪里。
先看推理/API 成本占收入比例。
如果客户每多用一次,公司毛利就被明显侵蚀,那它必须有很强的定价权或成本优化能力。
再看 AI 功能的真实活跃使用率。
不是注册用户,不是试用人数,也不是生成次数,而是有多少用户在关键业务流程里稳定依赖它。
还要看客户可验证 ROI。
客户能不能说清楚用了这个产品以后节省了多少时间、降低了多少成本、增加了多少收入、减少了多少风险。
最后看净收入留存率。
如果客户用一段时间后愿意扩容、加购、续费,说明产品可能真的进入了流程。如果只靠新客户和融资维持增长,那就要小心。
这四个指标比“我们接入了最强模型”重要得多。
因为最强模型不是商业模式。
最后:AI 应用层要学会算账
我对这个观点的结论是:
它不完全准确,但方向是对的。
不准确的地方在于,上游模型厂商和云厂商并不是无成本套利。它们也在承担巨额研发和基础设施成本。
方向对的地方在于,在当前阶段,LLM 产业确实存在价值捕获前置的问题。上游更早拿到确定收入,下游更晚证明客户价值。只要应用层不能把 AI 能力转化成可计量的业务结果,它就会在财务上变成上游增长的成本承担方。
AI 应用公司的问题,不是“要不要用 LLM”。
真正的问题是:
我花出去的每一次模型调用,最后有没有变成客户愿意长期付费的业务结果?
如果答案是清楚的,AI 就是产品能力。
如果答案说不清楚,AI 就只是账单上的一行成本。
参考资料
- 本地生成的 AI LLM 全球产业报告:
ai_llm_industry_report_2026-06-03.html - Deloitte: AI ROI: The paradox of rising investment and elusive returns
- VentureBeat: The inference trap: How cloud providers are eating your AI margins
- TechCrunch: High costs and thin margins threatening AI coding startups
- Thomson Reuters: 2025 Generative AI in Professional Services Report
- IDC: A deep dive into IDC’s global AI and generative AI spending
- NVIDIA: FY2026 Q1 financial results
- MIT NANDA 相关讨论: Fortune 对 GenAI Divide 的报道