AI 应用公司，是不是在替模型厂商打工

最近看到一种观点，讲得很直白：

很多下游 AI 应用公司看起来是在用 LLM 提效，实际上却很难量化 AI 带来的真实收益。功能是上线了，调用量也涨了，但客户到底省了多少钱、赚了多少钱、愿不愿意为 AI 功能长期付费，并不清楚。与此同时，模型 API、云资源、推理成本和交付成本却是真金白银先花出去的。

最后的结果可能是：应用公司负责教育市场、打磨场景、承担交付和客服成本，利润却越来越多流向了上游模型厂商和云厂商。

这个判断听起来有点悲观，但我觉得不能简单把它归为“唱衰 AI”。

它指出的是 LLM 产业里一个很现实的商业问题：

模型能力已经可用，但应用层的价值闭环还没有完全跑通。

先看钱流向哪里

讨论 AI 应用有没有价值，很容易陷入两个极端。

一种极端是只看 demo。只要模型能写代码、能总结文档、能处理客服、能做 Agent，就默认它一定会带来巨大商业价值。

另一种极端是只看成本。只要推理要花钱、模型 API 要付费、云资源要扩容，就认为下游应用公司注定没有利润。

我觉得这两个判断都太快了。

真正应该先看的不是“AI 有没有用”，而是钱在产业链里怎么流。

我在整理一份 AI LLM 全球产业报告时看到一组很能说明问题的数据：

IDC 预计全球 AI 支出将从 2024 年的 2350 亿美元增长到 2028 年超过 6300 亿美元，CAGR 约 30%。
GenAI 在 AI 支出中的占比预计从 2024 年的 17.2% 提升到 2028 年的 32%，五年 CAGR 约 60%。
NVIDIA FY2026 Q1 数据中心收入达到 391 亿美元，同比 +73%。
OpenAI 在 2025 年 6 月的年化收入 run-rate 达到 100 亿美元。
Thomson Reuters 2025 年专业服务报告显示，仅 21% 的受访组织正在衡量 GenAI ROI，59% 没有衡量，20% 不知道。

这些数字放在一起，问题就浮出来了：

上游的钱已经开始变得具体，下游的收益还经常停留在“感觉有用”。

算力厂商的收入是具体的，云厂商的资本开支是具体的，模型厂商的 ARR 是具体的。可是到了应用企业这里，经常变成“员工效率提升”“客户体验改善”“知识管理更智能”。

这些当然也可能是真的。但如果没有对应到成本下降、收入增长、留存提升、处理时长缩短、错误率下降这类指标，就很难判断它到底是不是商业收益。

AI 应用和传统 SaaS 不一样

传统 SaaS 有一个很重要的优点：边际成本相对低。

软件开发出来以后，多服务一个用户当然也有成本，比如服务器、带宽、客服、销售、运维，但核心功能的每次使用通常不会持续消耗一笔明显的外部采购成本。

AI 原生应用不一样。

只要每一次用户操作都要调用模型，就意味着每一次输出背后都有推理成本。用户越活跃，模型调用越多，成本也会跟着涨。

这会直接改变 AI 应用公司的毛利结构。

在传统 SaaS 里，用户活跃通常是好事。活跃说明产品有粘性，续费概率更高，单位经济模型更容易改善。

但在 AI 应用里，活跃用户往往意味着调用量上升。如果产品没有设计好用量边界、分层定价、模型路由和缓存机制，活跃本身就可能变成成本压力。

很多文章提到的“inference trap”，说的就是这个问题。VentureBeat 在 2025 年讨论过类似现象，把推理成本称为新的“cloud tax”。TechCrunch 在分析 AI coding startups 时也提到，AI 编程工具虽然增长很快，但高成本和薄毛利会持续压迫这类公司的商业模式。

AI 应用公司不是不能赚钱，而是没法像传统 SaaS 那样默认享受接近零边际成本的扩张逻辑。

每次调用都在重新做一遍成本测试。

ROI 算不清楚，成本就会先赢

我最认同那个观点的地方，不是“利润都会被模型厂商拿走”，而是“很多企业根本不知道 AI 带来了多少收益”。

这比成本高更危险。

成本高，至少还能优化。可以换模型，可以做 prompt 压缩，可以用小模型，可以做缓存，可以把一部分任务放到端侧或私有化部署。

但 ROI 算不清楚，就很难决定该优化什么。

比如一个客服 AI 系统，到底该看什么？

平均响应时间有没有下降？
人工客服工单量有没有下降？
一次解决率有没有提升？
客诉率有没有降低？
用户满意度有没有变化？
单次会话成本有没有低于人工替代成本？

如果这些指标没有建立起来，只看“AI 回复了多少条消息”，就很容易变成热闹但没用。

代码助手也是一样。

不能只看它补全了多少代码、生成了多少行文本，而要看更靠近业务结果的指标：开发周期有没有缩短，缺陷率有没有变化，review 成本有没有下降，复杂任务是不是仍然需要人工反复返工。

MIT NANDA 那份被广泛讨论的 2025 年企业 GenAI 报告之所以引起这么大反应，也和这个有关。媒体转述的核心结论是，大量企业 GenAI pilot 没有带来可衡量的 P&L 影响。这个数字本身可以讨论，样本和口径也值得谨慎看待，但它戳中的问题是真实的：

很多 AI 项目停在 pilot、demo、内部试用和局部提效上，没有真正嵌进业务流程，也没有进入财务指标。

当收益还没进入财务指标时，成本已经进入账单了。

下游企业到底在承担什么

把“应用公司替模型厂商打工”这句话拆开看，里面压着几类成本。

最直接的是推理成本。

模型 API、云 GPU、向量数据库、RAG 检索、日志和监控，都会随着使用量上升而变成持续成本。

更重的是交付成本。

很多企业客户不是买一个聊天框就能解决问题。它们需要接入内部系统，整理知识库，配置权限，改造流程，培训员工，还要处理合规、安全和审计问题。

市场教育也要应用公司自己承担。

客户可能觉得 AI 很新鲜，但未必知道自己应该怎么买、怎么买才算值、该用什么指标验收。应用公司要花很大力气把一个技术能力翻译成业务价值。

还有一笔容易被忽略的失败成本。

一个 AI 项目如果没跑通，下游应用公司通常已经投入了销售、实施、模型调用、客户成功和支持成本。上游模型厂商则至少已经拿到了 API 或云资源收入。

产业报告里说的结构，对应的就是这个现实：

价值捕获前置，价值兑现滞后，风险承担下沉。

这句话比“模型厂商白白牟利”更准确。

模型厂商并不是没有成本。训练、推理、安全、研发、数据中心租赁和人才投入都很贵。云厂商也要承担 Capex、折旧、电力和算力利用率压力。Microsoft FY2025 物业和设备新增投入达到 645.51 亿美元，报告里也提到 Microsoft Cloud FY2025 毛利率降至 69%，AI 基础设施扩张是影响因素之一。

所以上游不是躺着赚钱。

但它们的位置更好。

只要下游要试错、要部署、要扩张，调用和云账单就会发生。至于最终客户有没有得到 ROI，那是下游更晚才会面对的问题。

不是所有应用都会被挤压

不过，不能因此得出“应用层没机会”的结论。

应用层当然有机会，只是机会不在“套一个模型壳”。

真正有价值的 AI 应用，通常有几个共同点。

它要进入高频流程。

低频炫技功能很难支撑利润。一个月用一次的 AI 功能，即使效果不错，也很难成为客户持续付费的理由。

它还要能绑定业务结果。

客服看降本和满意度，销售看转化率和客单价，研发看交付周期和缺陷率，法务看审查时间和风险遗漏率。指标越具体，AI 的价值越容易被确认。

更关键的是，它要沉淀客户数据和流程权限。

如果一个应用只是把用户输入转给通用模型，再把回答包装一下，它的壁垒很薄。一旦模型厂商自己下场，或者竞品接入更便宜的模型，它就很难守住定价权。

但如果它掌握客户的业务数据、审批流、工具权限、行业规则和执行闭环，它就不再只是模型入口，而是业务系统的一部分。

最后，模型成本必须被管理起来。

这件事会越来越像数据库、缓存、CDN 和云成本优化。不同任务用不同模型，简单任务用小模型，复杂任务才调用强模型；能缓存就缓存，能批处理就批处理；能本地部署就评估本地部署，不能让所有请求无脑打到最贵的模型上。

AI 应用公司的核心能力，不只是“会调用模型”，还包括“知道什么时候不该调用最贵的模型”。

这其实还是 Agent 和 Workflow 的问题

这个话题也能接回我前面写过的 Agent 和 Workflow。

很多 AI 应用失败，不是因为模型不够强，而是因为产品把太多不确定性直接扔给模型。

用户给一个模糊任务，Agent 自己规划、自己调用工具、自己循环执行。演示时很好看，但一到生产环境，就会遇到权限、日志、验收、异常恢复和成本控制问题。

如果一个流程本来可以拆成稳定步骤，用 Workflow 固定下来，成本和结果就都更容易测量。

比如客服场景，可以先分类，再检索知识库，再生成回复，再做合规检查，再决定是否转人工。每一步都可以统计耗时、成功率、调用成本和人工接管率。

如果直接让一个 Agent 从头到尾自由发挥，它也许能完成任务，但你很难知道成本花在哪一步，错误出在哪一步，优化应该从哪里开始。

商业上也是一样。

可控的 Workflow 更容易形成可控的单位经济模型。

不可控的 Agent 如果没有边界，就会把工程不确定性变成财务不确定性。

我会怎么看一家 AI 应用公司

如果要判断一家 AI 应用公司是不是在替模型厂商打工，我不会先看它用了哪个模型，也不会先看 demo 多惊艳。

我会先看四个指标，但重点不是把表格填满，而是看商业压力到底落在哪里。

先看推理/API 成本占收入比例。

如果客户每多用一次，公司毛利就被明显侵蚀，那它必须有很强的定价权或成本优化能力。

再看 AI 功能的真实活跃使用率。

不是注册用户，不是试用人数，也不是生成次数，而是有多少用户在关键业务流程里稳定依赖它。

还要看客户可验证 ROI。

客户能不能说清楚用了这个产品以后节省了多少时间、降低了多少成本、增加了多少收入、减少了多少风险。

最后看净收入留存率。

如果客户用一段时间后愿意扩容、加购、续费，说明产品可能真的进入了流程。如果只靠新客户和融资维持增长，那就要小心。

这四个指标比“我们接入了最强模型”重要得多。

因为最强模型不是商业模式。

最后：AI 应用层要学会算账

我对这个观点的结论是：

它不完全准确，但方向是对的。

不准确的地方在于，上游模型厂商和云厂商并不是无成本套利。它们也在承担巨额研发和基础设施成本。

方向对的地方在于，在当前阶段，LLM 产业确实存在价值捕获前置的问题。上游更早拿到确定收入，下游更晚证明客户价值。只要应用层不能把 AI 能力转化成可计量的业务结果，它就会在财务上变成上游增长的成本承担方。

AI 应用公司的问题，不是“要不要用 LLM”。

真正的问题是：

我花出去的每一次模型调用，最后有没有变成客户愿意长期付费的业务结果？

如果答案是清楚的，AI 就是产品能力。

如果答案说不清楚，AI 就只是账单上的一行成本。

参考资料

本地生成的 AI LLM 全球产业报告：ai_llm_industry_report_2026-06-03.html
Deloitte: AI ROI: The paradox of rising investment and elusive returns
VentureBeat: The inference trap: How cloud providers are eating your AI margins
TechCrunch: High costs and thin margins threatening AI coding startups
Thomson Reuters: 2025 Generative AI in Professional Services Report
IDC: A deep dive into IDC’s global AI and generative AI spending
NVIDIA: FY2026 Q1 financial results
MIT NANDA 相关讨论： Fortune 对 GenAI Divide 的报道

返回文章列表返回首页

AI 应用公司，是不是在替模型厂商打工

AI 应用公司，是不是在替模型厂商打工

先看钱流向哪里

AI 应用和传统 SaaS 不一样

ROI 算不清楚，成本就会先赢

下游企业到底在承担什么

不是所有应用都会被挤压

这其实还是 Agent 和 Workflow 的问题

我会怎么看一家 AI 应用公司

最后：AI 应用层要学会算账

参考资料

同主题继续阅读

我的应用场景到底该用 Agent，还是 Workflow

AI 大模型可监控性：从“隐瞒想法”到工程化监督

用 hooks 机制锚定 skills 工作流

多个agent协同工作，真的更强大吗

建立无环的agent工作流