MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

成本锐减九成,AI应用层掀起自研模型潮

头部AI应用正通过自训练专属模型替代大厂通用API,在垂直场景实现性能超越的同时将运行成本降至十分之一,独有的用户交互数据正成为新型护城河。

References

AI应用"逃离"大厂API:自研模型浪潮来袭

AI基础设施平台Baseten主管Charlie O'Neill近期观察到,包括Cursor、Notion和Cognition在内的头部AI应用,正集体将目光从大厂通用API转向基于开源权重自训练专属模型。这一趋势的背后,是成本与效果的全面逆转。

专属模型:更便宜、更精准

在特定细分场景下,经过微调的专属模型表现已能比肩甚至超越前沿大模型。36氪报道指出,随着字节跳动、百度、阿里等巨头掀起大模型价格战,API调用成本已从"以分计价"步入"以厘计价"时代——主力模型处理1500多汉字仅需0.8厘,比行业价格低99.3%。然而,即便API价格持续下探,对于日均调用量巨大的头部AI应用而言,自研模型的单位成本仍可再降九成。

数据闭环:难以复制的护城河

比成本优势更核心的是数据。以代码编辑器Cursor为例,用户最终保留或删除的代码片段构成了最精准的强化学习奖励信号。这种源自真实工作流的数据积累,使得应用层能够持续迭代模型,而大厂仅凭公开语料堆叠算力已难以追赶。

正如腾讯新闻报道所言,AI应用爆发趋势已然确定,中金数据预测AI Infra产业未来3-5年内将保持30%以上的高速增长。然而,在这场淘金热中,真正的赢家或许不只是"卖铲子"的基础设施商,更是那些掌握独家数据闭环的应用层玩家。

大厂模式的局限

大模型厂商的商业模式是用单一通用模型服务所有客户,这决定了其无法深入垂直场景建立专有数据闭环。随着模型微调门槛不断降低,AI应用维持竞争力的唯一路径是将模型与核心业务深度绑定。独占的用户交互数据,正成为这些应用不可复制的护城河。

国内大模型的发展印证了这一趋势。DeepSeek-V3、Kimi探索版等国产模型已在多项评测中超越GPT-4o,其MoE架构的高效训练策略证明,应用层完全有能力基于开源底座训练出超越通用大厂的垂直模型。