关于 OpenClaw 的个人思考
本页目录
我越来越觉得,OpenClaw 这类 Claw 应用的成功,首先是产品形态的成功,其次才是模型和上下文管理终于“差不多够用”了。
如果把过去几年大众对大模型的认知压缩成一句话,那大概就是:大家一直把它当成一个很强的 chatbot。
chatbot 当然有用。它能聊天、能总结、能解释、能写文案,甚至还能在很多场景里给出超出预期的回答。但问题也正在这里。一个会说话、会整理信息、会帮你做一点轻量脑力工作的系统,很难立刻把那种“这玩意会不会真的替代掉一部分工作”的危机感大规模带到普通人面前。它更像是“隔壁家的小孩很聪明”,你会惊叹,但你未必会因此重写自己对工作和生产力的理解。
OpenClaw 这类产品不一样。它第一次比较明确地把 Token 的能力,从“回答得更好”推进到了“开始替你做事”。这一步的心理冲击,和单纯聊天体验的提升不是一个层级。前者像是工具升级,后者更像是一种新的数字劳动接口突然出现了。也正因为这样,它带来的冲击更接近 vibe coding 刚流行时程序员感受到的那种震动。
所以如果问我,OpenClaw 为什么会出圈,我的答案很直接:不是因为模型突然成熟了,而是因为它第一次把 Agent 放进了一个普通人能立刻理解、立刻传播、立刻想象到生产力后果的产品形态里。
为什么我说首先是产品形态
按照官方文档的说法,OpenClaw 是一套可连接多种聊天渠道、可接入多种模型、可通过 skills 扩展能力的 Agent 平台。官方站点 会强调它能连接很多 channels、支持技能市场和工作空间;但在我看来,真正关键的不是这些功能列表本身,而是它把 Agent 放进了用户已经习惯的入口里。
这件事特别重要。技术产品要进入日常生活,很多时候靠的不是能力边界提高了多少,而是它有没有顺着人的习惯走。用户愿意接受一个新系统,往往不是因为它在实验室指标上领先,而是因为它不要求用户先改变自己。OpenClaw 这类产品恰好抓住了这一点。它不是要求你为了 Agent 再学习一套新生活,而是顺着你已经在用的聊天入口,把 Agent 接了进去。
这也是为什么我一直觉得,类 Claw 应用真正做对的,是产品入口,而不是单点技术。
很多人讨论这类产品时,习惯把注意力都放在“模型是不是足够聪明”“上下文是不是足够长”“工具调用是不是足够稳”上。这些当然都重要,但我认为它们还不是第一推动力。因为即使模型更强、上下文更长,如果产品仍然要求用户迁移大量行为习惯,它还是很难真正进入大众生活。反过来,只要产品入口足够顺手,即使系统还很笨拙,只要它已经能把 Token 转化成某种肉眼可见的数字产出,它就会开始形成冲击。
为什么我会想到 SillyTavern
每次看到大家把很多东西包装成“Agent 新范式”,我都会想到 SillyTavern。
如果你长期看过角色扮演和长对话社区,就会发现,很多今天被重新命名成“上下文工程”“记忆系统”“人格管理”的东西,在那边其实早就被认真探索过了。SillyTavern 很早就在做世界书、关键词注入、分层记忆、摘要、历史召回这些东西。World Info / Lorebooks、Summarize 和 Smart Context 这些功能,本质上都在解决同一个问题:怎么在模型能力还不够强、上下文窗口也不够大的时候,尽可能让它说对话、说人话、记住该记住的东西。
换句话说,很多今天看起来很“Agent”的东西,其实并不是最近才被发明出来的。早在 GPT-3.5 那个上下文很小、指令遵循也远不如今天的时候,角色扮演社区就已经把一整套上下文管理技巧摸得很深了。
但这并没有让 SillyTavern 变成 OpenClaw。
原因在我看来也很简单。SillyTavern 的问题不在于探索不够,而在于它所在的赛道太小众。角色扮演天然不是主流生产力叙事的一部分,而且还会碰到情感依赖之类更敏感的问题。再加上它同样有部署成本、上下文成本和使用习惯迁移的问题,所以它很难变成一个足够主流的产品形态。
这恰好反过来说明了我的判断:不是谁先做了这些技术探索,谁就一定会赢;真正决定爆发的是,这些能力最终被放进了怎样的叙事和产品入口里。
模型能力和上下文管理为什么排第二
当然,我并不是说模型和上下文管理不重要。恰恰相反,OpenClaw 这类产品之所以能成立,正是因为这两件事已经发展到了一个“虽然还很粗糙,但足够开始干活”的阶段。
我只是认为,它们还没有跨过那个真正的临界点。今天的模型还谈不上可以稳定地把绝大部分数字化工作完全 Token 化;今天的上下文管理,也远远没有优雅到可以放心交给系统自动处理。但它们已经足够让产品第一次产生“像生产力”的样子了。
这里面最重要的变化是:Agent 自身开始成为上下文的一部分。
角色扮演系统的重心,更多是让模型像一个工作之外的人,所以它更关心语气、人格、随机性和行为风格;而面向生产力的 Agent 恰好相反,它要的是逻辑一致、遵循流程、最好还能把行为写成明确的规则、代码和工具接口。code agent 之所以会成为今天大模型变现最直接的一条主线,也和这个有关。代码天然适合表达结构化行为,而生产力 Agent 天然依赖这种结构。
在这个背景下,skill 机制就开始变得很重要。因为它意味着方法可以被固化,经验可以被复用,行为可以从一次性的对话里沉淀出来。
为什么我觉得 Hermes 又往前走了一步
OpenClaw 的 skill 机制,本质上已经是在告诉用户:你不只是可以让 Agent 帮你做一次事,还可以让它学会一种做事的方法。
Hermes 则更进一步。Nous Research 在 Hermes Agent 的仓库说明 里,明确把它描述成一个会从经验中创建技能、在使用中改进技能、跨会话搜索历史对话的系统。这个方向很重要,因为它开始把原来很多隐式存在的东西显式化了。
我会把这种变化理解为:OpenClaw 更像是“你可以命令 Agent 学会”;Hermes 更像是“系统开始尝试判断,什么经验值得被保存成 skill”。这仍然不是什么生物意义上的自我进化,但它已经非常接近一种工程化的经验积累机制了。
也正因为这样,我会觉得类 Claw 应用真正值得看的,不只是“聊天机器人终于能调工具了”,而是它们开始把“技能沉淀”“经验复用”“行为演化”这些原本属于工作流和组织层面的东西,慢慢嵌进产品本身。
我对这类产品的总体判断
如果一定要把我的看法压缩成几句话,大概就是下面这些:
OpenClaw 这类产品的爆发,首先不是模型胜利,而是产品胜利。它们成功地把 Agent 放进了大众已经习惯的聊天入口里,把 Token 的能力第一次以可感知的数字生产力形式展示了出来。
SillyTavern 这类产品说明,很多关键探索其实早就开始了;但技术探索本身并不会自动转化成主流产品影响力。真正决定能不能出圈的,是这些探索最后落进了什么产品赛道、什么社会叙事和什么用户习惯里。
而 Hermes 这类系统往前再推了一步,它开始把技能沉淀和经验复用显式化。这说明类 Claw 应用未来的竞争,不会只停留在“谁的模型更强”,而会越来越落到“谁更会组织上下文、工具、技能和经验”上。
所以在我看来,OpenClaw 真正重要的地方,不是它已经代表了 Agent 的终局,而是它第一次让很多人看见:Token 不只是会聊天,它已经开始以一种非常具体的方式,进入数字劳动本身。