关于 OpenClaw 的个人思考

less than 1 分钟阅读

本页目录

我越来越觉得，OpenClaw 这类 Claw 应用的成功，首先是产品形态的成功，其次才是模型和上下文管理终于“差不多够用”了。

如果把过去几年大众对大模型的认知压缩成一句话，那大概就是：大家一直把它当成一个很强的 chatbot。

chatbot 当然有用。它能聊天、能总结、能解释、能写文案，甚至还能在很多场景里给出超出预期的回答。但问题也正在这里。一个会说话、会整理信息、会帮你做一点轻量脑力工作的系统，很难立刻把那种“这玩意会不会真的替代掉一部分工作”的危机感大规模带到普通人面前。它更像是“隔壁家的小孩很聪明”，你会惊叹，但你未必会因此重写自己对工作和生产力的理解。

OpenClaw 这类产品不一样。它第一次比较明确地把 Token 的能力，从“回答得更好”推进到了“开始替你做事”。这一步的心理冲击，和单纯聊天体验的提升不是一个层级。前者像是工具升级，后者更像是一种新的数字劳动接口突然出现了。也正因为这样，它带来的冲击更接近 vibe coding 刚流行时程序员感受到的那种震动。

所以如果问我，OpenClaw 为什么会出圈，我的答案很直接：不是因为模型突然成熟了，而是因为它第一次把 Agent 放进了一个普通人能立刻理解、立刻传播、立刻想象到生产力后果的产品形态里。

为什么我说首先是产品形态

按照官方文档的说法，OpenClaw 是一套可连接多种聊天渠道、可接入多种模型、可通过 skills 扩展能力的 Agent 平台。官方站点会强调它能连接很多 channels、支持技能市场和工作空间；但在我看来，真正关键的不是这些功能列表本身，而是它把 Agent 放进了用户已经习惯的入口里。

这件事特别重要。技术产品要进入日常生活，很多时候靠的不是能力边界提高了多少，而是它有没有顺着人的习惯走。用户愿意接受一个新系统，往往不是因为它在实验室指标上领先，而是因为它不要求用户先改变自己。OpenClaw 这类产品恰好抓住了这一点。它不是要求你为了 Agent 再学习一套新生活，而是顺着你已经在用的聊天入口，把 Agent 接了进去。

这也是为什么我一直觉得，类 Claw 应用真正做对的，是产品入口，而不是单点技术。

很多人讨论这类产品时，习惯把注意力都放在“模型是不是足够聪明”“上下文是不是足够长”“工具调用是不是足够稳”上。这些当然都重要，但我认为它们还不是第一推动力。因为即使模型更强、上下文更长，如果产品仍然要求用户迁移大量行为习惯，它还是很难真正进入大众生活。反过来，只要产品入口足够顺手，即使系统还很笨拙，只要它已经能把 Token 转化成某种肉眼可见的数字产出，它就会开始形成冲击。

为什么我会想到 SillyTavern

每次看到大家把很多东西包装成“Agent 新范式”，我都会想到 SillyTavern。

如果你长期看过角色扮演和长对话社区，就会发现，很多今天被重新命名成“上下文工程”“记忆系统”“人格管理”的东西，在那边其实早就被认真探索过了。SillyTavern 很早就在做世界书、关键词注入、分层记忆、摘要、历史召回这些东西。World Info / Lorebooks、Summarize 和 Smart Context 这些功能，本质上都在解决同一个问题：怎么在模型能力还不够强、上下文窗口也不够大的时候，尽可能让它说对话、说人话、记住该记住的东西。

换句话说，很多今天看起来很“Agent”的东西，其实并不是最近才被发明出来的。早在 GPT-3.5 那个上下文很小、指令遵循也远不如今天的时候，角色扮演社区就已经把一整套上下文管理技巧摸得很深了。

但这并没有让 SillyTavern 变成 OpenClaw。

原因在我看来也很简单。SillyTavern 的问题不在于探索不够，而在于它所在的赛道太小众。角色扮演天然不是主流生产力叙事的一部分，而且还会碰到情感依赖之类更敏感的问题。再加上它同样有部署成本、上下文成本和使用习惯迁移的问题，所以它很难变成一个足够主流的产品形态。

这恰好反过来说明了我的判断：不是谁先做了这些技术探索，谁就一定会赢；真正决定爆发的是，这些能力最终被放进了怎样的叙事和产品入口里。

模型能力和上下文管理为什么排第二

当然，我并不是说模型和上下文管理不重要。恰恰相反，OpenClaw 这类产品之所以能成立，正是因为这两件事已经发展到了一个“虽然还很粗糙，但足够开始干活”的阶段。

我只是认为，它们还没有跨过那个真正的临界点。今天的模型还谈不上可以稳定地把绝大部分数字化工作完全 Token 化；今天的上下文管理，也远远没有优雅到可以放心交给系统自动处理。但它们已经足够让产品第一次产生“像生产力”的样子了。

这里面最重要的变化是：Agent 自身开始成为上下文的一部分。

角色扮演系统的重心，更多是让模型像一个工作之外的人，所以它更关心语气、人格、随机性和行为风格；而面向生产力的 Agent 恰好相反，它要的是逻辑一致、遵循流程、最好还能把行为写成明确的规则、代码和工具接口。code agent 之所以会成为今天大模型变现最直接的一条主线，也和这个有关。代码天然适合表达结构化行为，而生产力 Agent 天然依赖这种结构。

在这个背景下，skill 机制就开始变得很重要。因为它意味着方法可以被固化，经验可以被复用，行为可以从一次性的对话里沉淀出来。

为什么我觉得 Hermes 又往前走了一步

OpenClaw 的 skill 机制，本质上已经是在告诉用户：你不只是可以让 Agent 帮你做一次事，还可以让它学会一种做事的方法。

Hermes 则更进一步。Nous Research 在 Hermes Agent 的仓库说明里，明确把它描述成一个会从经验中创建技能、在使用中改进技能、跨会话搜索历史对话的系统。这个方向很重要，因为它开始把原来很多隐式存在的东西显式化了。

我会把这种变化理解为：OpenClaw 更像是“你可以命令 Agent 学会”；Hermes 更像是“系统开始尝试判断，什么经验值得被保存成 skill”。这仍然不是什么生物意义上的自我进化，但它已经非常接近一种工程化的经验积累机制了。

也正因为这样，我会觉得类 Claw 应用真正值得看的，不只是“聊天机器人终于能调工具了”，而是它们开始把“技能沉淀”“经验复用”“行为演化”这些原本属于工作流和组织层面的东西，慢慢嵌进产品本身。

我对这类产品的总体判断

如果一定要把我的看法压缩成几句话，大概就是下面这些：

OpenClaw 这类产品的爆发，首先不是模型胜利，而是产品胜利。它们成功地把 Agent 放进了大众已经习惯的聊天入口里，把 Token 的能力第一次以可感知的数字生产力形式展示了出来。

SillyTavern 这类产品说明，很多关键探索其实早就开始了；但技术探索本身并不会自动转化成主流产品影响力。真正决定能不能出圈的，是这些探索最后落进了什么产品赛道、什么社会叙事和什么用户习惯里。

而 Hermes 这类系统往前再推了一步，它开始把技能沉淀和经验复用显式化。这说明类 Claw 应用未来的竞争，不会只停留在“谁的模型更强”，而会越来越落到“谁更会组织上下文、工具、技能和经验”上。

所以在我看来，OpenClaw 真正重要的地方，不是它已经代表了 Agent 的终局，而是它第一次让很多人看见：Token 不只是会聊天，它已经开始以一种非常具体的方式，进入数字劳动本身。

为什么我说首先是产品形态

为什么我会想到 SillyTavern

模型能力和上下文管理为什么排第二

为什么我觉得 Hermes 又往前走了一步

我对这类产品的总体判断

参考资料