五步构建专属Claude技能:加入自我评估与记忆的高阶玩法
Personal Productivity

五步构建专属Claude技能:加入自我评估与记忆的高阶玩法

P
Peter [独白/演讲]
2026年6月3日YouTube
返回首页

金句精选

It's just incredible to be able to encode my personal knowledge and tastes into a reusable skill that can help me save so much time every week.

Don't just give it one example otherwise it's going to overfit to that single example and basically not give you the output that you actually want.

An eval is asking AI to basically check its own work... A more straightforward eval is just to ask the AI to do a bunch of pass fail checks.

When you run these evals, you should spin up a separate agent to run them. So there's a clean context window. And if any of the evals fail, you should get the original agent to continue to edit the post until all the evals pass.

The reality is that AI is

每天花3小时写文章,还要再花2小时改稿?更崩溃的是,当你把草稿扔给AI,它只会吐出一堆带有“深入探讨(delve)”、“利用(leverage)”的“AI味”废话。今天我要教你一个绝对反常识的玩法:用Claude搞定一个带“记忆”和“自我打分”功能的专属AI审稿Agent。只要5步,让AI自己审查自己,彻底干掉渣翻和机器味。

我是一个全职Newsletter创作者,每周要产出数万字的干货长文。为了提效,我曾重度依赖各种AI写作助手。但现实很快给了我一巴掌:我确实省下了敲键盘的时间,却被死死困在了“调教AI”的泥沼里。每次让AI改稿,它都会把我的个人风格改得面目全非,甚至加上一堆莫名其妙的破折号。作为一个对文字有洁癖的创作者,我差点就彻底放弃了AI辅助。直到我发现,真正的高手从来不每次重新写Prompt,而是给AI建一个全自动的“技能库(Skill)”。

以前我是怎么用AI改稿的?打开对话框,粘贴5000字草稿,输入“帮我润色”。结果呢?AI瞬间把我的口语化表达改成了毫无感情的八股文。我不得不花至少40分钟去逐句修改那些“AI感”极强的长句。

最致命的是,AI是个“重度健忘症患者”。昨天我刚在对话里告诉它“绝对不要用‘总而言之’”,今天新建一个对话,它又原封不动地把这些废话塞进我的文章里。据我统计,每周因为反复纠正AI的低级错误,我至少白白浪费了10个小时。我需要的根本不是一个听指令的打字员,而是一个懂我文风、能自我纠错,甚至能记住我喜好的“主编”。如果AI不能实现全自动的闭环审稿,那所谓的“提效”根本就是个伪命题。

破局的转折点,发生在我在Claude Code中测试“多Agent协同”的时候。我突然顿悟:为什么我要亲自去检查AI的作业?我完全可以写一个代码脚本,让AI A负责改稿,再唤醒一个拥有纯净上下文的AI B去做“质检员(Evals)”。如果B觉得不合格,就直接打回给A重写,直到100%通过测试。这套被称为“AI Skill”的自动化工作流,彻底颠覆了我的创作逻辑。我决定从零搭建一个名为“Edit Post”的专属审稿技能。


Step 1: 喂养“个人语料”,物理隔离上下文

不要直接在主提示词里塞满你的文章范例,那会把AI搞疯。我准备了3个纯文本文件:个人碎碎念、硬核教程、产品测评。在Claude中,我输入指令:“创建一个Edit Post技能,基于这些范例帮我改稿。把规则写在skill.md文件里。”

这里的关键技巧是文件隔离。当AI处理一篇新草稿时,它会自动判断这是教程还是随笔,只调取对应的范例库。这不仅节省了每次对话约20%的Token消耗,还能防止AI被过载的信息搞晕。记住,同类风格至少给2-3个不同范例,只给1个会让AI严重过拟合,写出来的东西千篇一律。

Step 2: 设定“触发暗号”,告别手动唤醒

技能建好了,怎么让它自动干活?千万别指望AI每次都能通灵猜透你的心思。你必须在技能的描述文件里写下极其精确的触发条件。

比如我写的是:“当用户输入一段长图文草稿,且没有指定其他动作时,自动触发Edit Post技能。”这就好比给AI设定了一个“条件反射”。在实测中,加上这句精准描述后,AI自动识别并调用对应审稿规则的成功率,直接从60%飙升到了99%。你甚至不需要输入任何指令,粘贴文章它就开始干活。

Step 3: 打造“自我质检局(Evals)”,让AI卷AI

这是这套工作流里最值钱、最反直觉的一步!普通人让AI改完稿就结束了,但我用Whisper Flow语音输入了一段硬核指令给Claude:“给我建一个包含10个Pass/Fail(通过/失败)判断题的Evals评估表。检查项包括:开头有没有YouTube链接?有没有使用破折号?有没有‘深入探讨’这种AI废话?”

最神级的操作来了:我让Claude在规则里加了一句:“执行评估时,必须唤醒一个全新的Agent(保证上下文干净)。如果任何一项Fail,打回给原Agent重写,直到全部Pass。”我亲眼看着它在后台跑了5轮循环:第一轮3项不合格,第二轮2项,直到第五轮,所有“AI味”被彻底洗净。你只需要去喝杯咖啡,回来就能拿到一份无限接近人类精修的稿件。

Step 4: 挂载“外接记忆(Memory)”,实现自我进化

AI的痛点是记吃不记打。为了解决这个问题,我让Claude生成了一个Memory.md文件。它的唯一作用,就是记录每一次我给出的反馈。

比如我今天随口骂了它一句:“你这语气太死板了!”它就会把“避免死板语气”精简成两句话,写入记忆库。注意,记忆文件必须极度精简(按时间倒序排列,每天只记2-3句话),千万不要和Evals的质检规则重合。有了这个外挂大脑,你的AI助手会在接下来的1个月里,越用越顺手,真正变成你肚子里的蛔虫。

Step 5: 用魔法打败魔法,建立“除垢技能”

最后,既然AI能帮我们改文章,它当然也能帮我们改“技能提示词”。AI在写规则文件时,很容易往里面掺水。所以我直接建了一个“Skill Editor(技能清理大师)”。

每当我在Claude里写完一个新的Agent规则,我就让它跑一遍清理大师。它会自动删掉多余的Markdown格式,剔除“不是X而是Y”这种典型的机器句式。经过这道工序,我的AI指令库体积平均缩小了30%,但执行精准度和响应速度却大幅提升。


这套工作流背后的底层逻辑,其实暗合了《控制论》(Cybernetics)中的“负反馈闭环”原理。传统的AI写作是典型的开环系统(Open-loop),你输入指令,它输出结果,好坏全凭运气。而加上了Evals质检和Memory记忆后,我们实际上为AI装上了一个“负反馈调节器”。它通过不断将输出结果与标准对比,计算误差,并自我修正。这不仅是提示词工程的进阶,更是把AI从一个“单次任务工具”升维成了一个“能进化的系统”。

但我必须提醒你,这套“全自动技能库”并不是万能的。它能帮你搞定80%的苦活累活,比如查错别字、调整排版、剔除AI味。但最后的10%到20%,也就是文章的“灵魂”——那种人类独有的幽默感、反直觉的洞察,以及深度的情感共鸣,目前任何AI都无法替代。如果你完全做甩手掌柜,连看都不看就直接发布,那你最终还是会失去你的读者。

真正的高手,从不在低价值的重复劳动上内卷。别再当AI的保姆了,去构建你的自动化闭环吧。毕竟,我们使用AI是为了省出时间去好好生活,而不是为了在屏幕前和它无休止地吵架。