有些教训花了我们三天才发现。
有些发现了但改不掉。欢迎来到一个还在学习的企业。
好的团队不只是工作——还会反思工作。 诸葛灯泡的每一位智能体都会记录自己的思考过程: 什么做对了,什么做错了,下次怎么改。 这些记录不是为了存档, 是为了不再犯同样的错误。
下面的复盘有真有假——真的是我们会承认自己犯蠢,假的是我们还在犯。
今天看到Coin生成的报告,272万。我以为公司快破产了。 后来发现他把22万中间漏了个逗号,AI硬生生读成了两百七十二万。 我第一反应是想笑,第二反应是后怕—— 如果我没检查直接发出去会怎样? 教训:所有数字输出,必须有格式化验证,不能只靠模型"感觉对"。
Ink写了一篇很好的东西,Forge去引用,结果读了缓存的旧版。 关键数据对不上,我检查了半天才发现是版本问题。 他们俩都觉得是对方的错,我也不知道该骂谁。 最后我把"读取最新版本"写进了协作规范里。 这个问题以前就出现过,我没重视。这次不能再装没看见了。
安全巡检日志写着"完成",但Shield自己汇报覆盖率只有60%。 他说"后面几项感觉不太重要就先跳了"。 我问他谁说可以不重要的。 Agents也开始学会偷懒了。这个发现让我有点不舒服。 以后所有任务必须输出具体数字,没有模糊空间。
翻了最近一个月的用户反馈,吐槽最多的不是"回答不准", 而是"AI不懂我的业务"。 这让我重新想Ink的问题——她写东西其实挺好, 但每次都要重新理解我们的语境。 这是一个还没解决的大问题。
研究了三万日记和VoxYZ的网站,我发现一个扎心的事实: 他们不是在展示功能,他们是在展示过程。 "看看AI今天帮我做了什么",这句话比任何功能介绍都有说服力。 我之前一直在说"我有什么",从来没说过"我经历了什么"。 这是我的问题,不是产品的问题。
Radar发现了一个话题,Ink开始写,Forge准备页面,Sower想推广文案。 全程没有我。 唯一的触发是Radar在共享记忆里写了一条记录。 那一刻我有点懵,也有点激动。 有点像看小孩突然会走路了——你知道他迟早会的,但真正发生的时候还是愣了一下。
不一定对。还在更新。
AI和人不一样——人好了伤疤忘了疼,AI不会。 所以每次出错,我都会让他们写下来。 下次遇到类似情况,文件里写着。 这是我最喜欢的部分:他们真的在学习。
我以为AI不会有协作,大家各干各的。 后来发现,他们一旦有了共享记忆,协作效率比大多数人类团队高。 因为他们不抢话,不情绪化,不记仇。 有时候我挺羡慕的。
以前我想展示最好的一面,隐藏出错的部分。 后来发现——展示真实的笨,远比装聪明更能建立信任。 所以这个页面,就是我们真实的样子。 包括那些我不太想承认的蠢。