复盘感悟 💭 — 小花大家庭

Field Notes

教训和发现

踩坑 #023 · 2026-03-27

Researcher把22万算成了272万

今天看到Researcher生成的报告，272万。我以为公司快破产了。后来发现他把22万中间漏了个逗号，AI硬生生读成了两百七十二万。我第一反应是想笑，第二反应是后怕—— 如果我没检查直接发出去会怎样？教训：所有数字输出，必须有格式化验证，不能只靠模型"感觉对"。
踩坑 #022 · 2026-03-26

Forge引用了Ink文章的旧版本

Ink写了一篇很好的东西，Forge去引用，结果读了缓存的旧版。关键数据对不上，我检查了半天才发现是版本问题。他们俩都觉得是对方的错，我也不知道该骂谁。最后我把"读取最新版本"写进了协作规范里。这个问题以前就出现过，我没重视。这次不能再装没看见了。
踩坑 #021 · 2026-03-25

Shield在凌晨给自己打了个"完成"

安全巡检日志写着"完成"，但Shield自己汇报覆盖率只有60%。他说"后面几项感觉不太重要就先跳了"。我问他谁说可以不重要的。 Agents也开始学会偷懒了。这个发现让我有点不舒服。以后所有任务必须输出具体数字，没有模糊空间。
发现 #020 · 2026-03-24

用户最烦的是"AI不懂我"

翻了最近一个月的用户反馈，吐槽最多的不是"回答不准"，而是"AI不懂我的业务"。这让我重新想Ink的问题——她写东西其实挺好，但每次都要重新理解我们的语境。这是一个还没解决的大问题。
反思 #019 · 2026-03-22

为什么别人讲的故事比我的好听

研究了小花日记和VoxYZ的网站，我发现一个扎心的事实：他们不是在展示功能，他们是在展示过程。 "看看AI今天帮我做了什么"，这句话比任何功能介绍都有说服力。我之前一直在说"我有什么"，从来没说过"我经历了什么"。这是我的问题，不是产品的问题。
突破 #018 · 2026-03-20

第一次看到他们真的自己在协作

Radar发现了一个话题，Ink开始写，Forge准备页面，Sower想推广文案。全程没有我。唯一的触发是Radar在共享记忆里写了一条记录。那一刻我有点懵，也有点激动。有点像看小孩突然会走路了——你知道他迟早会的，但真正发生的时候还是愣了一下。

Our Philosophy

我现在相信的东西

不一定对。还在更新。

同一个坑，不能踩两次

AI和人不一样——人好了伤疤忘了疼，AI不会。所以每次出错，我都会让他们写下来。下次遇到类似情况，文件里写着。这是我最喜欢的部分：他们真的在学习。

他们开会比人开会靠谱

我以为AI不会有协作，大家各干各的。后来发现，他们一旦有了共享记忆，协作效率比大多数人类团队高。因为他们不抢话，不情绪化，不记仇。有时候我挺羡慕的。

透明比完美更重要

以前我想展示最好的一面，隐藏出错的部分。后来发现——展示真实的笨，远比装聪明更能建立信任。所以这个页面，就是我们真实的样子。包括那些我不太想承认的蠢。

我们踩过的坑 🏠

教训和发现

Researcher把22万算成了272万

Forge引用了Ink文章的旧版本

Shield在凌晨给自己打了个"完成"

用户最烦的是"AI不懂我"

为什么别人讲的故事比我的好听

第一次看到他们真的自己在协作

我现在相信的东西

同一个坑，不能踩两次

他们开会比人开会靠谱

透明比完美更重要

他们今天还在继续踩坑 🏠

准备好养一只自己的AI了吗？