"用过 AI"已经不构成差异。用得多 ≠ AI Native。真正要看的是:能不能把 AI 前沿变成个人能力、团队杠杆和组织能力。
这份指南把感性的"AI 探索"变成可复盘、可比较、可持续提升的框架,配套 Agent Harness 战略(2026-06-26 发布),作为团队"成为最佳实践者"的评估仪表盘与行动地图。
三层结构,缺一不可:微观能力(会不会)+ 真实表现(用没用出跃迁)+ 宏观理解(懂不懂对世界的影响)。
第一层 · 微观能力 10 维度
D1-D10 专业能力
- D1 模型理解知道能力边界+任务适配+failure mode,非仅知名字。小思走多供应商网关,按任务选模型而非永远用最强
- D2 产品洞察创始人访谈+亲自试用+横评,判断演化方向
- D3 工程化spec/test/trace/多 agent 调度,把 AI 从一次性生成变成可靠工程流程
- D4 Benchmark设计评测集而非看官方榜单
- D5 开源实践practice-first:先跑最小任务再读文档
- D6 能力栈 ★每次用 AI 沉淀资产(prompt 库/skill/SOP),复利积累。Oh My KB 即典范
- D7 前沿雷达去噪,区分 hype/demo/adoption/趋势
- D8 战略判断反 hype 取舍,低后悔率
- D9 Eval ★用真实任务数据证明哪里更好,不靠感觉。本周 kb-finance-invest 加 financial_verify 是雏形
- D10 治理 ★能力越强风险越高,区分 prompt 约束与系统强制约束(hook/CI/人工审核)
第二层 · 超级个体 4 特征
- S1 AI First 工作动线:AI 先跑人做判断,不是"遇到困难才问"。节奏:AI 跑→人判断→AI 扩展→人筛选→AI 执行→人校验→产出
- S2 能力量级跃迁:做过去做不了的事。量跃迁(1篇→10篇)+ 域跃迁(跨角色闭环,如产品人员能写 demo)
- S3 主动边界探索:不等组织安排,主动试/跑/比较/迁移。看到新工具先跑真实需求
- S4 影响力溢出 ★:区分高效个体和超级个体的关键——自己快 vs 让团队变快。Agent Harness 战略核心目标
第三层 · 宏观理解 8 维(管理层重点)
| 维度 | 梅菲儿相关判断 |
| M1 模型算力格局 | 理解小思走 LiteLLM 多供应商网关的逻辑(成本/速度/质量权衡) |
| M2 大公司战略 | 理解梅菲儿做 agent 平台(agents.mayfair-inc.net)的战略定位 |
| M3 产业结构 | 跨境服饰+AI:备货预测/质检/客服哪些环节先被改造 |
| M4 组织结构 ★ | 管理对象从人扩展到 agent;中层从"分配任务"转向"设计 AI 工作系统"——产技 6 域 TL 调整方向 |
| M5 劳动力职业 | "AI 杠杆率竞争":会用 AI 的人带 AI 系统替代不会用的人的工作方式 |
| M6 资本商业 | token 成本/推理成本影响小思商业化路径 |
| M7 政策地缘 | 印度仓数据合规、跨境数据安全 |
| M8 宏观转个人 ★ | 最关键:能不能把趋势翻译成自己/团队的行动路线 |
不同岗位切入路径
算法 / 数据岗(王超悦 / 王一川 / 孔斐凡)
D1 模型理解 + D4 Benchmark + D9 Eval。备货预测要有 golden set 和回归测试,准确率用真实订单数据评估
开发岗(陈振华 / 胡浩 / 孙鹏 / 郑阳光)
D3 工程化 + D5 开源实践 + D10 治理。小思 agent 改动走 spec→test→trace→review,生产发布走 Starlink CI/CD,危险操作靠 hook 拦
产品岗(谢鹏 / 陈思汝 / 赵情融)
D2 产品洞察 + D8 战略判断 + M6 商业。建小思产品库:场景/交互/付费/留存/成本结构
项目管理 / TL(蔡武鑫 / 郑紫盈 / 林妙慧)
D6 能力栈 + D9 Eval + S4 影响力溢出。会议纪要/任务拆解/风险清单模板化,识别团队 AI 种子用户
中层领导(姚继涛)
M3 产业结构 + M4 组织结构 + S4 影响力溢出。设计团队 AI 工作系统(Agent Harness),让组织整体获得杠杆
季度自评表
每项 1-5 分,诚实自评,标出强项和缺口。不是打分工具,是进阶地图。
| 维度 | 1-2(弱) | 3(中) | 4-5(强) | 自评 |
| D1 模型理解 | 知道名字 | 会选模型 | 懂边界+failure | |
| D2 产品洞察 | 看新闻 | 试用过 | 横评+商业判断 | |
| D3 工程化 | 让AI写代码 | spec+test | 多agent+trace | |
| D4 Benchmark | 看榜单 | 会对照 | 设计评测集 | |
| D5 开源实践 | 收藏 | 跑过demo | 改造进工作流 | |
| D6 能力栈 | 碎片用 | 有模板 | 持续复利 | |
| D7 前沿雷达 | 追热点 | 会去噪 | 翻译成行动 | |
| D8 战略判断 | 见新就追 | 会取舍 | 低后悔率 | |
| D9 Eval | 靠感觉 | 有指标 | golden set+回归 | |
| D10 治理 | 敢让AI跑 | 有边界 | 系统强制约束 | |
团队目标(配套 Agent Harness 战略)
- 短期(1 个月)
每人完成一次自评,识别个人 D 维度缺口。产技全员建立基础能力栈:个人 prompt 库 + 1 个高频 skill 沉淀。小思 BI 看板 / 备货预测补 D9 Eval(golden set + 回归)
- 中期(3 个月)
6 域 TL 各推动 1 个团队级 AI 工作流改造(备货域 cron 自动化、仓储 Starlink 发布规范)。识别 3-5 个 AI 种子用户,扩散最佳实践。Agent Harness 从"姚继涛的架构"变成"团队的工作系统"
- 长期(6 个月+)
产技团队整体 AI 杠杆率提升,小团队完成过去大团队的工作(S2 域跃迁)。组织分工重构:AI workflow owner / eval owner / agent owner 角色成型。达成 S4 影响力溢出:AI 使用方式成为团队新标准
判断标准(识人 / 招人)
AI 种子用户识别(中层领导用)
主动试工具 · 已形成工作流 · 愿意分享 · 能带动别人 · 能把个人经验整理成团队模板。
参考:陈振华(小思全量迁移 Savana)、分享 Lima / cc-switch 都是种子用户特征。
招聘评估(HR 用)
不问"会不会用 AI",问"你最近迁移过哪个 AI 工作流""你怎么评估 AI 效果"。看 D6 能力栈成熟度 + S3 主动性,比看模型知识更重要。