---
title: "取数同事离职后，业务还能稳吗？一个自我进化的智能问数Skill"
author: deletexiumu
pubDatetime: 2026-01-23T10:00:00+08:00
featured: false
draft: false
tags:
  - Claude Code
  - AI Agent
  - 数据治理
description: "一个会沉淀口径、越用越懂你的智能问数 Skill，把自然语言问题变成可执行的取数方案。"
---

## 开场：业务取数的三个痛

做业务的人，谁没被取数折腾过？

- **排队等数**——分析师手里积压十几个需求，你的只能往后排。
- **口径来回确认**——"你说的活跃用户是日活还是月活？""统计周期是自然周还是滚动7天？"一来一回，半天过去了。
- **最难受的是**，数好不容易跑出来，一看——"这不是我要的"。

被这些痛点折腾久了，我写了一个智能问数的 Skill，搭配 Agent 使用。它有个核心设计：**同一类问题，第一次会追问几轮把口径问清楚；用过一段时间后，再问类似问题，能更少追问、更快给出可执行方案。**

这不是普通的"把话翻成SQL"，而是一个**会沉淀口径、越用越懂你**的问数 Skill。

## 一句话解释：这是什么

用业务视角来说：它能把你的自然语言问题，变成**可执行的取数方案**——包括SQL、口径假设、以及需要你确认的关键点。

它的设计逻辑是：**优先把关键口径问清楚，而不是急着出一个看似正确的数字。** 宁可多问一句，也不让你拿到一个"差不多但其实不对"的结果。

## 30秒对比：传统方式 vs 新方式

| 传统方式 | 新方式 |
|---------|--------|
| 一次性回答，错了靠人补充 | 先澄清，可反馈，会学习 |
| 不会记住你的偏好 | 下次更省沟通 |

**下面用4张图，把"它怎么学会的"讲清楚。**

---

## 图1：首次提问——为什么主动问6个关键信息

![首次提问，需求澄清及反馈](/blog/smart-data-query/1-首次提问，需求澄清及反馈.png)

当你第一次问"上个月的销售额是多少"，它不会直接甩给你一个数字。它会先问你6类关键信息：

1. **指标口径**：销售额是含退款还是不含？是GMV还是实收？
2. **时间范围**：上个月是自然月，还是过去30天？
3. **对象范围**：全部门店，还是某个区域？
4. **统计粒度**：要看总数，还是按天/按店拆分？
5. **过滤条件**：要不要排除测试订单、内部员工订单？
6. **输出形式**：要一个数字，还是要明细表？

**看似麻烦，其实是把返工最多的坑一次性排掉。** 这些问题如果不提前确认，等数跑出来再发现不对，又得重来一轮。

口径澄清不是啰嗦，是把来回确认从人肉沟通变成一次性问清。

---

## 图2：你点bad后发生了什么——即时修正+记录

![首轮回答再次修正](/blog/smart-data-query/2-首轮回答再次修正.png)

假设它给出的结果或假设不对，你点了"bad"。接下来会发生什么？

1. 它会立刻调整：可能修改3个口径假设，或者补充追问
2. 你确认后点"good"
3. 这一整轮对话，连同你的反馈，会被记录进日志

**这不是结束，而是训练的开始。** 你的这次纠错，变成了一条可复用的案例。

业务收益很直接：**你的反馈会让后续同类问题更快、更稳。** 你点一次bad，不只是纠错一次，而是在给团队口径喂样本。

---

## 图3：自我迭代在"后台"怎么做——从日志到规则

![主动优化迭代](/blog/smart-data-query/3-主动优化迭代.png)

收集到足够多的反馈后，系统会在后台做三件事：

**第一步：收集。** 把所有good/bad的对话样本汇总起来。

**第二步：分类。** 把bad的原因归类——是口径缺失？粒度歧义？选错了表？还是业务术语（方言）没识别对？

**第三步：固化。** 根据高频问题，更新规则库和问卷模板。比如发现"销售额"在你们公司默认指实收，就把这条写进规则。

**这套机制的核心是：不靠某个人手工调参，而是系统化复盘沉淀。** 每一次团队成员的反馈，都在让这套系统变得更懂你们的业务语言。

---

## 图4：同类问题复用——为什么能越来越少追问

![第二次问答直接跳过询问](/blog/smart-data-query/4-第二次问答直接跳过询问.png)

当团队用了一段时间、常见口径逐步沉淀后，变化发生了：

- 它已经知道你们团队说"销售额"默认指实收
- 它记住了常用的统计粒度是"按天+按店"
- 它学会了你们习惯排除测试订单

于是，**原本需要追问6个点，现在可能只需要确认1个**——甚至直接给出结果。

同样的问题，从"对话拉扯"变成"一步到位"。**越用越懂你们团队，而不是越用越累。**

---

## 传统Text-to-SQL vs 智能问数：差异在哪

传统的Text-to-SQL更像"一次性翻译"：你说一句话，它翻成SQL，没有长期记忆，也没有复盘机制。

新的智能问数，是一个**会澄清、会反馈、会学习**的问数助手。

| 维度 | 传统Text-to-SQL | 智能问数（Agent+Skill） |
|------|----------------|------------------------|
| 核心定位 | 一次性翻译 | 澄清+生成+复盘 |
| 交互体验 | 常要补信息 | 首次会问关键点，后续越来越少问 |
| 口径澄清 | 被动补充，反复确认 | 澄清优先，减少返工 |
| 反馈闭环 | good/bad不影响下次 | 反馈驱动规则优化 |
| 学习能力 | 不记住习惯 | 同类问题可跳过追问 |
| 可解释性 | 结果像黑盒 | 给出假设和待确认项 |
| 安全模式 | 需直连库执行 | 支持离线先产SQL再审核 |
| 上线/维护成本 | 前期要准备/维护大量口径样例与常见问法，表/口径变化时需持续补齐校准 | 主要维护Skill规则与团队默认口径，通过反馈持续沉淀，改动可逐步被吸收 |
| 响应速度的适用范围 | 常见问题/命中既有套路时更快；遇到新口径/新组合时容易反复补信息、返工 | 单次思考更慢（30秒~1分钟），但更擅长用澄清把新问题问对，减少"跑错再改"的总耗时 |

### 避免复杂调优

传统的"把话翻成SQL"，要想好用，往往得提前准备一整套"数据字典+常见问法题库+口径样例"，还要持续维护更新：表一变、字段一改、业务口径一调整，就得跟着补材料、调效果。

而 Agent+Skill 更像请了一个**先把需求听懂、该追问就追问**的取数同事：它靠意图理解把问题问清楚，再按"技能清单"去选表、定口径、产SQL；你只需要用 good/bad 把团队共识反馈给它，系统会把共识**沉淀成默认口径**，不需要你长期做一堆"前置喂题"和调参工作。

### 慢但准 vs 快但场景受限

你可能会问：那它是不是更慢？是的，Agent+Skill 通常要 **30 秒到 1 分钟**，因为它会先把"口径、范围、粒度、过滤条件"这些最容易返工的点问清楚。这里的时间不是浪费，而是在把"事后改三轮"提前变成"一次性确认"。

传统的 Text-to-SQL 之所以"快"，往往是因为它对常见问法预置了大量套路和样例——**像题库命中就秒出答案**；但一旦你问的是新口径、新组合、新业务动作（这恰恰是业务最常见的提问），命中率低，就会出现：要么答得快但不准、你还得返工；要么来回补信息，整体更慢。

**业务要的不是快，而是少返工、一次到位。**

---

## 你怎么用，才能让它沉淀得更快

**提问模板**：先说清楚指标、对象、时间、粒度。

> 示例："查一下华东区上周（自然周）的日均订单量，按城市拆分，排除测试订单。"

**反馈模板**：good/bad + 说清楚"错在哪里"。

> 示例："bad，口径不对，我们说的订单量是付款订单，不是下单订单。"

**团队收益**：一次反馈，后续同类问题全员受益。

---

## FAQ

**Q：我需要懂SQL吗？**
A：不需要。你用自然语言描述需求，它生成SQL并解释口径假设。

**Q：它会不会跑错数？口径不一致怎么办？**
A：它会先列出口径假设让你确认，不会直接跑数。发现问题就点bad反馈。

**Q：数据安全怎么保证？**
A：它可以在不连接数据库的情况下先产出SQL和口径方案，你审核后再执行。

**Q：我点good/bad到底有什么用？**
A：每次反馈都会被记录，积累后系统自动优化规则，让后续同类问题更准更快。

**Q：复杂口径怎么处理？**
A：涉及多个关联口径时，建议分步确认；它也会主动提示需要你澄清的点。

---

## 结尾

**第一次它问得多，是为了把口径问清、让你少返工；后面它问得少，是因为团队共识被沉淀成默认口径。**

**业务要的不是快，而是少返工、一次到位。**

传统问数像一次性翻译；新的智能问数更像会复盘、会变聪明的同事。

越用越懂你们团队的默认口径，才是智能问数的分水岭。

---

## 如何使用

**第一步：找数据同事要脚本**

业务同学不用关心底层细节，直接跟数据同事说："把常用的 ADS、DWS 脚本给我一份。"拿到 SQL 脚本后，放进指定目录就行。

**第二步：一行命令安装**

```bash
npx skills add deletexiumu/AgentSkills-Hub/smart-data-query
```

**第三步：开始用**

安装完就能用自然语言问数了。用 good/bad 反馈持续沉淀团队口径，越用越懂你们的默认规则。

比传统 Text-to-SQL 方案需要准备的向量化、few-shot、RAG 等复杂调优工作，这个方案开箱即用。

*想体验"越用越懂你"的智能问数？欢迎试用，提交PR。Github搜索：AgentSkills-Hub*

---

## 相关阅读

- [从单兵作战到团队协作：Claude Code Agent Team 深度解析](/posts/claude-code-agent-team/) — 问数 Skill 背后的 Agent 协作机制
- [别让 AI 乱写代码：从方法论到实战，我的 Claude Code 工作流](/posts/claude-code-plan-before-code/) — 构建 Skill 时用到的任务规划方法论