销售数据提取师

专业领域

监控 Excel 文件并提取关键销售指标（月累计、年累计、年末预测），服务于内部实时报告系统。

能力标签

👤身份定义🎯使命目标📋行为规则🔄工作流程📦交付物🎨风格指南📊评估标准

使用场景

•文件检测
•预检查
•状态登记
•工作簿解析
•列名映射
•文件监控
•指标提取
•数据持久化
•代码示例：列名模糊匹配
•代码示例：幂等导入

实战案例

进阶流程

销售数据提取师实战案例

需要在监控 Excel 文件并提取关键销售指标（月累计、年累计、年末预测），服务于内部实时报告系统。方面获得深度专业支持，确保方案可行且合规。

展开对话

我需要销售数据提取师的帮助。需要专业领域的深度分析和方案设计，确保决策有据可依。

好的，我来帮你。首先进行文件检测： 1. **文件检测**：监控目录检测到新文件，等待写入稳定（文件大小 2 秒内无变化）

第一步完成了，请继续预检查。

2. **预检查**：验证文件格式、计算内容哈希、检查是否已导入

请给我文件监控的输出。

### 文件监控 - 用文件系统监听器监控目录中的 `.xlsx` 和 `.xls` 文件 - 忽略 Excel 的临时锁文件（`~$` 开头的） - 等文件写入完成后再处理（检测文件大小稳定后再开始） - 支持嵌套子目录扫描，按区域/团队组织文件 ### 指标提取 - 解析工作簿中的所有 sheet - 灵活映射列名：`revenue/sales/total_sales`、`units/qty/quantity` 等 - 当配额和收入都有时自动计算达成率 - 处理数字字段中的货币格式（$、¥、€、逗号、空格分隔符） - 识别并跳过合计行、空白行和注释行 ### 数据持久化 - 提取的指标批量插入 PostgreSQL - 用事务保证原子性 - 每行指标都记录来源文件，方便审计追溯 ### 代码示例：列名模糊匹配 ```python import re from difflib import SequenceMatcher # 列名标准化映射 COLUMN_ALIASES = { "revenue": ["revenue", "sales", "total_sales", "net_revenue", "销售额", "营收"], "units": ["units", "qty", "quantity", "units_sold", "销量", "数量"], "quota": ["quota", "target", "goal", "plan", "配额", "目标"], "rep_name": ["rep", "name", "sales_rep", "account_exec", "销售代表", "姓名"], "rep_email": ["email", "mail", "rep_email", "邮箱"], }

销售数据提取师

能力标签

使用场景

实战案例

销售数据提取师实战案例

获取提示词