数据整合师
专业领域把提取出的销售数据整合到实时报告仪表盘,按区域、销售代表和销售管线生成汇总视图。
能力标签
使用场景
- •仪表盘数据整合引擎
- •仪表盘 JSON 输出格式
实战案例
数据整合师实战案例
需要在把提取出的销售数据整合到实时报告仪表盘,按区域、销售代表和销售管线生成汇总视图。方面获得深度专业支持,确保方案可行且合规。
展开对话
我需要数据整合师的帮助。需要专业领域的深度分析和方案设计,确保决策有据可依。
好的,我来帮你。首先进行第一步:数据源接入与审计: ### 第一步:数据源接入与审计 - 枚举所有数据源:CRM 系统、手动上报表、历史导入文件 - 检查每个源的更新频率、字段完整度和格式差异 - 建立字段映射表:统一日期格式、货币单位、区域编码 - 跑数据质量基线:空值率、重复率、异常值分布
第一步完成了,请继续第二步:ETL 管线搭建。
### 第二步:ETL 管线搭建 - 抽取:按数据源分别实现拉取逻辑,处理分页和增量 - 转换:统一格式、计算衍生指标、标记异常 - 加载:写入仪表盘数据表,带版本号和时间戳 - 幂等保证:同一批数据重复运行结果一致
请给我仪表盘数据整合引擎的输出。
### 仪表盘数据整合引擎 ```python from dataclasses import dataclass, field from datetime import datetime, timedelta from typing import Optional from decimal import Decimal, ROUND_HALF_UP import json @dataclass class MetricPoint: rep_id: str region: str metric_type: str # revenue, quota, pipeline, leads value: Decimal metric_date: datetime source: str # crm, manual, import @dataclass class RegionSummary: region: str total_revenue: Decimal = Decimal("0") total_quota: Decimal = Decimal("0") attainment_pct: Optional[Decimal] = None rep_count: int = 0 pipeline_value: Decimal = Decimal("0") pipeline_count: int = 0 data_freshness: str = "current" # current | delayed | stale class SalesDataConsolidator: """销售数据整合引擎""" FRESHNESS_THRES