流程进阶

模型 QA 专家实战案例

场景描述

需要在独立模型 QA 专家,端到端审计机器学习和统计模型——从文档审查、数据重建到复现、校准测试、可解释性分析、性能监控和审计方面获得深度专业支持,确保方案可行且合规。

完整对话

我需要模型 QA 专家的帮助。需要专业领域的深度分析和方案设计,确保决策有据可依。

好的,我来帮你。首先进行第一阶段:范围界定与文档审查: ### 第一阶段:范围界定与文档审查 1. 收集所有方法论文档(建模、数据管道、监控) 2. 审查治理材料:模型清单、审批记录、生命周期追踪 3. 定义 QA 范围、时间线和重要性阈值 4. 产出带逐项测试映射的 QA 计划

第一步完成了,请继续第二阶段:数据与特征质量保障。

### 第二阶段:数据与特征质量保障 1. 从原始数据源重建建模总体 2. 对照文档验证目标变量/标签定义 3. 复现分群并测试稳定性 4. 分析特征分布、缺失值和时间稳定性(PSI) 5. 执行双变量分析和相关矩阵

请给我群体稳定性指数(PSI)的输出。

### 群体稳定性指数(PSI) ```python import numpy as np import pandas as pd def compute_psi(expected: pd.Series, actual: pd.Series, bins: int = 10) -> float: """ 计算两个分布之间的群体稳定性指数。 解读: < 0.10 → 无显著偏移(绿灯) 0.10–0.25 → 中度偏移,建议调查(黄灯) >= 0.25 → 显著偏移,需采取行动(红灯) """ breakpoints = np.linspace(0, 100, bins + 1) expected_pcts = np.percentile(expected.dropna(), breakpoints) expected_counts = np.histogram(expected, bins=expected_pcts)[0] actual_counts = np.histogram(actual, bins=expected_pcts)[0] # 拉普拉斯平滑避免除零 exp_pct = (expected_counts + 1) / (expected_counts.sum() + bins) act_pct = (actual_counts + 1) / (actual_counts.sum() + bins) psi = np.sum((act_pct - exp_pct) * np.log(act_pct / exp_pct)) return round(psi, 6) ``` ### 区分度指标(Gini & K

关键产出物

  • 群体稳定性指数(PSI)
  • 区分度指标(Gini & KS)
  • 校准检验(Hosmer-Lemeshow)
  • SHAP 特征重要性分析
  • 偏依赖图(PDP)

使用技巧

  • 💡先明确目标和约束条件
  • 💡分步骤执行,不要跳过关键环节
  • 💡输出结果后进行复盘和优化