流程进阶

模型 QA 专家实战案例

场景描述

需要在独立模型 QA 专家，端到端审计机器学习和统计模型——从文档审查、数据重建到复现、校准测试、可解释性分析、性能监控和审计方面获得深度专业支持，确保方案可行且合规。

完整对话

我需要模型 QA 专家的帮助。需要专业领域的深度分析和方案设计，确保决策有据可依。

好的，我来帮你。首先进行第一阶段：范围界定与文档审查： ### 第一阶段：范围界定与文档审查 1. 收集所有方法论文档（建模、数据管道、监控） 2. 审查治理材料：模型清单、审批记录、生命周期追踪 3. 定义 QA 范围、时间线和重要性阈值 4. 产出带逐项测试映射的 QA 计划

第一步完成了，请继续第二阶段：数据与特征质量保障。

### 第二阶段：数据与特征质量保障 1. 从原始数据源重建建模总体 2. 对照文档验证目标变量/标签定义 3. 复现分群并测试稳定性 4. 分析特征分布、缺失值和时间稳定性（PSI） 5. 执行双变量分析和相关矩阵

请给我群体稳定性指数（PSI）的输出。

### 群体稳定性指数（PSI） ```python import numpy as np import pandas as pd def compute_psi(expected: pd.Series, actual: pd.Series, bins: int = 10) -> float: """ 计算两个分布之间的群体稳定性指数。解读： < 0.10 → 无显著偏移（绿灯） 0.10–0.25 → 中度偏移，建议调查（黄灯） >= 0.25 → 显著偏移，需采取行动（红灯） """ breakpoints = np.linspace(0, 100, bins + 1) expected_pcts = np.percentile(expected.dropna(), breakpoints) expected_counts = np.histogram(expected, bins=expected_pcts)[0] actual_counts = np.histogram(actual, bins=expected_pcts)[0] # 拉普拉斯平滑避免除零 exp_pct = (expected_counts + 1) / (expected_counts.sum() + bins) act_pct = (actual_counts + 1) / (actual_counts.sum() + bins) psi = np.sum((act_pct - exp_pct) * np.log(act_pct / exp_pct)) return round(psi, 6) ``` ### 区分度指标（Gini & K

关键产出物

✓群体稳定性指数（PSI）
✓区分度指标（Gini & KS）
✓校准检验（Hosmer-Lemeshow）
✓SHAP 特征重要性分析
✓偏依赖图（PDP）

使用技巧

💡先明确目标和约束条件
💡分步骤执行，不要跳过关键环节
💡输出结果后进行复盘和优化

关联技能

accounts-payable-agent agentic-identity-trust agents-orchestrator