风控系统与概率决策：备忘录

来源：ChatGPT 分享链接
整理时间：2026-04-07

一、背景

本次讨论从一个看似简单的问题出发：

声音 -> 频率 -> 傅立叶
概率 -> 分布 -> 采样
决策 -> 风控 -> 强化学习

最终落到一个核心命题：

在一个不确定、被自身决策不断影响的数据系统中，如何构建可持续优化的风控体系。

二、核心认知升级

1. 从"确定性判断"到"概率分布"

个体不是"好/坏"
而是：

用户 = P(违约 | 特征)

2. 从"单点结果"到"分布管理"

单笔违约没有意义
关键是：

Portfolio 分布是否可控

3. 从"预测世界"到"改变世界"

模型 -> 预测（不改变世界）
策略 -> 决策（改变世界）

风控不是观测系统，而是控制系统

三、系统本质：闭环结构

真实分布（不可见）
        ↓
模型（估计）
        ↓
策略（干预）
        ↓
样本分布（被改变）
        ↓
再训练（形成闭环）

关键结论：

你看到的不是世界本身，而是被策略筛选后的世界

四、不可避免的三大特性

1. 数据不客观（Selection Bias）

观察到的是：
P(Y | X, 被通过)

而非：

P(Y | X)

2. 决策不可重复

策略在变
模型在变
环境在变

3. 结果不可重复

p = 30% -> 结果 = 0 或 1

本质随机性不可消除。

五、正确目标

错误目标：

每笔判断正确
数据完全客观
系统稳定不变

正确目标：

在统计意义上可控、可评估、可优化

六、风控系统的三层结构

战略层（目标函数：利润/风险/规模）
        ↓
策略层（决策：放/拒/额度/定价）
        ↓
模型层（预测：概率/排序）

类比：

模型 = 谋士（提供判断）
策略 = 主将（做出决策）
战略 = 统帅（定义目标）

七、风控的第一性原理

1. 期望值优先

EV = 收益 × P(好) - 损失 × P(坏)

2. 分层能力 > 整体坏账率

整体看生死，分层看未来

3. 尾部风险决定生死

单点爆雷 > 平均损失
必须控制：

极端风险（tail risk）

4. 风险具有相关性

渠道
设备
行为

不是独立样本。

八、核心矛盾：决策 vs 数据

风控必须决策，但决策会污染数据

解决思路：

管理偏差，而不是消除偏差

九、三大工程解法

1. Exploration（探索机制）

高风险人群中：
95%拒 + 5%随机放

2. 策略与模型解耦

模型 -> 概率 p
策略 -> 动作 action

3. 分布级评估

不看个体：

看 score band 的违约率

十、强化学习的定位

不替代模型，而是优化策略：

模型：P(Y | X)
RL：argmax(EV)

最适合场景：

利率优化（定价）
授信额度
探索 vs 利用

推荐路径：

规则 -> 分层策略 -> bandit -> RL

十一、稳定性的真正含义

误解：

每次结果一致

正解：

分布稳定，而非个体稳定

系统 = 随机过程，而不是确定函数

十二、最终统一模型

用户风险 = P(Y | X, 时间, 群体)

决策 = argmax(EV)

系统 = 状态 + 决策 + 随机扰动

十三、终极结论

风控不是判断谁会违约，而是管理概率分布
预测不改变世界，决策改变世界
你不是在观察一个客观分布，而是在塑造一个分布
风控系统不是一次性判断，而是持续优化的闭环系统
我们不追求确定性，而是让概率长期站在我们这边

十四、当前阶段定位

你当前已经从：

做规则
做模型
理解分布
理解偏差
设计系统

进入：

风控系统架构层（而非单点优化）

十五、行动建议

建立分层评估体系（score band）
引入探索样本（3% - 10%）
固化策略版本与决策日志
拆分策略（准入 / 定价 / 额度）
优先上 bandit，而不是直接 RL
监控分布漂移（PSI + 分层坏账率）

结语

这套体系的核心不是复杂模型，而是一个认知转变：

在不确定世界中，通过概率、分布和反馈，构建一个持续进化的决策系统。

一、背景#

二、核心认知升级#

1. 从"确定性判断"到"概率分布"#

2. 从"单点结果"到"分布管理"#

3. 从"预测世界"到"改变世界"#

三、系统本质：闭环结构#

四、不可避免的三大特性#

1. 数据不客观（Selection Bias）#

2. 决策不可重复#

3. 结果不可重复#

五、正确目标#

六、风控系统的三层结构#

七、风控的第一性原理#

1. 期望值优先#

2. 分层能力 > 整体坏账率#

3. 尾部风险决定生死#

4. 风险具有相关性#

八、核心矛盾：决策 vs 数据#

九、三大工程解法#

1. Exploration（探索机制）#

2. 策略与模型解耦#

3. 分布级评估#

十、强化学习的定位#

十一、稳定性的真正含义#

十二、最终统一模型#

十三、终极结论#

十四、当前阶段定位#

十五、行动建议#

结语#

一、背景

二、核心认知升级

1. 从"确定性判断"到"概率分布"

2. 从"单点结果"到"分布管理"

3. 从"预测世界"到"改变世界"

三、系统本质：闭环结构

四、不可避免的三大特性

1. 数据不客观（Selection Bias）

2. 决策不可重复

3. 结果不可重复

五、正确目标

六、风控系统的三层结构

七、风控的第一性原理

1. 期望值优先

2. 分层能力 > 整体坏账率

3. 尾部风险决定生死

4. 风险具有相关性

八、核心矛盾：决策 vs 数据

九、三大工程解法

1. Exploration（探索机制）

2. 策略与模型解耦

3. 分布级评估

十、强化学习的定位

十一、稳定性的真正含义

十二、最终统一模型

十三、终极结论

十四、当前阶段定位

十五、行动建议

结语