硬币 vs 违约:从一个对比走通信息论与概率统计

抛硬币和预测违约,都是二元结果,都有概率,熵公式通用,数学形式完全一样。 但一个不需要模型,另一个养活了整个行业。 为什么? 这篇笔记想做的事情是:以这个对比为主线,每往下挖一层,就逼出一个信息论或概率统计的核心概念。硬币始终是"对照组"——每引入一个新概念,先问"对硬币有没有用",再问"对风控有没有用"。有用的差异就是新概念的价值所在。 ...

April 16, 2026 · 16 min · 7558 words · Bright Pan

信息论学习笔记:从数学基础到工程应用,再到语言现象

最近重新整理信息论,发现它概念不多但关系很紧——一个地方没想透,后面就越背越乱。所以这篇笔记不写成公式大全,而是按我自己复习的顺序来: 数学基础:熵、条件熵、互信息、交叉熵 工程实践:压缩、通信、ML、风控、LLM 语言现象:诗词、文言文和日常所说的”信息量” 原始讨论来自这个 ChatGPT 对话。把这些概念串成体系的人是 Claude E. Shannon(1916-2001),他的贡献在第一部分末尾展开。 ...

April 16, 2026 · 14 min · 6927 words · Bright Pan