抛硬币和预测违约,都是二元结果,都有概率,熵公式通用,数学形式完全一样。 但一个不需要模型,另一个养活了整个行业。 为什么? 这篇笔记想做的事情是:以这个对比为主线,每往下挖一层,就逼出一个信息论或概率统计的核心概念。硬币始终是"对照组"——每引入一个新概念,先问"对硬币有没有用",再问"对风控有没有用"。有用的差异就是新概念的价值所在。 ...
信息论学习笔记:从数学基础到工程应用,再到语言现象
最近重新整理信息论,发现它概念不多但关系很紧——一个地方没想透,后面就越背越乱。所以这篇笔记不写成公式大全,而是按我自己复习的顺序来: 数学基础:熵、条件熵、互信息、交叉熵 工程实践:压缩、通信、ML、风控、LLM 语言现象:诗词、文言文和日常所说的”信息量” 原始讨论来自这个 ChatGPT 对话。把这些概念串成体系的人是 Claude E. Shannon(1916-2001),他的贡献在第一部分末尾展开。 ...
从 TCP 到 HTTP/3:一篇讲清 HTTP 协议栈演进、长连接、WebSocket 与轮询机制
打开一个网页,看起来只是点了一下链接。 但在这背后,浏览器、HTTP、TCP、TLS,甚至 QUIC,要一起配合,才能把页面安全、完整、尽快地送到你眼前。 ...
让 Agent 睡一觉:一个记忆清理与巩固系统设计
最近在想一个问题: 人类会通过睡眠来清理噪音、巩固记忆、重组经验,那 agent 能不能也有一个类似的“睡眠机制”? 如果把 agent 的记忆系统只理解为“存更多”,最后通常会变成信息垃圾堆。真正有价值的不是记得更多,而是: ...
风控系统与概率决策:备忘录
来源:ChatGPT 分享链接 整理时间:2026-04-07 一、背景 本次讨论从一个看似简单的问题出发: 声音 -> 频率 -> 傅立叶 概率 -> 分布 -> 采样 决策 -> 风控 -> 强化学习 最终落到一个核心命题: ...
未来城春望·三十六自题
柳发新青水正东,长桥横处起天风。 冬寒几度催人老,春色今年与我同。 三十六年身未定,数番行路志犹雄。 未成大业心先在,欲借东阳立此功。 —— 丙午年正月十四 公历2026年3月2日 于杭州余杭未来科技城 ...
我的四年创业教训和经验总结
始终牢记创业成功是小概率事件 每个团队对于创业成功的阶段性定义都不一样。对于我,我把第一阶段创业成功定义为公司存活三年以上,并且至少有一个成熟且收入稳定的业务。团队、资金、勤奋只是创业的必要条件,更重要的是市场竞争环境、不可预知的运气等。所以始终谨记,创业成功只是一件小概率事件,成功了那是幸运,失败了其实才是是正常的,虽然我们都讨厌失败。做好预期管理,这样更能够以平常心去创业,减少一些焦虑和压力。 ...
用ChatGPT学SQL
今天教一个做运营的朋友学习SQL。使用ChatGPT创建了一张练习用的表,并让其随机生成了一些测试数据。真的是用于编程教学和查资料的利器。 记录一下和ChatGPT交互的过程。 ...
Mysql数据类型 Mysql Data Types
MySQL 8.0中主要有三类常用数据类型,分别是数值类型(Numeric Data Types),日期和时间类型(Data and Time Data Types),字符类型(String Data Types)。 ...
California Gold Rush | The Forty Niners | Podcast Transcription
podcast link Imagine it’s April 1849, you are a tailor from upstate New York, but after a five week journey, you and your cousin arrived in St. Louis just yesterday. It’s a stop on your way to the gold fields of California, and hopefully to riches. While your cousin is buying some supplies you’ll need at a nearby store, you watch the crowds bustling around you, there are more people here than you have seen in your life. All of them would be miners like you. ...