信息量 我们经常碰到一个词”信息量”. 却很少去思考什么是”信息量”. 既然是个”量”就应该是可以量化可以比较的. 那么我们日常八卦的新闻具体包含了多少信息? 当我们说那位故人出事前的最后一条新闻”信息量很大”的时候, 我们是在和什么比较? 我读本科修信号与系统和计算机网络的时候曾有幸了解了一些信息论的玩意儿. 但霍金在时间简史里说”每个公式都会让读者减半”, 为了我读者的福祉我就用一句话总结那个公式好了, 也许会说的有些偏颇: 信息量衡量对未知事件的不确定度. 举个例子, 我的银行卡密码是一个六位数. 问: 我的密码是什么. 在没有任何信息的情况下你只能瞎猜, 猜中的概率是十万分之一. 有一则信息说我的密码不是111111, 现在你猜中的概率”少许提高”, 毕竟排除了一个错误答案. (我一定要abuse”少许”这个词来向黑猴团队抗议, 写数值很难嘛?) 另一条信息说我的密码开头是个偶数. 你”大幅提升”猜中的概率, 从十万分之一提高到了五万分之一, 另外五万个奇数都不用尝试了. 这时候你就可以说, 这条消息信息量就远大于上一条. 如果要学习新闻小编体, 最后就得补上一条 “重磅! 我的密码是601609”. 这条消息的信息量就又上了一个台阶. (P.S. 601609只是我刚刚收到的一个验证码) 新闻的信息量 这个世界充满未知. 这是我们读新闻的主要原因, 去获取信息, 降低自己的不确定度. 本来你搞不清会不会降息, 早上看了新闻说CPI低于预期, 学了金融学原理的你直到这意味着降息的概率变大了. 冲进市场买了大盘, 收盘时果然普涨. 这, 就是一条有用的新闻提高了你的信息量, 之后还有幸提高了你的财富. 依照定义, 一条新闻总是能给你带来些信息量的. 无非是信息量的高低. 比如你一早打开了家族群, 收到了一些明显是胡说的中医吹. 这样的新闻就像”密码不是111111”一样, 有无限接近于零的信息量, 在无数个错误答案中帮你排除一个罢了. 亦或者你收到推送说Meta要裁员5%, 而你一早就在内网提前看到了消息. 这就好比猜出了密码再去看一遍答案, 虽然没有多余的信息, 也是加强记忆, 担心自己会不会被裁员. 这些新闻最坏就是浪费你几分钟, 无伤大雅. 而之所以我还是花$4一个月订阅WSJ, 就是因为以我对世界浅薄的了解, WSJ给我推送的新闻大部分时候是高信息量的. 负信息量新闻 我是在连续看到好几个人给我推送一个垃圾文章之后得出这个结论的.

CONTINUE READING

这次聊聊我在UCD修的一些杂七杂八的课程

CONTINUE READING

读博最后一年招生, 面试和看简历的经验

CONTINUE READING

Teaching

ECS153(23Spring): Computer Scurity, TA

ECS032A(20Fall): Introduction to Programming, TA

CS110(18Spring): Computer Architecture I, TA

SI100C(17Fall): Introduction to Computer Science Leading, TA

SI100(17Spring): Introduction to Information Science and Technology, TA

CS100(16Fall): Introduction to Programming, TA