打鸟人生

0

Wingspan是一款我很喜欢的策略类桌游, 中文翻译应该叫《展翅翱翔》, 挺信达雅的; 但实际操作起来我一般叫打鸟. 这个游戏里你有三种资源, 食物, 鸟蛋和手牌. 每个回合你都可以获取任意一种资源, 或者打出一张鸟牌. 打出鸟牌同时需要所有三种资源: 手牌需要一张, 食物和鸟蛋的需求各有不同. 游戏中有五种不同的食物, 而鸟牌往往对食物又特别挑剔. 手牌必须打在食物, 鸟蛋和手牌这三个区域. 在对应区域打出鸟牌可以提高你获取这种资源的效率. 结算机制也不复杂, 最终你鸟牌上的总分加上你鸟蛋的数量是主要得分来源, 剩下则是轮末任务, 隐藏任务和手牌技能之类的得分.

我喜欢这个桌游主要有两个原因. 一个是这个游戏的没有很强的破坏性, 着重在建设. 破坏性是说一些游戏里的角色可以通过破坏其他玩家的工作来通往胜利. 诸如富饶之城的刺客可以取消一个玩家的回合, 小偷可以盗取一个玩家的金钱; 卡坦岛的蛮族可以终止某个地块的资源生产. 这一点在打鸟里几乎是没有的, 在欧洲扩展包里才加入了”盗取别的玩家的食物”这类的技能. 打鸟的技能更多是利他的, 鸟牌上会附带一些诸如”所有人摸一张牌”, “所有人轮流获取一个食物”这样的技能; 作为奖励这类利他型的鸟牌往往也有更高的积分. 靠着别人”开饭”我上次打了一局几乎没有获取过食物, 积分也能达到100以上. 算是一个比较高的积分, 如果纯靠自己干是很困难的. 没有破坏性意味着不需要用阴谋也能赢. 想要获取一些轮末的奖励目标, 比如”打出鸟牌最多的玩家”, 往往需要你在十多个回合前就开始策划的阳谋.

我之前一直沿用的大致策略是下蛋. 原因是手牌和食物都不能直接转化成积分, 他们往往需要至少两个回合(获取某种资源 + 打鸟)才能转化成鸟牌上的积分, 但下蛋可以直接用于结算. 所以前期会尽可能打出下蛋区域的手牌, 然后直接下蛋到游戏结束. 不过最近又发现了更通用的玩法. 本质上你只需要确立一个优势资源, 无论是食物, 鸟蛋还是手牌(虽然我还没玩过食物强势的局), 然后用这个相对便宜的优势资源去换取其他资源. 具体确立什么优势资源则很大程度上依赖于奖励目标和初始手牌. 这样至少不会出现以前那样不给下蛋牌就不会玩了的尴尬场面. 如果说玩这个游戏给我最大的体悟是什么的话, 建立优势资源绝对是其中之一.

最后这个游戏贴心设计了自动机, 即使单人也能玩. 卡牌画风精美, 每种鸟类都有很漂亮的绘画, 卡牌底下有关于这个鸟类的一些冷知识. 这个游戏在steam有售, 国区只要40块, 鸟类绘画也会变成活灵活现的动画, 会适配这个鸟的叫声, 非常心旷神怡. 总之是一个做工非常精细的游戏. 如果几个朋友经常喜欢一起玩也可以买实体版, 实体版甚至有贴心的官方中文版(但是45刀/400块买个桌游贵是真的贵)

1

我当然不会在新年写一篇文章来介绍桌游. 想到这个游戏是因为前些天和朋友聊天, 聊到一个rich kid(富家小孩)的时候她问我, 你觉得你和rich kids的区别在哪里. 区别在我没有一个富爹.

我想了一会儿, 我说”我觉得他们比我有更多的时间”. 本来指望着说我们俩在物质上有什么差距, 但是这个答案估计会把很多人直接整不会了.

我从小受到的教育是不要过分专注于金钱, 金钱买不到时间和健康. 但是一个非常显而易见的相关性就是, 富人确实是会比穷人活更长时间. 比如这是一张美国人预期寿命对家庭收入状况的图.(Source: The Equality of Opportunity Project) 横轴是富有程度, 越右边越富有; 纵轴是预期寿命. 对前20%到80%富有的人, 大约就是能读到这篇文章的大多数人, 你的预期寿命是随着财富程度大致上线性上升的. 最富有和最贫困的男性的预期寿命差距甚至可以大到15岁, 女性是10岁.

虽然我不能证明其中的因果性, 我也不打算去证明; 但是一些诸如”营养状况更好”, “医疗条件更好”的理由显而易见. 但甚至这都不是我说”更多的时间”试图表达的意思. 我和rich kids都是二十多岁的年轻人, 远远没有达到需要开始讨论预期寿命的时候.

为了解释为什么一个明明比我年轻的人却比我有更多时间, 这就不得不把Wingspan请回来. 想象一下人生就是Wingspan这样的桌游, 每个小时就是一个回合. 金钱, 权力, 人脉是你的资源, 你可以花费一个或者多个小时去获取. 经验是你的鸟牌, 你的获得的经验越多你获取资源的速度就越快, 但你也需要很多时间和资源才能获得经验. 经验这个东西很抽象, 它可以是掌握一门技术, 使用一个工具的能力, 一门语言, 都可以.

然后你再回来看大部分人. 学位不过是用大量时间换取经验, 以便在未来用更高效率换取资源, 大概率是金钱. 一天里用八个小时换取金钱(工作)以及剩下八个小时干点别的. 我一个no life PhD candidate哪知道你们下班干嘛我又不下班. 不太普通的人会用金钱去置换权力, 用人脉去置换金钱, 左手倒右手越换越多. Billions(《亿万》)拍了六季, 我用一句话总结就是”用人脉与金钱置换权力的新钱(Axe)和用人脉与权力置换金钱的旧钱(Chuck)互相看不起”的事儿. 我在看完第六季第一集以后突然就悟了这个矛盾, 然后就看懂了Chuck咬死Axe又开始咬盟友Prince的动机.

现在我可以直接说结论了: rich kids不太需要用他的时间换取资源. 你笑别人买东西不懂压价勤俭持家, 别人笑你在双十一花了五个小时凑满减只省了三百块. 如果你想更悲观一点的话, 他的从老爹那继承过来的人脉和权力大概率也比普通人多很多. 我们在十五六岁花费上千小时换取到了接受高等教育的权利, 但rich kids可以用我在复习双曲线的时间来获取更多日后对他们更有用处的经验.

一个我认识的rich kid曾经在我大二的夏天和我共事, 帮忙新建了一家初创, 那时她高二. 当然那时我还没有现在的思想体系来描述我们之间的差距. 我在高二的时候上补习班, 她在高二帮初创公司取名, 设计logo和品牌; 我能获得这个机会是因为我花了很多时间去社交获得了人脉的推荐, 她能获得这个机会是因为她爹是这家初创的律师. 我觉得没有什么例子能更好的说明什么叫”他们比我有更多的时间”, 她能在高二做到的这些都是我丢失的时间. 后来我听说她本科去了斯坦福, 之后便没再联系过; 这家幼教相关的初创现在还在, 她给取的名字是博谙, 英文名Bookends(原意是”书立”), 我毕业前还去参观了一下.

2

Rich kids比我有更多的初始资源, 大家的时间是一样的预期寿命甚至比我高. 结算分数我一定会输, 结论得到了, 文章可以结束了嘛? 我说过我不会在这里倾倒太多负能量的, 何况你也太小瞧我的思考能力了.

我在我朋友试图得出这个结论的时候及时打断了她. 跨年的时候我还在和几个朋友说, 试图”结算”一个人往往是我和这个人关系的最后一个阶段. 结算意味着双方的关系变成了高与低, 依附与被依附, 利用和被利用; 得分比我低的人会被抛弃, 比我高的人会被保留. 在觥筹交错和勾心斗角的世界里这可能很常见, 但我不想和一个随机的rich kid做结算. (所以尽管我承认《纸牌屋》给我的顿悟非常深刻, 在某些层面甚至促成了我现在这篇文章, 但我非常讨厌这个剧)

游戏推出了积分只是为了让游戏结束的时候有一个赢家, 但我不觉得人生是有赢家的. 一个人可以有无数的维度, 你可以在任何一个维度上比较, “他羽毛球比我打的好”, “他读的书比我多”. 我仍然得承认, 一个rich kid比我更优秀的维度要多于, 甚至可能是远远多于, 我比他优秀的维度. 但我们不可以把所有维度挤压在一起, 然后试图用一个数字去把人排个序, 这是在贬低人的价值. 你看Wingspan只有26个回合, 游戏结束的时候会结算分数. 但是人没有固定的回合数, 预期寿命也只是”预期”.

那我们和rich kids要怎么比较? 要掰扯这个问题我们姑且先回到桌游吧. Wingspan中有四轮(Round), 每轮有5到8个回合, 并且在轮末的时候会有奖励目标, 玩家依据奖励目标的完成度排名, 排名靠前可以获得额外积分. 四个奖励目标中我一般会争取最后两个, 除了最后两个的奖励分更多这种显而易见的原因以外, 前两个目标和你的初始手牌相关性很大, 后两个则让你有更多规划的时间. 比如下面那张图第一轮的奖励目标是”在下蛋区的鸟牌数量”, 数量最多的玩家可以额外获得五分. 但如果起手捏了一把食物区的鸟牌呢? 为了和别人竞争你就不得不花额外的回合抽卡, 获取食物(不同区域的鸟牌消耗的食物往往非常不同), 打卡; 而拥有更好初始条件的人可以更轻松的完成这个目标. 强行竞争会轻易的让你落后别人两三个回合, 而奖励的积分往往不值得这些回合的损失. 这是为什么除非初始手牌很好我都不会浪费精力去争取前两个奖励目标.

这个道理如此简单但是太多人沉迷于此:

玩不过的游戏就不要玩.

你可以说我的想法是阿Q, 躲在自己的角落里自娱自乐; 你也可以说我活明白了, 在某一个领域创造属于我的世界. 但我曾经和一个桌游设计者聊天得到的反馈是, “保持玩家’能赢’是一个游戏能吸引人的一个关键”. 卡坦岛最后几个回合有时候无聊透顶就是因为半数玩家都没有赢面, 但还要陪着”能赢”的那部分玩家交易资源. 硬要和rich kids去比财富, 这是我们沉迷逆袭爽文的原因嘛?

(假装这有一个歪嘴战神的表情包, 我知道就算我不找图你们脑子里也有画面)

3

问题似乎又回到了开始, 人生真的是打鸟吗? 不用世俗的价值, 我们计算的积分到底是什么. 年底的时候意识到答案简单到离谱, 这个比喻当然合理了, 只不过你的对手是你自己, 就像在Wingspan里和自动机对弈. 你的对手是平行世界的你. 你在摆烂的时候, 另一个你就已经赢了这一轮. 你们的结算目标是最优化的你. 虽然有同样的初始条件, 但是最优化的你可以无限制撤回, 总能做出比你更好的决策; 就像《明日边缘》里能重置时间的Omega. 你要怎么打败一个Omega? 我想你不能, 但这不断逼近的的过程就是你的成长不是吗?

那么我的赛道是什么, 我的每个决策在优化什么? 这个话题我其实不太想聊, 这就像打鸟的时候给人展示了你的手牌一样, 从此以后所有规划都可以被人快速推断出来. 但在我脑子里这篇文章确确实实是从new year resolution开始构思的, 所以我至少应该说说今年的策略. (想不到吧我给你说完了桌游和rich kid就为了聊聊一下我今年的new year resolution)

我读博的时候觉得我不能活得和芸芸众生一样, 去学界说不定还有点机会. 所以我这个博士读的蛮有意思的; 大部分博士关心的实验, 发文章, 引用量, 我没有特别关心.这就是你publication record弱的要命的理由? 倒是能在LLVM里找到一个bug然后修复好能让我开心两天. 因为水文章能产生的影响很小, 用老板的话说, “十年后不会有人读”; 但我的代码十年后仍然会跑在每个程序员的机器上, 勤勤恳恳的执行我的意志.

那么博士读到第四年, 尤其是也不太担心毕业的情况下, 我今年的new year resolution是”对这个世界产生影响”. 用CGP Grey的话说应该是”Year of Impact”. (CGP Grey这事儿到最后再提) 给开源社区贡献代码是我认为的产生影响力的行为, 而给项目写脚本不是; 结识大佬让他们指导我能帮我认识到项目底层的问题, 和朋友打德扑不行. 我在生日那篇年终总结里说”技术上我还有很多要学, 社交上我还要认识更多优秀的人, 和更多人去交流”, 大约是这个意思. 现在再多想想, 写公众号也以某种方式影响了我一百多的关注, 同时还需要我把之前混沌杂乱的思维整理的清晰可见, 有何不可呢?

回到开头, 再次试图回答这个问题, rich kids和我有什么区别. 他比我有更好的初始条件, 从而比我有更多的时间, 没错. 但如果我们都是向自己的目标前进的人的话… 我们没什么区别. 大家都在玩一款叫打鸟人生的游戏, 我们的对手不是彼此而是自己. 我们在用有限的时间获取或者转化各种资源来完成自己的目标, 来逼近一个最优化的自我.

一些后记

我刚开始写这篇文章的时候只是想着我今年有这么多时间可以花费, 除了工作以外还想用来干嘛. 前段时间生病的时候想着可以学一门乐器, 这件事我也想了快两年了, 考察了各种乐器以后觉得钢琴可能容易一点. 但是从几个朋友那得到的反馈都是练习时间超过3000小时, 还不考虑要搭进去多少钱, 多多少少有点沮丧.

后来看到了CGP Grey的视频《Your Theme》 (Source: https://youtu.be/NVGuFdX5guE). 大意是你的new year resolution 不需要是一个具体的目标, 而是一个”主题”. 你可以向着这个主题迈进, 就是一个不断进步的过程. 这个想法和我的”影响力”不谋而合, 尽管他提升到了一个”Theme”的高度, 而且这个视频是两年前发布的(酸). 去年底发现的这个Youtuber真的是和我三观非常契合. 一些诸如探讨自动化对人类社会影响的《Humans Need Not Apply》 (Source: https://youtu.be/7Pq-S557XQU), 或者权力结构是如何维系的《The Rules for Rulers》 (Source: https://youtu.be/rStL7niR7gs)都因为太合我观点了前后看了好几遍.

(再说个题外话, 关于自动化和人工智能我前年就想写一篇文章, 但是感觉这个话题的很多层面大家都说过了无非是嚼舌根而已所以到现在也没构思好, 催更就写, 嘻嘻)

把人生比作Wingspan这个这个桌游暗示着我是结果导向的. 换句话说, 我只关心这么多时间花完了以后我的最终收获而不是我在这一段时间里的附带收益. 用一个很久以前很时髦的话说, 我只关心目的地, 不关心沿途的风景. 我们对话时她很快指出了这一点. 那首先我承认我做决策必然是结果导向的. 但人们往往过于关注自己想要的最终结果而忽略了一些附带收益. 并不是说”沿途的风景”就不是结果的一部分, 换句话说, 我关心附带收益, 他们仍然会影响我的决策. 和朋友聊天不达成任何目标, 但是和合适的的人聊却能帮我整理清楚曾经混沌的思路进而产生这篇文章. 甚至有时候附带收益往往是更有益的一部分, 就像谈恋爱的目的是settle down(对不起我不会翻译这个词), 但途中你们的快乐要更重要. 但我觉得我们不应该冲着附带收益做决策, 就像我不可能说今年的目标是我要生产多少文章, 灵感说来就来.这就是我放鸽子的理由 我不知道要怎么帮你估量每一个决策的附带收益和附带损失. Afterall, I am just a dump kid.

最后就是关于Wingspan的策略问题, 或者更宏观一点人生策略问题: 到底是”全面发展”还是”专精发展”. 这个问题其实在各类需要升级的游戏中都有体现, 根据游戏数值设定的不同决策也会不太一样. 我的想法是看你的ROI (Return of Investment, 投入回报比). 打鸟里开销是略低于线性的(因为随着游戏进行你的资源会越来越”便宜”), 但是收益是线性的, 所以打鸟我还是倾向于专精一个资源. 前提是你能精确计算出一个决策的收益, 就像打鸟的时候会很清楚这张鸟牌的分数一样.

但是际问题中, 就像上一点提到的, 附带收益(或者损失)的存在意味着你没法在决策前精确的计算你的收益. 用CGP Grey的话说, 未来在一片未知迷雾里, 目标只是一个点, 沿途的风景你要走过去你才知道, 你不能在未来做过去的决策, 你活在当下. 对此这是强化学习reinforcement learning里有一个经典问题与之对应: Multi-armed bandit problem. 大致上是说有诸多老虎机(armed bandit), 每个老虎机的”爆率”不一样, 但你不知道每个机器的概率, 要如何在有限回合内最大化你的收益? 你可以进行一些尝试然后锁死在已知”爆率”最高的老虎机上(专精发展), 但也就意味着你失去了发现潜在的, 更好的老虎机的机会; 过度探索不同老虎机的”爆率”(全面发展)又意味着你失去了在最高爆率的老虎机上获得收益的机会. 一个颇为行之有效的策略(epsilon greedy)是用epsilon的概率随机探索, 用(1-epsilon)的概率去玩已知爆率最高的老虎机. 这个问题深入下去有很多变种, 有兴趣的朋友可以去自学强化学习, 我用的Richard S. Sutton和Andrew G. Barto合著的教材 Reinforcement Learning, second edition: An Introduction 还不错.

我前两天看到一个YouTube在探讨”人应该成为专才还是通才”(Source:https://youtu.be/XJsCM7xyETc). 这个视频里提出的一个很有意思的观点是”在不同的领域都有所涉猎可以举一反三的帮助你更好的专精发展”. 依次观点可以有一个大致混合的策略, 花一些时间去玩各种乱七八糟的东西, 前提是抱着最拿得出手的领域深入发展. 这和epsilon greddy给出的策略非常接近. 但是人生是一个有限回合无限老虎机并且概率会变的游戏, 意味着你首先不可能穷尽所有老虎机, 其次你过去的经验也未必好用. 所以每个人的策略都有些不一样, 这个问题就留作课后作业吧, 我想这可以开启一个很长时间的辩论.

Related