2009年,中本聪设计了比特币,想要把不同计算机的激励措施匹配起来。2018年,我们已经在建设数十亿美元的区块链项目,鼓励人们使用同一套原则。我们预测会出现有效的市场,预测人群是有智慧的。然而,倘若人群不那么聪明,又该怎么办呢?
比特币式的加密经济学激励设计,是一种全新的经济设计范例。它已经实现了不可思议的成就,成为了世界上第一个被广泛使用的数字货币。
近年来,这一范例变成了“终极高招”,对互联网世界产生了深远的影响。它向我们承诺:通过在规划和预测中采用激励措施,来构建令人惊叹的未来技术。
激励机制
许多项目都采用了这种激励机制:
- 在计划、预测方面有Gnosis、Augur;
- 在社会媒体方面有Steemit;
- 在声誉、管理、自组织方面有Colony、Boardroom、Democracy.Earth;
- 在数据协同与数据洞察方面有Ocean、Numerai等。
然而,不论是简单的激励机制,还是从简单机制改造过来的复杂机制,目前都是假定人们一定会作出理性的决定,会采取产出最多的行动,也会合力创造有效市场。
但行为经济学观点认为,从经济学角度说,集体智慧往往不那么聪明。
行为经济学教导我们说,人类作的决定,其绝大部分都是基于简单的心理捷径与“拇指规则”(译注:单凭经验做事,不一定准确),在通常情况下一般是正确的;但在边缘案例中,却经常大错特错,例如开车、选举,或在复杂金融市场中交易。
这些现象在现实生活中有着大量的记载。
本文主张,目前的加密经济学,对行为因素和心理学的关注还远远不够。我们呼吁,那些人类现实经济行为的专家,例如公共政策专家、行为经济学家、社会学家,要尽快参与那些加密经济学体系的设计团队,从而确保长期的实用性、可行性、成功。
比特币、行为经济学、加密经济学
区块链中,激励设计的概念最早来自中本聪的原始比特币白皮书。我们也不妨从事情的起源——比特币说起。
Andreas Antonopoulos制作的图书和视频对此进行了很好的总结。
中本聪用激励设计是为了达到一个前人从未实现的目标:创造一种科学上可靠的、安全的、去中心化的数字货币。
中本聪的设计,能够激励矿工确保网络安全,并使协议的正常操作摆脱缺点。此外,还能够协调所有利益相关者的激励措施,这些人包括矿工、用户,开发者,都对这个生态系统有所贡献。设计的本质是开源的,能确保有组织的攻击变得不划算,方法是允许利益相关者意识到攻击,并叛逃到其他的链。
中本聪为“拜占庭将军问题”(Byzantine Generals’ Problem)找到了一个聪明的对策论解决方案,方法是只要将军忠诚,就给将军发工资,但如果将军企图叛变被发现,就扣掉工资。
从历史的角度看,中本聪的对策论假定非常温和,温和得令人惊讶。
只要有51%矿力合作起来,协调以扰乱比特币,就能成功达到目的。最关键的是,比特币的安全并不依赖任何“理性经纪人”假定,这一假定认为人类都是不留情面追求最优解的人,而且极端理性。
现实中,哪怕人们十分懒惰,哪怕有些人组成了阴谋集团,比特币系统依然能保持安全。与某些现代假设,例如Steemit、Augur相比,比特币的假设更加现实,争议也比较小。(此外,比特币的安全保证,相对来说很强,而且在数学上得到了证实。)
区块链激励设计
自从2009年以来,区块链激励设计已经成熟了许多。今天的区块链体系找到了多种更加聪明的方式,把激励结构用于更加复杂的体系:
Zcash和其他加密货币,也具有先驱比特币的基本激励结构,以太坊和其他二代区块链体系也是如此。
Gnosis, Augur和其他预测市场,试图用一种价格发现机制,达到预测未来的目的:激励用户试图准确预测未来,而且根据这些预测而打赌。
Steemit激励用户贴出有趣的花边新闻【tidbits】,并且/或者为其他人的帖子质量进行诚实的投票。其他的声誉系统(reputation systems)激励用户为声誉较好的演员投出赞成票,从而创建了一种人类“事实上的声誉系统”的区块链版。(到目前为止,还没有人证实自己的声誉。)
Numerai激励数据科学家设计出优秀的算法,用于金融市场的贸易。
Futarchy 激励用户为良好的决定而打赌。
Ocean激励用户为优秀的数据集(datasets)而打赌,并为现有的数据集提供附加价值。(想一想Numerai遇见Gnosis)
Polkadot激励那些利益相关者在网络中作出诚实决定,即验证者(validators)和校对者(collators);激励他们寻找糟糕的演员,即钓鱼者(fishermen);并决定哪个人值得信任,即提名者(nominators)。
激励设计是区块链系统的杀手锏
总体来说,激励设计已经渗透到很多激动人心的应用程序当中,而且被视为区块链系统的杀手锏之一。有些最重要的区块链创新者在文章中抓住了这一点,例如Trent McConaghy就在最近一篇博客文章写道:
“区块链社区明白,区块链可以帮助协调整个持币着部落的行为,因为每一名持币人都绑定了自身利益。但与简单的激励措施相比,区块链有着更为普遍的好处:只要奖励他们代币,你就可以让人们做各种各样的工作(这些工作可能反过来又会增加代币的价值)。区块链就是一种激励人们的机制。
我认为,这是一种超能力。区块奖励功能决定了你想要让网络参与者们做些什么。于是问题来了:你想让你的网络里的人做些什么?这又引发一个关键问题:你激励网络行为的水平如何?
这是细节里的魔鬼。我们果真知道怎么设计激励措施吗?”
从中本聪到Steemit
自从最初比特币模型以来,激励设计就通过某些方式得到扩展。图表1用定性的方式画出了目前高度扩展的激励设计分布图,横轴代表的是自主性,纵轴代表的是行动空间。
“自动性”轴描述的是人类利益相关者追随激励措施要花费多少手工劳动。
简单说来,在比特币系统当中,作决定的是计算机,而在Steemit系统当中,作决定的是人类。详细一点说,比特币矿工连手指都不必动一下就能追随激励措施,只要让计算机诚实地挖矿就行了。而Augur、Steemit系统却依赖人类手动作出预测,写帖子发表,并得到奖励。还有一种位于中间的系统,Polkadot和Proof-of-Stake,要求人类假定他们信任的那些实体不会与系统对抗。
“行动空间大小”的轴,则描述了人们为了让奖励最大化,必须探索多少种可能的行动。
Steemit系统当中,优质帖子数量可能有多少,可能的行动就有多少;而比特币系统当中,有效的行动空间只有一种行动:诚实挖矿,诚实校验。Numerai系统当中,系统请一个人类设计一种优秀算法,然后根据算法的表现好坏给这个人类相应的奖励。
自动性”轴描述的是人类利益相关者追随激励措施要花费多少手工劳动。
简单说来,在比特币系统当中,作决定的是计算机,而在Steemit系统当中,作决定的是人类。详细一点说,比特币矿工连手指都不必动一下就能追随激励措施,只要让计算机诚实地挖矿就行了。而Augur、Steemit系统却依赖人类手动作出预测,写帖子发表,并得到奖励。还有一种位于中间的系统,Polkadot和Proof-of-Stake,要求人类假定他们信任的那些实体不会与系统对抗。
“行动空间大小”的轴,则描述了人们为了让奖励最大化,必须探索多少种可能的行动。
- Steemit系统当中,优质帖子数量可能有多少,可能的行动就有多少;
- 而比特币系统当中,有效的行动空间只有一种行动:诚实挖矿,诚实校验。
- Numerai系统当中,系统请一个人类设计一种优秀算法,然后根据算法的表现好坏给这个人类相应的奖励。
比特币激励设计不仅需要科学家,还需要公共政策专家
由此我们可以看到,激励设计已经扩展到在广阔的行动空间中激励人类内在行为的程度(例如写博客文章)。
- 人们相信,激励措施力量很大;
- 而激励措施又在加密经济中分布极广。
比特币的优秀表现,已经给这种信念下了定论。
比特币说明,位于图表左下方部的区块链项目值得信任;
但如今,范例已经大大扩展,乃至图表右上方的各个系统都分享了这种可靠性。最偏右上方的Steemit等系统也被人们作为一般性的基于区块链的加密经济系统对待了,而不认为它们与比特币有一丁点不同;
但实际上,却一直没有评估措施确认它们的基本加密经济模型是否合格,能经受住时间考验。
这就说明,创造实用激励设计所需的各种跨学科技巧,实际上是缺乏的。
这些技巧包括:机械设计、密码学、工程学,但也包括行为经济学和人文学科。我们需要理解人类行为各种复杂、微妙、不合逻辑的方式。区块链激励设计不仅需要科学家,还需要公共政策专家。
难点在于,人类并不是完全理性的演员。现实中的人类经常不作那些最优化的事情。
有个经典例子,就是“最后通牒博弈”(the Ultimatum Game):
给张三一百块钱,让张三拿出其中的一部分给李四,李四必须作出两个选择:接受或拒绝。如果李四拒绝,两人都只能离开,完全拿不到钱。如果李四接受,那李四就能拿到这部分钱,张三也拿到剩下的一部分。游戏理论告诉我们,李四最理性的策略是永远接受,哪怕张三只给一分钱也应该接受。
但是在现实中,只要给李四的钱少于30元,李四一般就会拒绝。而且,张三一般给出的至少20-30元。因此经验主义环境下两名玩家采取的策略都远远不是最优策略(就游戏理论而言)。我们可能会预测这样的效应在Steemit一类加密经济系统的复杂环境中还会重复。
于是我们将面临一个很大的问题:如果基于加密经济系统的设计规则包括了很大一部分人类因素,那么要如何做才能防止非理性入侵这些规则呢?
特别是,将这种“行为主义”思考应用于以上图表的两个轴之后,我们认为:
- 激励系统的自动性越小,就越难设计,也越多包含人类非理性带来的风险,例如确认偏误(confirmation bias)、沉没成本误区(sunk cost fallacies)、各种趋同思维(Groupthink)。
- 行动空间越大,就越难以最优化,难以作出正确的选择。计算机可以经常搜索很大空间,但费用则难以承受。人类的情况就糟糕得多。人类讨厌被迫选择的情况,于是搜索空间越大,认知思考成本(Cognitive Deliberation Cost)就越高,结果就越差。
因此,在“风险较低空间”(图标上的粉色区域)之外的系统当中,演员本身会难以判断,哪些行动会让自己利益最大化。而且,系统设计者面临的挑战还要困难得多。
随着参与者越来越难以决定采取什么行动,设计者设计稳定而可预测的系统难度会成指数上升。
哪怕在最好的条件下(个人玩家的行动空间很简单,容易分析、优化),想要应用机械设计来创造“在荒野中”运行良好的系统,也仍然是极为困难的任务。行动一旦难以优化(因为行动将会位于“风险较低空间”之外),机制的设计者就几乎没有一点机会了。
建设牢固的激励系统?
目前为止,我们已经确认:复杂的加密经济系统,其设计十分困难,而且人们还没有理解清楚。因此,加密经济系统大多数都可能一开始就千疮百孔,而且必须通过重复的迭代实现改进。
但这不正是技术系统一直以来的基本情况吗?自从人类学会用火,掌握文字以来,我们走过了建设国家的阶段,走过了太空竞赛的阶段,现在又开始运用计算机、软件、网络。这些技术一开始全都存在严重问题,后来随着时间慢慢改进了。
不幸的是,加密货币和区块链体系的现状,并不像历史上其他科技那样容易实现迭代改进。
区块链系统在设计上就注定了一旦应用则难以变化。
任何变化(例如分叉)都需要大多数利益相关者的全力支持,因此任何变化都必须对抗各种实在的既得利益(例如,比特币致命的区块大小之争)(Block Size Debate)。
复杂的区块链系统一定存在各种弱点、容易受攻击的地方,还有设计缺陷,而这些缺陷直到系统广泛应用之后才能暴露出来。
到了这个时候,已经存在数十亿美元的市场资本和网络效应使得既得利益更加强大,更难以对抗。一个用户的社区只要从某个设计缺陷得利,就会在激励措施的引导下宣称,这是功能,不是缺陷。这是公共政策一个尽人皆知的难题,在去中心化系统兴盛以后,也会显现出来。
火上加油的是,目前呈指数增长的机制,可能会隐藏以上说到的许多问题。系统的代币价值若能呈指数增长,比起增长停滞的情况,其行为就能减少攻击性,增加友好程度。这意味着区块链的价值增速一旦放缓,我们将看到可能造成恶性循环的下拉效应。功能失调的治理可能会使这个循环更加恶毒。
考虑人性,保持谨慎
优秀的激励系统,哪怕在最好的条件下也极难创造出来。在区块链系统之下(编码就是法律,刻在石碑上,应用于一大群使用假名的利益相关者),优秀的激励系统就更难创造了。
比特币的成功并不能让我们满意,也不能让我们乐观。我们的激励设计范例必须极端谨慎,慢慢成长,处在各种检测与平衡措施构成的框架中。新的经济体制一旦设计有误,就像前一次金融危机一般,只要系统开始衰退,就会造成雪崩一样的效应,让灾难更长也更深入。
我们必须头脑清醒,认为区块链经济也可能面临它取代的旧体制面临的同样结局。不能因为呈指数的增长和短期的收益而变得大胆,无视掉整个模式在长期方面的不稳定。历史上,这种情况曾经导致市场外部的干预(然而,区块链又处于无国界的状态,因此用纳税人的钱救市可能并不那么方便)。
这个“美丽新世界”的先知和预言家们,在从头创建新经济体制的时候,将会得到足够的建议,小心谨慎地行事。过去无数失败的经济系统的废墟当中,还有无数先例和历史数据可供我们学习。
区块链系统拥有前所未有的潜力,能够解决世界上一些最紧要的问题:
通过将激励措施修改一致,通过扰乱既得利益,我们就能够朝着好的方向改造社会。这个机会一定不能错过!
推荐阅读:
作者:Elad Verbin、Al Esmail
编译:Morpho Hawkes、Diana
碳链价值