什么是博弈论?
博弈论是一种构想竞争者之间社会状况的理论框架。 在某些方面,博弈论是战略科学,或者至少是战略环境中独立和竞争参与者的最佳决策。 博弈论的主要开创者是数学家约翰·冯·诺伊曼和约翰·纳什,以及经济学家奥斯卡·莫根斯特恩。
重要要点
- 博弈论是一个理论框架,用于构想竞争参与者之间的社会状况,并在战略环境中产生独立和竞争参与者的最佳决策。 使用博弈论,可以为诸如价格竞争和产品发布(以及更多)之类的情况设计现实场景,并预测其结果。 场景包括囚徒的困境和独裁者游戏等等。
假定游戏中的玩家是理性的,并将努力使他们在游戏中的收益最大化。
博弈论
博弈论基础
游戏理论的重点是游戏,它是理性玩家之间互动情况的模型。 博弈论的关键在于,一个玩家的收益取决于另一位玩家实施的策略。 游戏会识别玩家的身份,偏好和可用策略,以及这些策略如何影响结果。 根据模型,可能需要各种其他要求或假设。
博弈论具有广泛的应用,包括心理学,进化生物学,战争,政治,经济学和商业。 尽管博弈论取得了许多进步,但它仍然是一门新兴的科学。
根据博弈论,所有参与者的行动和选择都会影响每个参与者的结果。
博弈论定义
每当我们遇到两个或两个以上涉及已知支出或可量化结果的参与者时,我们就可以使用博弈论来帮助确定最可能的结果。 让我们首先定义一些博弈论研究中常用的术语:
- 游戏 :结果取决于任何两个或多个决策者(玩家)的行为的任何情况。 玩家 :游戏范围内的战略决策者策略 :玩家将根据自己的行动制定完整的行动计划游戏中可能出现的一系列情况支付:达到特定结果后,玩家会收到的支付(支付可以是任何可量化的形式,从美元到效用。) 信息集 :在特定点可获得的信息。游戏(当游戏具有顺序成分时,通常使用术语 信息集 。) 平衡 :游戏中两个玩家都做出决定并达到结果的点
纳什均衡
纳什均衡是达成的结果,一旦实现,就意味着没有任何参与者可以通过单方面更改决定来增加收益。 也可以将其视为“不后悔”,从某种意义上说,一旦做出决定,玩家就不会对考虑后果的决定感到后悔。
在大多数情况下,随着时间的推移会达到纳什均衡。 但是,一旦达到纳什均衡,就不会偏离纳什均衡。 在学习了如何找到纳什均衡之后,请看一下单方面行动将如何影响局势。 有什么意义吗? 那不应该,这就是为什么纳什均衡被描述为“不后悔”的原因。 通常,一场比赛中可以有多个平衡。
但是,这通常发生在元素复杂的游戏中,而不是两个玩家的两个选择。 在随时间重复的同时进行游戏中,经过反复试验,达到了这些多重平衡之一。 当两家公司确定机票,软饮料等高度可互换产品的价格时,在达到平衡之前加班时会出现不同选择的情况在商业世界中最为常见。
对经济和商业的影响
博弈论通过解决现有数学经济学模型中的关键问题,引发了经济学的一场革命。 例如,新古典经济学难以理解企业家的期望,无法应对不完美的竞争。 博弈论将注意力从稳态均衡转移到了市场过程。
在商业中,博弈论对于建模经济主体之间的竞争行为是有益的。 企业通常有几种战略选择会影响他们实现经济收益的能力。 例如,企业可能面临困境,例如是淘汰现有产品还是开发新产品,相对于竞争对手降低价格,还是采用新的营销策略。 经济学家经常使用博弈论来理解寡头企业的行为。 它有助于预测公司采取某些行为(例如操纵价格和串通行为)时可能产生的结果。
二十位博弈论理论家因对这一学科的贡献而被授予诺贝尔经济学奖。
博弈论的类型
尽管博弈论的类型很多(例如,对称/不对称,同时/顺序等),但合作和非合作博弈论是最常见的。 合作博弈论处理的是只有知道收益的情况下的联盟或合作集团之间的相互作用。 这是游戏者联盟之间的游戏,而不是个人之间的游戏,它质疑群体的形成方式以及他们如何在游戏者之间分配收益。
非合作博弈论涉及理性经济主体如何相互配合以实现自己的目标。 最常见的非合作博弈是战略博弈,其中只列出了可用策略和多种选择所产生的结果。 现实世界中非合作游戏的一个简单例子是剪刀石头布。
博弈论的例子
博弈论分析了几种“博弈”。 下面,我们将简要描述其中一些。
囚徒困境
囚徒困境是博弈论中最著名的例子。 考虑以犯罪逮捕两名罪犯为例。 检察官没有确凿的证据定罪。 但是,为了认罪,官员们将囚犯从其单独的牢房中移出,并在单独的牢房中对每个囚犯进行讯问。 两名囚犯都无法相互交流。 官员提出了四笔交易,通常显示为2 x 2框。
- 如果双方承认,他们将分别被判处五年徒刑。 如果犯人1认罪,但犯人2不认罪,则犯人1将获得三年,而犯人2将获得九年。 如果囚犯2认罪,但囚犯1不认罪,则囚犯1将获得10年,而囚徒2将获得两年。 如果两个人都不认罪,则每个人将服刑两年。
最有利的策略是不招供。 但是,双方都不知道对方的策略,并且不确定对方不会认罪,双方都可能认罪并判处五年徒刑。 纳什均衡表明,在囚徒困境中,两个参与者都将做出对自己最好的举动,对集体不利。
“针锋相对”一词已被确定为优化囚徒困境的最佳策略。 针锋相对由阿纳托尔·拉波波特(Anatol Rapoport)提出,他制定了一项策略,在该策略中,迭代囚徒困境中的每个参与者都遵循与对手先前的举动一致的行动路线。 例如,如果受到激怒,玩家随后会进行报复; 如果无缘无故,玩家会合作。
独裁者游戏
这是一个简单的游戏,其中玩家A必须决定如何与玩家B分配现金奖励,而后者没有输入玩家A的决定。 尽管这本身并不是一种博弈论策略,但它的确为人们的行为提供了一些有趣的见解。 实验显示,约有50%的人将所有资金保留给自己,有5%的人平均分配,其余的45%则给其他参与者较小的份额。
独裁者游戏与最后通game游戏密切相关,在最后通game游戏中,给了玩家A一定数量的钱,一部分钱必须交给玩家B,后者可以接受或拒绝所给的钱。 要抓住的是,如果第二个玩家拒绝提供的金额,则A和B都将一无所获。 独裁者和最后通games游戏为慈善捐赠和慈善等问题提供了重要的教训。
义工困境
在志愿者的困境中,某人必须为公共利益从事杂务或工作。 如果没有人自愿,就会实现最糟糕的结果。 例如,假设一家公司的会计舞弊猖ramp,尽管最高管理者并未意识到这一点。 会计部门的一些初级员工知道这种欺诈行为,但不愿告诉高层管理人员,因为这会导致涉及欺诈行为的员工被解雇并极有可能受到起诉。
被标记为举报人也可能会产生一些反响。 但是,如果没有人自愿参加,那么大规模的欺诈活动可能会导致公司最终破产并失去每个人的工作。
Game游戏
ipe游戏是博弈论中的一种形式广泛的游戏,其中两名玩家轮流获得更大份额的缓慢增长的现金储备。 安排的方式是,如果玩家将藏匿物传递给对手,然后对手拿走藏匿物,则玩家获得的金额要比他拥有底池时要少。
a游戏一结束,玩家便获得结束,该玩家获得更大的份额,而另一玩家获得较小的份额。 游戏具有预先确定的总回合数,每个回合的玩家事先都知道。
博弈论的局限性
博弈论的最大问题是,与大多数其他经济模型一样,博弈论也依赖于这样的假设,即人们是理性的行为者,他们是自私的并且效用最大化。 当然,我们是社会人,他们经常合作并关心他人的福利,而这通常是我们自费的。 博弈论不能解释这样一个事实,即在某些情况下,我们可能会陷入纳什均衡,而有时则不然,这取决于社会背景和参与者是谁。