Usoluyun.GitHub.com

Follow me on GitHub



lifecoach

棒球的博弈论 part 2

棒球的博弈论 part 2

前言 本章我们来结合博弈论的理论,来探讨投打双方选择不同策略对于比赛结果的影响。 既然数据显示Zito在对阵Anderson时候并不好,那到底不好在哪里呢?仅仅是上垒率低么?如何来量化巨人队这个选择到底对比赛的胜负影响有多少呢?

Zito vs Anderson

尽管我们从博弈树里得出了结论,但是巨人队的教练依旧选择了让Zito留在场上对付Anderson。虽然有左头克制左打者的优势,Anderson职业生涯对阵Zito仍然有.384的上垒率(高于职业生涯平均.325).为了理解和分析这轮打席的博弈决策,我们来看一下投手和打者第一级的决策:投好球还是投坏球,挥棒还是不挥棒。

Zito vs Anderson

为了确定,每个球员的最佳选择,我们必须制定每一球的收益。在这个游戏中,收益必须是对称的,也就是对打者来说好的结果,就是对投手来说差的结果。(必须是零和博弈,也就是非胜即败),并且忽略一些第三方因素比如球员的名气大小,收入高低。

我们用WPA来定义四个可能的结果的收益。对于Anderson来说,在道奇球场(主场)一出局,垒上无人,八局下半一球落后,可能的收益如下:

Anderson's Payoffs

运用这张表格,我们就可以来衡量每个反应影响道奇获胜的程度了。比如当Anderson选择挥棒,那么就不会出现坏球(ball)的局面,可能的局面就是一垒安打,二垒安打,三垒安打,本垒打,出局,或者挥空。根据anderson职业生涯的统计,我们可以算出他得出以上情况的概率。因此

Payoff of an Anderson Swing in the Zone:

(Contact rate x WPA/hit) + (out/contact x WPA/out) + (1-contact rate) x WPA/strike

Where WPA/hit is:

WPA x (1B/contact) + WPA x (2B/contact) + WPA x (3B/Contact) + WPA x (HR/Contact)

运用这两个公式,我们能得出之前四种结果的概率。因为棒球是个零和博弈,所以道奇获胜的概率等于巨人失败的概率,因此,之前那个矩阵的结果就是:

Result of Zito Vs Anderson

在这里纳什均衡就是使用混合策略。

什么是纳什均衡
维基百科条目 纳什平衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以通过独自行动而增加收益,则此策略组合被称为纳什均衡点 什么是混合策略纳什均衡
维基百科
相对于纯策略纳什均衡,混合策略纳什均衡同样是一个赛剧中的均衡点,不过它在每个给定信息下只以某种概率选择不同策略。

当前这个概率可以通过Zito的好坏球率和Anderson的挥棒几率来计算得出:

Zito好球率是46.3%
Anderson的挥棒概率是87.9%

那么对于Anderson来说他挥棒的话

.55 x 46.3 + .08 x 53.7 = .298
怎无论Zito投的是好球还是坏球,Anderson的收益是(.298%, -.298%)

不挥棒的话

-1.50 x 46.3 + 1.85 * 53.7 = .3

再来看Zito , 如果他投进好求带的话

-.55 x 87.9 + 1.50 x 12.1 = -.3

如果他不投进好球带的话

-.08 x 87.9 + -1.85 x 12.1 = - .3

结果就已经很明显了,那就是

此刻Zito 对阵Anderson,双方尽自己最大努力(好球率46%,和87.9%的挥棒率),双方的收益差是 .3% vs -.3% 。Anderson将会占有先手。尽管这.3%非常小。这进一步证明了,巨人教练组不把Zito换下来是错误的。

结果

不幸的是,Zito没有达到自己46.3%的好球率,6个投球,5个坏球,Anderson放了其中的四个没有挥棒,被保送上了一垒。

Zito pitches against Anderson

再根据之前不同局面的收益定义,道奇的WPA提高了7.4%。

(未完待续)


详细...

棒球的博弈论 part 1

棒球的博弈论 part 1

前言
两个原因促使我来翻译这篇文章,一个是上次和张岩叔叔吃饭的时候我和他说了我想做个比赛积分和球员技术统计数据库的事情,张岩说之前的数据一直保留着,但是不知道要拿这些数据来干什么。觉得现在杯赛赛制下,这些数据没有什么太多的价值。另一个原因就是觉得现在的大学生打球训练一直缺乏理论知识的教育,并没有意识到棒垒球不只是投球,打击,守备这些事情。所以想结合之前一直感兴趣的博弈论来谈谈如何从另一个层面来解读棒球。E文好的同学可以直接读后面的原文链接。我的版本里加入了一些名词解释和我自己的看法。没有完全按原文翻译,还请见谅。文章很长,时间有限,我会分几次翻完,敬请期待

origin

为什么是棒球?

棒球是运用博弈论透视法分析的最佳运动,因为它场上和比赛和比赛之间的复杂度,战术和战略的多样性。在每一局,每一场和每个赛季里的每个局面,都会出现许多队员,裁判,教练,管理者交织在一起的复杂局面,和数以百计的复杂的决策。大联盟的分析也已经十分成熟,比赛的每一个方面的统计数据都被记录的下来。下面我们讨论的是10年4月18日国联的一场比赛的第八局,对阵双方是旧金山巨人队和洛杉矶道奇队。这是一个典型的具有代表性大联盟式的半局比赛。

2010年4月18日八局下

前六局都没有人得分,甚至没有一个队可以通过二垒。在第七局,Juan Uribe敲出了左外野休息室的深远全垒打,拿下了巨人队本场比赛的唯一一分。八局上巨人队没有得分,球队带着1-0领先优势来到了下半局。这半局,主要的球员有:

巨人队
NO.75 Barry Zito 先发投手 - 职业生涯记录: 137胜106负,3.80自责分率,被上垒率是1.29
NO. 54 Sergo Romo 救援投手 - 职业生涯记录: 8胜5负, 2.82自责分率, 被上垒率.92

道奇队 NO.9 Garret Anderson 外野手 - 职业生涯记录: 打击率.294,上垒率.325, 长打率.463 NO.99 Manny Ramirez 外野手 - 职业生涯记录: 打击率.314,上垒率.412,长打率.591

游戏树

第八局的游戏树

从游戏树来看,我们看到现在巨人队的局面是八局下半,一人出局,Garret Anderson站上打击区。我们来分析现在这一点上巨人队和道奇队的选项所导致的每一个进展,以及预期巨人队的优化策略。

每一个打击都会影响到每队胜出几率。胜出几率是分析历史记录里的每一个打击而得出的结论,然后决定一个队每个可能的局面造成球队获胜的效果。

什么是胜出几率 (WE - Win Expectancy)

来自台湾棒球维基馆
WE 將一場比賽分成 18 個半局,再將一個半局分成可能出現的 24 個上壘與出局狀態,再加上主隊領先或落後的分數,通常分為-10分到+10分等21個狀態。之後用 Markov Chain (馬可夫鍊) 導出各個狀態下主場球隊勝出的機率。常見的 WE 表格假設沒有主場優勢。所以每局上半,無人出局無人在壘的情況下,WE 都是 0.500。

而胜出机率差是构建在胜出几率之上的,用于计算每一个特定的局面而不是特定的球员的。

什么是胜出几率差

来自台湾棒球维基馆
最基本的WPA是以Win Expectancy(勝出機率)為出發點。一名打者打擊前的勝出機率和他打擊後的差別即是打者該打席的WPA。 比如在每場得4.5分的環境裡,八局上半客隊落後五分,一出局,一二壘有人的情況下,客隊的勝出機率是3%。如果該名打者擊出全壘打,讓球隊追成落後二分,一人出局,壘上無人的情況,則客隊勝出機率進步到10%。這名打者該打席的WPA為7,而被打全壘打的投手該打席的WPA為-7。

游戏树的目的是用来呈现胜出几率差。

无论如何,从巨人队看来,道奇队最希望的是在Anderson之后把Manny Ramirez放上打击区。因此,巨人队认为无论谁来对付Anderson都不会对球队的决定带来影响(一出局情况下,Manny作为代打替换投手是肯定上的了场的)。但是Manny Ramirez在垒上有人的情况对于道奇队的胜出几率差影响是很大的,并且Anderson相对于Romo来说对阵Zito上垒率更高。由此推理,巨人队应该换上Romo来对付Anderson,总的来说,换上Romo替换掉Zito来对付Anderson,提高了巨人队胜出机率1.65%(-.53%减去-.2.18%)。这个回报是对称的,也就是说,如果Anderson对阵Zito而不是Romo,道奇队的获胜几率也会提高1.65%。

值得注意的是,虽然看起来让Manny站上打击区是一个优势策略,但它并不总是一个选项。在某一个孤立的时机,它可能是一个最好的情况,但是我们没有建模去证明这个选项只能在整个比赛过程中被使用一次。让Manny代打这件事情在不同的比赛情况之下会有不同的价值。比如让Manny比赛僵局的时候打击会比现在的情况要来的不值得(获得较低的WPA)。但是,如果比赛进入加时,当有队员在得点圈的时候,让Manny去代打的话那他的表现有可能会导致一个较高的WPA,因此,如果Manny 具有最高的WPA,那就需要仔细考虑使用Manny作为代打者的机会成本了。当前情况下,道奇队看起来已经做出了正确的决定,就是在第八局,垒上有人的情况下落后一分,Manny换下了投手(一个明显的弱棒),成为下一个打者。

现在给出的事实就是道奇已经换上了Manny作为代打,巨人队可能的最优结果就是让Romo在无人上垒的情况下去对付Manny。为了最大化这种可能性,巨人队应该立刻换上Romo去对付Anderson。但是,巨人选择了让Zito留在场上。这个决定可能是因为过于自信的倾向, 一个很有代表性的倾向就是:Zito一直投得很好没掉分,或者其他我们不知道的原因。否则,根据我们的分析,这是一个错误的决定。

(未完待续)


详细...

我的带队哲学 - 做到最好

成王败寇不总是真理。球输了了还可以再来,人心散了就真的失败了。
好团队不一定做得出好产品,差团队肯定走不出好的产品。

带队打比赛的时候,我总是很少上去纠正队员的一些技术动作,我觉得这样做除了让队员紧张以外不会有什么别的作用,有时候还会有负作用。我强调士气,但不刻意为之。台上一分钟,台下十年功,队员不会因为你临产纠正了他一个动作,他就能有质的提高,也不会因为队友的加油呐喊一下子战斗力提升,那些都是动画里的情节。

在我的产品团队里,我也不希望通过不必要的压迫感和不断地提振士气来提高团队的战斗力,这同样也是不现实的想法。

总之,我不相信人胜天。我要求他们做到最好,前提是在自己的能力范围内。

专注

排除干扰,冷静思考是队员在场上要做的最重要的一件事情。
打球是游戏,比赛也是游戏,是游戏就有策略。玩游戏不讲策略是没心没肺,打仗不讲策略就是祸国殃民。

球队打比赛的时候,最大的干扰源就是场上的气氛和意料之外的复杂局面,此时要最的不是思考我怎么做,而是我怎么做。一个只差,心态完全不一样。 排除场内场外干扰,利用仅有的几十秒的时间,内心细数接下来可能出现的局面和解决的办法。有准备的去迎接下一球,这就是做到最好

工作的的干扰,多来自于嘈杂的环境,并行任务,无止境的会议和死线带来的压力。排除干扰的方法是:

  • 安静地办公

    工作效率取决于持续工作的时间长短,而不是时间总和,所以要尽量创造安静地个人办公的环境和单独开辟独立的讨论空间。平时工作尽量避免被别人干扰或者是干扰别人,需要讨论了就去其他封闭的讨论空间如会议室,茶水间。没有条件的,就带耳机吧。(不让戴耳机的公司就是反人类的)

  • 一次做一件事情,一次做好一件事情

    对于管理者来说,一次只布置一个任务,任务的颗粒不要太小。事无巨细的管理只是给执行者压力而已。而对于执行者来说,就是同一时间只做一件事情,只把一件事情做好。

  • 减少会议

    开会的效率低众人皆知,但是要摆脱这个问题却不那么简单。碰头会尽量少开,一天一次为佳,时间不要超过15分钟。讨论会议,必须给与会人员提前准备的时间,需要提供方案的与会人员,最好要求能提供两套以上的方案,这样能有效的减少分歧。讨论过程中要拿出真是的论据而不是凭空猜测或是片面主观的看法。尽量减少分歧的产生才能提高会议质量和缩短会议时间。

  • 死线不死

    淡化死线是让人专注眼前工作的好办法。其实过了死线会怎么样?暴雪游戏跳票了无数次,但是丝毫不影响游戏本身的吸引力,反而让更让游戏迷期待。如果让老板在延期交货,和交付不成熟产品之间选择,他会选择。权衡利弊是他的工作。团队的工作把事情做到最好。仅此而已。死线不死,不如不去想他。拿死线压员工,甚至蓄意死线往前挪,妄图压榨员工或是提高士气的做法,通常都是适得其反。

不是你的错

是人就会犯错。
个人成就靠得是努力和天赋,团队成就靠得是系统。

球员在球场上无法专注的另外一个原因就是纠结于之前犯的错误,亦或是因为之前的错误而影响后面的判断和技术动作,甚至有些队员很容易将这些情绪呈现的表情和行为举止上。这些对于团队的影响暂且不说,就球员个人而言,这样的表现是没有意义的。
我经常对队员说的话就是不要对纠结于你之前的失误,专注下一个球。球队不会因为你的一次失误而失败,失败的原因在于一次失误引发另一次失误,继而再引发别的失误。就像病人通常死于并发症而不是疾病本身。
对于球员个人来说,避免球队失败的措施就是,放下包袱,忘记过去,专注于下一球。那剩下的任务就是球团和教练的了。从平时来说,球团建设需要系统化。比如

  • 先发投手的轮值,牛棚的建设来确保投手群足够的战力
  • 可以培养不同类型的队员来应对不同类型的对手
  • 培养团队精神,压制个人主义,英雄主义
  • 培养队员之间相互调节情绪稳定情绪的能力
    基于球队的建设成果,那教练员在比赛场上根据不同情况来制定不同的战略和战术来应对不同类型的对手和突发状况。
  • 投手失态的时候,调用牛棚投手救场,或者针对特殊的打者替换特定的投手
  • 针对对方打者,调整守备位置和人员
  • 进攻时,针对对方投手和防守队员指示打击策略或者替换特定打者
    球团根据自身情况制定训练比赛计划,教练针对各种情况预先制定应急预案。那么真正到了比赛的时候,就能有准备的应战了。每个人的努力,能促进这一整套系统的优化,那反过来系统的稳定也能安定球员的心态,提升表现。如果赛场上投手脑子里想的是“没关系,尽力投,反正投不好教练还能还别的人上来帮我解围”这种念头的话,那她的压力和抱负会小很多吧。

在工作过程中,同样地很多人会为了几个低级错误和bug懊恼进而影响情绪,甚至很多人会拿别人的这种低级错误作为攻击武器来搞办公室政治。这种情况是管理者需要尽力在团队系统建设中避免的。比如优化代码审查机制,加强测试和自动化测试等等。管理者需要传达给队员的信息就是“出现这种情况,不是你的责任,是我们的整个机制不够完善才导致了这些错误现在才回被发现”。如果每个队员在工作过程中能有“没关系,有错误的话QA和自动测试会报上来的,报不上来是那边的问题”这种念头的话,那他在工作过程中也会更加轻松,遇到上述情况也会更坦然一点吧。

无论是教练或是项目经理,一定要避免的就是押宝在某一个明星队员上,或是在某个任务失败后过分追究个人责任。

结果真的不重要

只要你打的不是世界大赛最后一场的最后一个球,总是有机会把局面扳回来的。真到了最后一个球,胜负的天平就不是你一个人能掌握的。

其实打球和开公司一样,比得就是谁犯错少。成功的球队和公司,成功的因素都差不多,失败的球队和公司,各有各得问题。谁犯错少,谁就能走下去。那犯错少一定就能成功么?当然不是,谋事在人成事在天,达成成功的因素并不是你刻意为之可以得到的。就像世界大赛的最后一场的最后一球一样。

做的就是做到最好


详细...