人工智能战胜李世石:解读谷歌AlphaGo和它背后的男人

北京时间3月9日,谷歌的人工智能AlphaGo与韩国围棋冠军李世石之间的世纪大战拉开了帷幕。

在比赛前,李世石表现的非常曾自信的说:“除非出现严重低级失误,我绝对不会输。虽然电脑的 AI 能力在迅猛进步,但其要真正对抗人类围棋高手还需要时间。我与 AlphaGo 五盘棋的比分应该不会是 3:2,可能是 4:1 或 5:0,所以我会最终赢得胜利。”

然而今天的第一局比赛,李世石便被AlphaGo成功击败。

两者在正常比赛的过程中针锋相对,李在石要发挥出了其力战的风格,但是最终 AlphaGo 稳扎稳打,并且第一时间抓住李世石的失误,进一步扩大战果,最终走向胜利。

第一局的战败,也使得后面的局势对李世石有些不利。

AlphaGo什么来头?
AlphaGo 是一款围棋人工智能程序,由位于英国伦敦的 DeepMind( Google 旗下公司)团队历时两年开发而成。


▲ 围棋复杂度示意图

围棋每回合有 250 种可能,一盘棋可以长达 150 回合。所以围棋最大有 3^361 种局面,换算一下大致是 10^170,而已知宇宙中原子的数量为 10^80。
面对围棋中如此巨大的运算量( 10^170 ),靠电脑机械列出所有可能方案,再形成树形地图的传统做法,不仅效率低而且无法延续下去。

直到 Google 下属的 DeepMind 团队找到了「 深度学习(Deep Learning)」的终极杀器。「 深度学习」是人工智能(AI)领域当下最为热门的研究领域。

具体到 AlphaGo 上,「 深度学习」的能力就是利用「 价值网络( value network ) 」去计算局面,然后再用「 策略网络( policy network )」去选择下子。「  价值网络 」和「 策略网络 」是两种不同的深度神经网络,并且共同构成了 AlphaGo 的「 大脑 」。

▲ AlphaGo 的两种深度神经网络结构示意图
围棋过程中,AlphaGo 的「 大脑 」可以模拟人脑先「 筛选 」出那些有利的棋局,并「 抛弃 」掉明显的差棋,从而将计算量控制在AlphaGo 「 大脑 」可以完成的范围内。具体来看:

1.「 价值网络 」负责减少搜索的深度:AI 会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。

2.「 策略网络 」负责减少搜索的宽度:面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。

3.利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI 就不用给每一步以同样的重视程度,而可以重点分析那些能赢的棋步。

需要说明的是,人脑不可能像电脑一样无时不刻地接受「 深度学习 」,所以理论上来说只要 AlphaGo 经历了足够的训练,就能击败所有的人类围棋选手。

最后的结果已经不重要

虽然第一场比赛已经告一段落,但是李世石能否在后续几场比赛中翻身?AlphaGo 又能否乘胜追击进一步扩大战果?感兴趣的朋友可以继续关注后面的四场比赛。

  • 3 月 10 日(星期四):第二场比赛
  • 3 月 12 日(星期六):第三场比赛
  • 3 月 13 日(星期日):第四场比赛
  • 3 月 15 日(星期二):第五场比赛

但是,不论比赛最终结果如何,谷歌AlphaGo能赢下一局就说明它已经具备了跟围棋最顶尖的棋手抗衡的能力,这已经是一个很大的飞跃了。但,毕竟AlphaGo还是借助于人类的思维。

所以,无论本次挑战赛的最终结果如何,我们都不必过于担忧人类未来是否会被人工智能所统治。

正如谷歌的执行董事在发布会上所说:“这次对决无论哪方笑到最后,终究都是人类的胜利,人类的智慧又向前迈出一步,我们的世界将更加美好。”

AlphaGo背后的男人

当我们在讨论人工智能的发展、关注李世石的走棋风格时,我们更不应该漏掉促成AlphaGo挑战李世石这一事件的关键人物。这个站在AlphaGo背后的男人就是DeepMind公司的创始人之一德米斯·哈萨比斯(Demis Hassabis)。

在外媒的描述中,德米斯·哈萨比斯谦虚、认真,对自己目前的工作抱有“解决智能问题,随后利用这一技术去解决所有一切”的态度。

再翻看DeepMind官网对于哈萨比斯的介绍,简直可以用“天才”、“神童”来形容。

哈萨比斯,8岁时就编写了自己的计算机游戏,13岁时获得了国际象棋大师的称号,17岁时开发了首款引入人工智能元素的电子游戏《主题公园》并大获成功,20岁时在剑桥大学计算机科学系获得了两门学科优等成绩,拥有剑桥大学和伦敦大学学院的计算机科学和认知神经科学双学位。不久后创建了自己的电子游戏公司Elixir并完成了关于大脑海马体和情景记忆的前沿性学术研究。 2011年创立DeepMind,而在此之前,他在哈佛大学和麻省理工学院取得博士后。随后,公司在2014年被谷歌收购,直到人工智能项目AlphaGo,引发全球关注。

谷歌Alpha Go能取得如此巨大的成绩与计算机技术的发展离不开,但更为重要的一点,Alpha Go的成功更离不开哈萨比斯不舍昼夜的努力。

DeepMind一名同事在接受采访时说,哈萨比斯“完全是个超人”。哈萨比斯本人也表示让他“切断电源休息”很难做到。“我从不会考虑工作与生活平衡的问题,这是同一块画布的不同部分。我喜爱阅读、看电影、听音乐,但这一切都会回到我所做的工作。” 哈萨比斯说。

热门科幻电影《机械姬》的导演埃里克斯·加兰德(Alex-Garland)是哈萨比斯的好友,而他还常常与美国电影制片人交流。

虽然被谷歌收购,但公司在哈萨比斯的坚持下仍在英国办公。每天到夜里11点,许多人都准备入睡时,哈萨比斯会开始他所谓的“第二天”。与美国同事进行电话会议,这样的讨论通常会持续到1点。这之后,就是他自己的思考时间,通常会持续至凌晨3点或4点。哈萨比斯表示:“这段时间里,我会进行自己的思考,包括我们的研究、我们的下一挑战,或是写一份算法设计文档。”

将生活所有的经历与乐趣倾注到工作中,对于哈萨比斯来说,是再正常不过的事情了。他在接受英国《卫报》的采访时称,“如果说我没有正常生活,那么也是对的。在我醒来的每个时刻,这(人工智能)都是我思考的问题,或许在梦里也是如此。这很有趣、很重要,也是我最有热情的一件事。当然,我会努力让自己接地气,否则可能会有点发疯。”

值得一提的还有,哈萨比斯的个人特质与公司文化做到了完美结合。除了具备其他科技公司休闲、开放的办公环境外,就说一点让大家感受一下DeepMind公司的文化。在DeepMind办公楼里,所有的房间都以人类历史上的天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。而哈萨比斯个人的偶像,他表示,曾读过几遍《弗兰肯斯坦》。并认为将这些东西记在心里很重要。

谷歌AlphaGo重燃人工智能发展热潮

比起光鲜亮丽的简历和傲人的成绩,在哈萨比斯眼里,AlphaGo才是他职业生涯中取得的最令人兴奋的成就。

目前,他们利用深度学习、蒙特卡罗树搜索等技术在自然语言处理、图像识别、推荐系统等多个方面里取得成功运用。

根据DeepMind团队的介绍,AlphaGo的关键在于使用人工智能中的深度神经网络。在Alpha Go中有两种不同的神经网络,第一种叫做政策网络(policy network),用来预测下一步;第二种叫做价值网络(value network),用来预测棋盘上不同的分布会带来什么不同的结果。

通俗一点讲,就是先用已有的围棋技巧来训练AI,称为监督学习(supervised learning),然后让AI和自己对弈,通过深度学习让其掌握如何赢得围棋比赛的技巧。

这样的描述或许让你有些不明白,但看看人工智能的发展历程和人机对弈的难度,你就知道为什么Alpha Go战胜人类围棋冠军是一件里程碑式的事件了。

首先,作为人类最古老的棋类,围棋每回合的可能性比其他棋类更多,共有250种可能,一盘棋可以长达150回合。同时,围棋有3^361种局面,而可观测到的宇宙,原子数量才10^80。一直以来,按照技术的发展速度,外界普遍认为利用人工智能超越围棋专业选手至少需要10年。

其次,这次AlphaGo的成功再次让人工智能的发展迎来曙光。从第一台计算机诞生起,人类就梦想着让计算机拥有智能甚至超越人类的智能。但在随后半个世纪的发展中,几次技术创新尝试的失败使人工智能研究陷入停滞,项目关闭、经费撤销,整个行业在20世纪后半叶进入寒冬期,直到1997年开始复苏。当时, IBM公司的“深蓝”凭借强大的计算能力战胜国际象棋大师卡斯帕罗夫,令人兴奋。所以,也就不难解释这次AlphaGo战胜欧洲围棋冠军后,为什么会引发大规模媒体讨论了。

这样的成绩就连竞争对手Facebook都急了,其人工智能实验室主任在谷歌成功后随即呛声,称尽管谷歌赢了,但是我们先做到的。两大科技巨头之间在人工智能的竞赛也引领了全球资本对人工智能的追逐。

最后,不论谷歌AlphaGo能否在后续的几局的比赛中继续战胜李世石赢得最终胜利,我们仍可以期待AlphaGo在未来生活的应用。因为哈萨比斯对AlphaGo充满信心,甚至已经想到能应用到哪些领域。

“最终,我们想要将这些技术应用到真实世界的重要问题中。因为我们用的方法是通用的,我们希望有一天,它们能延伸得更广,帮助解决最紧迫的社会问题,从医药诊断到环境模型。”哈萨比斯说。

编辑:芯智讯-林子

0

付费内容

查看我的付费内容