发新帖

人机大战简史:AI如何在20多年中一次次赶超人类

[复制链接]
2586 0
640.webp (2).jpg

△ 1996年2月卡斯帕罗夫与深蓝的首场对决

量子位 | 若朴 编译整理

二十一年前的2月,国际象棋人机大战上演。

IBM的超级电脑深蓝,因与国际象棋世界冠军卡斯帕罗夫的对阵而名声大噪。虽然深蓝最终没有赢下比赛,但在这个过程中仍然赢下的两局比赛。这也被认为是此后人工智能(AI)与人类的一系列博弈游戏中,一长串胜利的开端。

然而,深蓝其实并不是在博弈游戏中击败人类的第一个人工智能。这不重要。重要的是从第一次获胜迄今,AI已经在众多人机大战中击败人类,例如围棋和扑克。

人机大战似乎不像一个测试AI的正经方式。但Alberta大学的计算机科学家Jonathan Schaeffer说,“在博弈游戏中展示思路,然后规划化应用到真实世界中更大的问题上,就等于跑之前要先学会走”。

值此国际象棋人机大战21周年纪念,我们以一个简单的方式,回顾那些在历史上留下过浓墨重彩一笔的人工智能,以及它们背后的创造者。

Chinook

主要创造者:

Jonathan Schaeffer,Alberta大学

1991年,Chinook败给国际跳棋世界冠军Marion Tinsley,随后在1994年获胜。2007年,研究人员终于攻克国际跳棋比赛,现在Chinook可以击败任何对手。

0 (2).gif

Chinook第一次与Marion Tinsley交手,是在1991年的一次展示比赛中。当时计算机下出一个特别的招数,Tinsley随即说“你会后悔的”。

这个人工智能的创造者Jonathan Schaeffer当时对此不屑一顾:“你知道什么,我的电脑提前算好了20步棋”。然而几步之后,电脑告诉Schaeffer优势已在对方一边,又几步之后,人工智能选择投子认输。首战失利。

640.webp (3).jpg

△ 国际跳棋世界冠军Marion Tinsley在1988年。

然而Chinook仍然收获了历史地位:第一个在人机大战中获胜的人工智能。1994年,Chinook赢得国际跳棋的人机大战世界冠军。

但是Chinook前进的脚步并未停下,从1994年到2007年,研究人员终于让人工智能完全攻克了国际跳棋。这是一个里程碑式的事件。

深蓝,IBM

主要创造者:Murray Campbell

1996年深蓝对决国际象棋世界冠军卡斯帕罗夫。深蓝取得首局胜利,但最终2:4落败。第二年,深蓝卷土重来大获全胜。

0 (3).gif

国际象棋是一个存在大量可能性的博弈游戏。

在每一个回合中,一个玩家可以有大约40种不同的行棋选择,当然对手也会有40中不同的应对选择。如果试图计算棋局的走向,各种可能性会呈指数级的爆炸,所以你只好两手一摊,全凭感觉下出一步自认为是最佳选择的棋。

人类玩家就是有这种伟大的能力,可以只考虑一小部分的可能性就作出决定。对于什么是好的决定,什么又是坏的决定,有一种良好的直觉。

计算机无法效仿这种直觉,但是可以对所有的可能性进行一次彻底的搜索,这正是深蓝所擅长的事情。深蓝每下一步棋时,可以每秒计算1亿种可能性。

1996年和1997年,深蓝用两场比赛给很多人初次普及了人工智能的概念。在90年代,人们都知道电脑可以干很多机械且常规的任务,例如计算工资。人们也知道下国际象棋需要智力,只有聪明人才能玩得好。

所以看到一台电脑可以击败实际上最棒的人类,虽然只是在一个博弈游戏中,已经有人能隐隐感到,一个伟大的时代正在到来。

沃森,IBM

主要创造者:

Eric Brown,沃森健康算法总监

2011年,沃森在问答比赛节目《Jeopardy!》中击败两位人类高手,总共赢得7.7万美元奖金。

0 (4).gif

经由电视答题节目《Jeopardy!》与人类选手展开对抗,沃森以公开、易懂的方式向大众展示了人工智能对于自然语言的理解能力。当然,沃森在电视上还展示了自己的智力,那些问题很多人类都不见得能听懂,更别提能够回答上来。

沃森的伟大之处在于,能够理解语言,并且做出一个有信心的回答。

640.webp (4).jpg

△ 沃森在《Jeopardy!》中的形象是一块电脑屏幕

建立这个人工智能系统,可以利用人类最自然的记录以及交流的方式:文本信息。沃森可以从巨大的文本信息库中,提取潜在的答案和证据,来行程对答案的支持。人类积累了大量的文本信息,例如百科全书、网络内容、书籍和新闻等。

然而只有在一个足够深的层次上对这些内容进行分析和理解,才能找到那些回答问题所需的真正答案。这正是沃森展示给人类的能力。

AlphaGo,DeepMind

主要创造者:Demis Hassabis

AlphaGo去年3月在围棋人机大战中击败韩国职业九段李世乭。

在围棋界大杀四方的AlphaGo,背后用到很多人工智能发展的新成果:神经网络、深度学习、蒙特卡洛树搜索等等。实际上,AlphaGo由两个不同的神经网络组成大脑合力下棋,一个进行落子选择,一个进行局面评估。

2016年1月,AlphaGo以5:0完胜欧洲围棋冠军樊麾,这是人工智能第一次在不让子的情况下,第一次击败职业棋手。2016年3月,AlphaGo以总比分4:1击败世界围棋冠军、韩国职业九段棋手李世乭。从而赢得全球关注的目光。

640.webp (5).jpg

去年12月底到今年1月初,一个名为大师(Master)的程序在网上连续对战柯洁等中外围棋高手,取得60胜0负的惊人战绩。最后Master揭下面具:还是AlphaGo。

如今AlphaGo又要卷土重来了,这个人工智能的故事还没结束。

Libratus,卡内基梅隆大学

主要创造者:Tuomas Sandholm

今年1月,Libratus击败四位人类高手,在德州扑克人机大战中成为“赌神”。

0 (5).gif

此前人之大战的博弈游戏,无论是智力问答、国际象棋、跳棋或是围棋,都是所谓完美信息博弈。两个玩家可以获知博弈中所有的信息,所有的事情都摊开在眼前。

而有两件事使得德州扑克更难。一是决策树的大小,德州扑克中可能出现的情况是2的161次方,这个数字已经超过宇宙中原子的总数。当然在围棋比赛中,也有巨大的决策树。

640.webp (6).jpg

另外就是,德州扑克是一场不完美信息博弈。当一个玩家需要作出决定时,实际上并不知道整个博弈的全部信息。所以你必须根据对手的行动推测他们手上有什么牌,而对手也会根据同样的方式猜测你手上可能有什么牌。

因此,对于扑克这种游戏,人工智能需要一种完全不同的处理方法。而这也是Libratus的意义所在,即让人工智能学会如何处理不确定性。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐活动 上一条 /1 下一条

快速回复 返回顶部 返回列表