深蓝、沃森与AlphaGo
深蓝、沃森和AlphaGo都可以算是人工智能发展史上里程碑式的事件
深蓝是一个国际象棋程序,采用的是60年代就提出的α-β剪枝算法,IBM公司聘请了若干个国际象棋特级大师总结下棋的模式和知识,用于对局面的评估。最终于1997年战胜了连续10年国际象棋世界冠军卡斯帕罗夫。
沃森是IBM为了纪念公司成立100周年研发的一个问答系统,其名称是为了纪念IBM公司的创始人ThomasJ.Watson先生。2011年在美国最受欢迎的智力竞猜电视节目《危险边缘》中,沃森击败该节目历史上两位最成功的选手肯-詹宁斯和布拉德-鲁特,成为《危险边缘》节目新的王者。在沃森系统中,共采用了100多项与自然语言处理、知识问答相关的技术,利用《危险边缘》节目创始以来40多年的问题与答案进行训练,存储了大量图书、新闻和电影剧本资料、辞海、文选和《世界图书百科全书》等数百万份资料,在3秒内可以给出一个问题的答案。
AlphaGo在蒙特卡洛树搜索的框架下,利用深度学习和强化学习技术进行训练和评估,其中用到了人类棋手以往的16万盘棋谱,以及AlphaGo自己左右互搏产生的3000万盘棋谱,并用到了人类总结的几万个模式,综合运用这些技术,实现了高水平的围棋程序,并于2016年3月以4:1的成绩战胜了韩国围棋职业高手李世石。这些技术也并不是新技术,但是DeepMind公司有所创新,主要包括两个方面,一个是发展了强化学习技术,二是将传统的搜索技术与深度学习在围棋这个平台上,很好地结合在一起,实现了理性与感性的良好融合。这可能是AlphaGo成功的关键所在。
深蓝采用的α-β剪枝算法是专门用于双人博弈问题的算法,虽然也有人将该方法用于其他方面,比如故障诊断的测试点选择,但应用面是非常有限的,是一个非常专用的算法。也曾听有人介绍说IBM会把相关方法用于风险投资,但事后也没有听到相关消息。这也可能是IBM不再继续投入开展研究的原因吧?
AlphaGo则有很大的不同,深度学习是个通用方法,已经在很多领域得到很好的应用,强化学习也具有一定的通用性,并且DeepMind对其有所发展和创新,在围棋这个平台上可以继续开展研究,也可以推广到其他领域。但是围棋这类博弈游戏有一个特点,其最终的胜负可以自动判断,不需要人类标注,这就为系统自身的左右互搏、强化学习提供了很大的便利条件,如果在其他领域应用,需要定义合适的优化条件才可行。
在三个里程碑式的事件中,我认为最具通用性的是沃森,它采用了100多项与自然语言处理、知识问答相关的技术,这些技术可以在很多应用领域发挥作用,不仅仅是用于问答,IBM公司把相关技术称之为认知计算。IBM公司以此为契机,成立了沃森集团,专注于认知计算的研究和应用,已经在医疗健康领域取得了很好的成果。
因此,从通用性和商用性的角度来说,三个系统中排名第一的是沃森,其系统只要结合相关领域的数据,可以很快进行商用转化,提供服务;其次是AlphaGo,直接转换到其他领域,提供商用服务的可能性不大,但其技术可以应用于其他领域;排在最后的就是深蓝了,向其他领域转化的可能性很小。内容主要参考:http://weibo.com/p/23041873040b820102wrmb