杂烩饭

好吧,这又是一个

十月 19th, 2017

自学高手AlphaGo Zero横空出世

AlphaGo Zero

  谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文,宣布一款新版的AlphaGo Zero计算机程序可以在不需要任何人类输入的条件下,迅速自学围棋,并以100比0的战绩击败上一代AlphaGo。这是AI历史上又一里程碑式的重大消息。

  2016年,谷歌旗下的DeepMind团队发布AlphaGo,并以4:1的战绩击败了世界围棋冠军、韩国棋手李世石,震撼世界。此后,AlphaGo又进化出了AlphaGo Master版本,并以3:0战胜了当今世界围棋第一人、中国棋手柯洁。

  闭关一年后,DeepMind推出了最新版本的AlphaGo Zero,它在没有任何人类指导的情况下,仅用3天时间自学和训练,就击败了此前的AlphaGo,比分是100比0。值得注意的是,之前的版本都参考学习了大量人类专业棋手的围棋经验,而新版的AlphaGo Zero则是自我对弈,即通过跟不同版本的自己下棋来学习。

  根据DeepMind团队发表在《Nature》上的论文,最新版的AlphaGo Zero最大的突破在于实现了“白板理论”。白板理论认为,婴儿是一块白板,可以通过后天学习和训练来提高智力。人工智能(AI)的先驱图灵认为,只要能用机器制造一个类似于小孩的AI,然后加以训练,就能得到一个近似成人智力,甚至超越人类智力的AI。而自学成才的AlphaGo Zero正是实现了这一理论。

  与学习大量人类棋谱起步的前代AlphaGo不同,AlphaGo Zero是从“婴儿般的白纸”开始,通过3天数百万盘自我对弈,走完了人类千年的围棋历史,并探索出了不少横空出世的招法。

AlphaGo Zero

  哈萨比斯等人专文:《AlphaGo Zero:从零开始》

  从语音识别、图像分类到基因和药物研究,人工智能发展迅速。这些专家系统,很多是借用海量人类经验和数据开发出来的。

  然而,在有些特定问题上,人类的知识要么过于昂贵,要么不靠谱,要么无法获得。因此,人工智能研究的一个长期目标就是跳过这一步,创造能在最有挑战性的领域,不用人类输入就达到超人水平的算法。我们发表在《自然》期刊上的最新论文,展示了实现该目标的关键一步。

  论文介绍了首个战胜人类围棋冠军的电脑程序AlphaGo的最新进化版本:AlphaGo Zero。AlphaGo Zero更为强大,可以一争史上最强围棋手。

  AlphaGo的前几代版本,一开始用上千盘人类业余和专业棋手的棋谱进行训练,学习如何下围棋。AlphaGo Zero则跳过了这个步骤,自我对弈学习下棋,完全从乱下开始。用这种方法,它很快超过了人类水平,对阵此前战胜人类冠军李世石的前代AlphaGo取得了100连胜。

  AlphaGo Zero之所以能当自己的老师,是用了一种叫强化学习的新模式。系统从一个对围棋一无所知的神经网络开始,将该神经网络和一个强力搜索算法结合,自我对弈。在对弈过程中,神经网络不断调整、升级,预测每一步落子和最终的胜利者。

  升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero,如此往复循环。每过一轮,系统的表现就提高了一点点,自我对弈的质量也提高了一点点。神经网络越来越准确,AlphaGo Zero的版本也越来越强。

  这种技术比此前所有版本的AlphaGo都更为强大。这是因为,它不再受到人类知识的限制,而能够从婴儿般的白纸状态,直接向世界上最强大的棋手——AlphaGo本身学起。

  AlphaGo Zero相较前代还有几点明显的差别:

  首先,AlphaGo Zero仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。

  其次,AlphaGo Zero仅用了单一的神经网络。在此前的版本中,AlphaGo用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。

  第三,AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本依靠的是其高质量的神经网络来评估下棋的局势。

  所有这些差异,都提高了系统的表现,使其更为普适。不过,是算法上的变化使得系统更为强大和高效。

  仅仅自我对弈3天后,AlphaGo Zero就以100:0完胜了此前击败世界冠军李世石的AlphaGo版本。自我对弈40天后,AlphaGo Zero变得更为强大,超过了此前击败当今第一人柯洁的“大师”版AlphaGo。

  通过数百万次自我对弈,AlphaGo从零开始掌握了围棋,在短短几天内就积累起了人类几千年才有的知识。AlphaGo Zero也发现了新的知识,发展出打破常规的策略和新招,与它在对战李世石和柯洁时创造的那些交相辉映,却又更胜一筹。

  这些创造性的时刻给了我们信心:人工智能会成为人类智慧的增强器,帮助我们解决人类正在面临的一些严峻挑战 。

  尽管才刚刚发展起来,AlphaGo Zero已经走出了通向上述目标的关键一步。如果类似的技术可以应用在其他结构性问题,比如蛋白质折叠、减少能耗和寻找新材料上,就能创造出有益于社会的突破。

评论《自学高手AlphaGo Zero横空出世》的内容…

相关文章:

微博:新浪微博 – 微信号:williamlong
Created by William Long www.williamlong.info
[……]Read more

支持亚马逊Alexa语音助手:MOTOROLA 摩托罗拉 推出 全新智能喇叭 Moto Mod 模块

近日,MOTOROLA(摩托罗拉)带来一款全新Moto Mod套件,专为Moto Z系列手机打造,是一款支持亚马逊Alexa语音助手的智能喇叭,拥有不错的音质,还集成了LED氛围灯,设计风格就像迷你E…[……]Read more

更智能,可控制冰箱电视:SAMSUNG 三星 发布 Bixby 2.0 语音助手

在今天的SAMSUNG(三星)开发者大会上,三星发布了第二代Bixby语音助手,相比半年前的第一代 Bixby 1.0语音助手有了不小进步。官方表示Bixby 2.0可支持所有智能设备,比如智能手机、…[……]Read more

香港要通高铁啦!

每次去香港都要排队、还要转车,感觉超级麻烦是不是!不过!最近小值听说香港要通高铁啦!这样就会变得超级方便!据悉,高铁工程已完成逾95%,已安排9列运抵的高铁列车,以时速200公里,在香港与内地段进行跨…[……]Read more

放开那只可怜的二哈 [动物图片]

这是不是各大洗头房抢生意呢[搞笑GIF]

放开那只可怜的二哈[动物图片]

↓相关图片推荐↓
好傲娇的小姑娘! 怎么下嘴呢? 什么,你家猫?我没见,我只是个袋子 一只优雅的汪星人

分类阅读:奇闻怪事 | 动物图片 | 儿童图片 | 搞笑交通 | 搞笑漫画 | 搞笑GIF | 投稿
[……]Read more

是谁乱扔垃圾的?吓我一跳~ [奇闻怪事]

这是不是各大洗头房抢生意呢[搞笑GIF]

是谁乱扔垃圾的?吓我一跳~[奇闻怪事]

↓相关图片推荐↓
高科技 你只是块肝,别这样看着我 怎么舍得逃课 确定这样玩儿不会出人命吗?

分类阅读:奇闻怪事 | 动物图片 | 儿童图片 | 搞笑交通 | 搞笑漫画 | 搞笑GIF | 投稿
[……]Read more

有个身材好能干的老婆真好 [搞笑GIF]

这是不是各大洗头房抢生意呢[搞笑GIF]

有个身材好能干的老婆真好[搞笑GIF]

↓相关图片推荐↓
不累吗 还好老子躲得快! 自古牛逼出少年 这技术着实的不一般啊!

分类阅读:奇闻怪事 | 动物图片 | 儿童图片 | 搞笑交通 | 搞笑漫画 | 搞笑GIF | 投稿
[……]Read more

建议 [搞笑漫画]

这是不是各大洗头房抢生意呢[搞笑GIF]

建议[搞笑漫画]

↓相关图片推荐↓
三选一,哪种最适合做女朋友 爱舔脚趾头的龌龊男福利来了 秒懂 别想了少年,轮不到你

分类阅读:奇闻怪事 | 动物图片 | 儿童图片 | 搞笑交通 | 搞笑漫画 | 搞笑GIF | 投稿
[……]Read more

Previous Posts