当前位置: 装修网 >> 行业资讯

阿尔法狗再进化拥有强化学习技术阿尔法狗棋

2018-08-16 16:11 来源: 浏览: 8条

阿尔法狗再进化拥有强化学习技术 阿尔法狗棋力有多强

北京时间10月19日,美国谷歌旗下的人工智能部门DeepMind推出了新版的的AlphaGo,也就是阿尔法狗软件,据说这软件可以完全依靠自己学习围棋。据悉,这新款软件名为AlphaGoZero 。它可以通过自我对弈来不断学习,因为它采用了一种名叫强化学习的技术,可以通过不断训练,使这套系统能够依靠自己的能力学会围棋当中的一些高级技巧。下面我们一起来看看阿尔法狗再进化的相关消息吧

!

北京时间10月19日,美国谷歌旗下的人工智能部门DeepMind推出了新版的的AlphaGo,也就是阿尔法狗软件,据说这软件可以完全依靠自己学习围棋。据悉,这新款软件名为AlphaGoZero 。它可以通过自我对弈来不断学习,因为它采用了一种名叫强化学习的技术,可以通过不断训练,使这套系统能够依靠自己的能力学会围棋当中的一些高级技巧。下面我们一起来看看阿尔法狗再进化的相关消息吧!

据了解,这套软件在经过3天的训练之后,阿尔法狗再进化,它已经能够击败原来的AlphaGo Lee,也就是去年击败韩国顶尖高手李世石的安涛软件,而且总比分为100比0。再经过40天的训练之后,这套软件总共完成了2900W次自我对弈,同时也击败了AlphaGo Master(今年击败我国世界冠军柯洁的软件)

,比分为89比11。

阿尔法狗再进化实力大大加强,也表明具体到不同技术的效果,人工智能在这块领域还有很大提升空间,AlphaGo Master也采用了许多与AlphaGo Zero相同的技术,但是它必须先采用人类的数据进行训练,然后才可以切换自我对弈模式

阿尔法狗再进化拥有强化学习技术阿尔法狗棋

。除此之外,虽然AlphaGo Zero通过几周训练就学会围棋的一些关键概念,但是它的学习方法与人类有所不同。

最后,据透露,AlphaGo Zero也相比前面几代更加节能,而AlphaGo Lee需要使用好几部机器和48个谷歌TPU。上一代的AlphaGo Fan则需使用176个GPU芯片,今天发布的AlphaGo Zero只需配4个TPU的机器就可以。所以,阿尔法狗再进化在全球引起了很大的轰动!