水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

柴孝伟

买进就值,越来越值,时享价...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


桂浩明

申万证券研究所首席分析师


宋清辉

著名经济学家宋清辉官方账号...


banner

banner

新纪元!人工智能的里程碑!100比0完爆阿法狗

大秦公子   / 2017-10-19 17:02 发布

今天被一则消息刷爆朋友圈:一篇发表于Nature的人工智能论文,引起轰动。英文题目是《Mastering the game of Go without human knowledge》,直译为《不使用人类知识掌握围棋》

这篇论文为何如此重要?它不仅是很多人期盼已久的技术报告,也是人工智能一个新的技术节点。在未来,它将得到很多引用,成为无数AI产业和服务的基础。

为什么这么受到广泛关注,原来这篇论文是谷歌专门从事深度学习研究的子公司DeepMind发布的,在文中宣布新一代Alpha Go正式诞生,被命名为AlphaGo Zero。


这款新版的AlphaGo有什么厉害的地方呢?去年阿法狗经过学习人类经验中的所有棋谱,然后4比1打败围棋世界冠军李世石,今年5月再度以3比0打败新冠军柯洁,而一度被业界津津乐道、叹为观止。

令人更加惊奇的是:如今的新版阿法狗,根本没有学习一点人类经验,从空白状态起,左右互搏、无师自通,三天后,居然100比0打败了老版阿法狗!


由于从事量化研究,公子今天来聊聊人工智能这个话题。


这款新版的AlphaGo翻译为阿法元(AlphaGo Zero),这个翻译挺好的,元者何?君之始年也。一元初始,这款阿法元就是人工智能的新纪元。


他完全从零开始,不需要任何历史棋谱的指引,不需要参考人类任何的先验知识,完全靠自己强化学习(reinforcement learning)然后成为一代宗师。

人工智能的目标在于一个能够具有挑战性的领域,以超越人类的算法实现超越人类的行为。


此前,阿法狗成为首个在围棋中战胜人类世界冠军的系统。他利用机器学习中的神经网络算法,使用人类专家下棋的数据进行监督学习训练,同时也通过自我对弈进行强化学习。


所谓监督学习就是利用一组已知类别的样本,通过反复训练,使其达到,能识别给定其他类别过程。举个不太恰当的例子,相当于一个幼儿园老师拿着两种或多种颜色的笔,让小朋友们反复记住该颜色,训练好后,拿出新的笔让小朋友判断出所属颜色。


阿法狗项目负责人说阿法元远比阿法狗强大,因为它不再被人类认知所局限,而能够发现新知识,发展新策略。


在基于强化学习的算法,阿发元不使用人类的数据、指导或规则以外的领域知识做为监督学习,他无师自通,只需知道规则,通过训练了一个神经网络来预测自己的落子选择,从而摆脱了对人类标注样本(人类历史棋局)的依赖,让深度学习用于复杂决策更加方便可行。


也这证明了人类经验由于样本空间(棋局经验)大小的限制,往往都收敛于局部最优而不自知(或无法发现),而机器学习可以突破这个限制!

我们人类的所有的知识都来自于后天的学习、经验或感知,但这也是人类的局限所在。


如果过份依赖过去的经验,比如曾经认为是错的,遍不敢去碰触,一朝被蛇咬十年怕井绳;而人工智能则没有这方面的负担,或许全局最优解或在其中。


比如曾经认为是对的,便会继续发展下去,想一招吃遍天、墨守成规。岂不知世间唯一不变的,就是变化本身。如果无视环境变化,就会陷入局部最优的陷阱中,也就是说在某个时间在某个地点来说是最优的结果,但按动态全局来看,则不是最优的选择。


阿法狗通过学习人类的棋谱经验,代表着人类可以找到局部最优解,而阿法元无师自通,摒弃人类经验,意味着可以找寻全局最优解。


那么,人类的经验是无用的吗?是无知的吗?是不是很恐怖呢!

愚蠢的人类,你对我的力量一无所知!颤抖吧!


如果未来阿法元能够自我制定规则,再通过自我学习,是不是没人类什么事了?

从科技发展的历史来看,每次在重点发现之后才觉得人类是多么无知啊!在牛顿经典力学体系的大厦没有造起来之前,整个西方世界都被亚里士多德的物理学统治着。当爱因斯坦最早提出他的广义相对论的时候,他彻底革新了我们原先对于时间与空间的概念理解。最近探测到引力波信号则证明爱因斯坦预测的准确性,一个崭新的引力波天文学时代开启,未来更多宇宙之谜等待揭开!


策略方面,会中没有多少操作性,继续保持与这几天都一致:以消费、上证50、白马等防守为主,注意控制仓位,少动为宜,见昨日《划重点



资金方面

融资余额上一交易日为9948亿,较上一日减小4亿



量化分析

赚钱效应:

今天涨停家数为34家,跌停家数达3家,涨跌停家数比为11,该数据低于近期平均数,注意控仓!

大盘多空趋势线指标

上证综指的趋势指标,量能继续减少,量能白线位于黄色均线处,濒临多空头临界处。注意控仓!

创业板的量能指标继续缩小,目前处于空头趋势,注意控仓

@水晶球财经网