水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

柴孝伟

买进就值,越来越值,时享价...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


桂浩明

申万证券研究所首席分析师


宋清辉

著名经济学家宋清辉官方账号...


banner

banner

量化交易与机器学习第四十八篇

A股天机   / 2019-04-28 14:40 发布

上周我们讨论了机器学习的agent的顶底特点,本周我们讨论其它问题。

1,先说问题

常规的软件指标可以成为交易系统,但是无法取得进化效果,如上一篇所说,交易系统是需要进化的,因为本质上是人与人之间的博弈,别人在进化,交易系统也需要进化。

有一个经典的例子叫赌徒问题:一个赌徒利用硬币投掷的反正面结果来。假如投掷结果是硬币的正面朝上,那么他就赢得他所压的赌注,如果是反面朝上,那么他输掉他的赌注。当这个赌徒赢满100美元或者他输掉他所有的钱时,结束。每一轮投掷,赌徒必须取出他资金的一部分作为赌注,赌注金额必须是整数。这个问题可以表述为一个无折扣的、情节式的有穷马尔可夫决策过程。

状态就是赌徒所拥有的资金,,

动作就是下赌注,。

除了赌徒达到100美元的目标而奖赏为+1以外,其他奖赏均为0。

状态-值函数给出每个状态能够获胜的概率。

策略就是如何决定每轮取出多少钱去下注。最优策略就是使取得最后胜利的概率最大化。

令代表硬币正面朝上的概率。假如已知,那么整个问题也就知道了,并且可以得解,比如通过值迭代求解。

 2,关于实践

    这个问题很经典的原因是在某些方面和做交易的过程太像了。用数学方法来描述这个过程是

任意初始化V,比如:,对于所有

Repeat

                            For each

                                  

Until (一个极小的正数)

              输出一个确定的策略

图片_20190428143757.png

                          值状态          

图片_20190428143803.png                                                                                策略状态                                                                      3总结

 这个过程很难理解,因为涉及到很多的数学知识,特别是马尔科夫链和贝尔曼方程,这方面的知识不过多解释,只能自己去学习了。

作家格拉德威尔在《异类》一书中指出的定律。“人们眼中的天才之所以卓越非凡,并非天资超人一等,而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成世界级大师的必要条件。”他将此称为“一万小时定律”。一万小时定律的成功代表大画家达·芬奇,当初从师学艺就是从练习画一只只鸡蛋开始的。他日复一日,年复一年,变换着不同角度、不同光线,少说也得练习一万个小时,打下了扎实的基本功,从最简单一万小时定律提法来源于《异数》最枯燥的重复中掌握了达到最高深艺术境界的途径。这才有了后来的世界名画《蒙娜丽莎》、《最后的晚餐》。