量化交易与机器学习第四十八篇

A股天机 / 2019-04-28 14:40 发布

上周我们讨论了机器学习的agent的顶底特点，本周我们讨论其它问题。

1，先说问题

常规的软件指标可以成为交易系统，但是无法取得进化效果，如上一篇所说，交易系统是需要进化的，因为本质上是人与人之间的博弈，别人在进化，交易系统也需要进化。

有一个经典的例子叫赌徒问题：一个赌徒利用硬币投掷的反正面结果来。假如投掷结果是硬币的正面朝上，那么他就赢得他所压的赌注，如果是反面朝上，那么他输掉他的赌注。当这个赌徒赢满100美元或者他输掉他所有的钱时，结束。每一轮投掷，赌徒必须取出他资金的一部分作为赌注，赌注金额必须是整数。这个问题可以表述为一个无折扣的、情节式的有穷马尔可夫决策过程。

状态就是赌徒所拥有的资金，，

动作就是下赌注，。

除了赌徒达到100美元的目标而奖赏为＋1以外，其他奖赏均为0。

状态－值函数给出每个状态能够获胜的概率。

策略就是如何决定每轮取出多少钱去下注。最优策略就是使取得最后胜利的概率最大化。

令代表硬币正面朝上的概率。假如已知，那么整个问题也就知道了，并且可以得解，比如通过值迭代求解。

2,关于实践

这个问题很经典的原因是在某些方面和做交易的过程太像了。用数学方法来描述这个过程是

任意初始化V，比如：，对于所有

Repeat

For each

Until （一个极小的正数）

输出一个确定的策略

图片_20190428143757.png

值状态

图片_20190428143803.png 策略状态 3总结

这个过程很难理解，因为涉及到很多的数学知识，特别是马尔科夫链和贝尔曼方程，这方面的知识不过多解释，只能自己去学习了。

作家格拉德威尔在《异类》一书中指出的定律。“人们眼中的天才之所以卓越非凡，并非天资超人一等，而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成世界级大师的必要条件。”他将此称为“一万小时定律”。一万小时定律的成功代表大画家达·芬奇，当初从师学艺就是从练习画一只只鸡蛋开始的。他日复一日，年复一年，变换着不同角度、不同光线，少说也得练习一万个小时，打下了扎实的基本功，从最简单一万小时定律提法来源于《异数》最枯燥的重复中掌握了达到最高深艺术境界的途径。这才有了后来的世界名画《蒙娜丽莎》、《最后的晚餐》。

赞(10) | 评论 2019-04-28 14:40 来自网站举报

取消发布

推荐关注更多

量化交易与机器学习第四十八篇