水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

柴孝伟

买进就值,越来越值,时享价...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


桂浩明

申万证券研究所首席分析师


宋清辉

著名经济学家宋清辉官方账号...


banner

banner

机器学习笔记001 | 我对机器学习的理解

止一之路   / 2017-09-05 10:27 发布


1

随着AlphaGo在围棋上战胜李世石,战胜柯洁,人工智能的概念火遍全球。那么人工智能来源于何处呢?

人类的智慧来源于学习,机器的智能同样也需要从学习中获得。

什么是机器学习?

有人(Arthur Samuel)曾经把它描述为:

让计算机在没有明确编程的情况下,获得学习能力的领域

后面又有人(Tom Mitchell)提出了一个更加现代化的表述:

计算机程序从一系列以(P)为结果的任务(T)中得到经验(E),在大量经验(E)的累积下,最终表现的结果(P)得以改善。

其中:P为performance,T为task,E为experience。

例如,下围棋(T)有输有赢(P),AlphaGo通过大量地下围棋(T),得到了丰富的经验(E),最终赢了李世石(P)。

这一个过程就是机器学习。

目前机器学习存在几种不同类型的学习算法,主要的两种类型被称之为监督学习无监督学习

2

所谓的监督学习,其实就是我们明确知道正确输出结果应该是怎样的,或者对结果有一个基本的预期。

例如我们在下围棋之前,就知道什么样的情况是输,什么样的情况是赢。

而监督学习的问题又分为两种类型,分别是连续型问题(regression)离散型问题(classification)

例如我们有市场中一些房子真实的面积数据,想要通过一个房子的面积,来预测这个房子的价格,这其实就是连续型的问题。

例如我们有一些病人得到癌症的案例,想要通过一个肿瘤的大小,来判断癌症到底是恶性的还是良性的,这其实就是离散型问题。

所以,如果我们通过监督学习的方式,利用股票的历史数据,来预测股票的未来价格,其实就是要解决连续型问题;而利用股票的历史数据,来判断股价下一次是涨还是跌,就是要解决离散型问题。

3

那什么是无监督学习呢?

有些问题,我们可能不清楚明确的答案,甚至对结果也没有什么概念。

在这样的情况下,我们没有办法告诉机器对与不对,也就是说机器学习的预测结果不会得到反馈,这就是无监督学习。

有时候,我们希望通过无监督学习,从一片混乱的信息中得到结构性的特征。

例如我们有一系列人脸的数据,我们可能从中得到年龄、职业、阶层等不同类型的特征数据。

然后根据这些特征,我们就可以把具备相似结构的数据归类到一起。

例如搜索引擎里面,我们搜索石油泄露,可能会找到的相关的图片、新闻事件、危害性等等。

并且根据这些特征,我们也可以将不同结构的数据区分开来。

例如在一个鸡尾酒会上,人声和音乐声交杂,我们希望将这两种声音区分开来。

无监督学习如果应用到股票上,在我的理解中我们得到的,可能是股价的涨跌情况、公司盈利情况、公司的行业类型等等,然后我们可以利用这些不同的特征,区分开不同的情况公司,从而找到能够给我们带来超额收益的股票。

文章提前发布在**:止一之路