-
机器学习笔记001 | 我对机器学习的理解
止一之路 / 2017-09-05 10:27 发布
1
随着AlphaGo在围棋上战胜李世石,战胜柯洁,人工智能的概念火遍全球。那么人工智能来源于何处呢?
人类的智慧来源于学习,机器的智能同样也需要从学习中获得。
什么是机器学习?
有人(Arthur Samuel)曾经把它描述为:
让计算机在没有明确编程的情况下,获得学习能力的领域
后面又有人(Tom Mitchell)提出了一个更加现代化的表述:
计算机程序从一系列以(P)为结果的任务(T)中得到经验(E),在大量经验(E)的累积下,最终表现的结果(P)得以改善。
其中:P为performance,T为task,E为experience。
例如,下围棋(T)有输有赢(P),AlphaGo通过大量地下围棋(T),得到了丰富的经验(E),最终赢了李世石(P)。
这一个过程就是机器学习。
目前机器学习存在几种不同类型的学习算法,主要的两种类型被称之为监督学习和无监督学习。
2
所谓的监督学习,其实就是我们明确知道正确输出结果应该是怎样的,或者对结果有一个基本的预期。
例如我们在下围棋之前,就知道什么样的情况是输,什么样的情况是赢。
而监督学习的问题又分为两种类型,分别是连续型问题(regression)与离散型问题(classification)。
例如我们有市场中一些房子真实的面积数据,想要通过一个房子的面积,来预测这个房子的价格,这其实就是连续型的问题。
例如我们有一些病人得到癌症的案例,想要通过一个肿瘤的大小,来判断癌症到底是恶性的还是良性的,这其实就是离散型问题。
所以,如果我们通过监督学习的方式,利用股票的历史数据,来预测股票的未来价格,其实就是要解决连续型问题;而利用股票的历史数据,来判断股价下一次是涨还是跌,就是要解决离散型问题。
3
那什么是无监督学习呢?
有些问题,我们可能不清楚明确的答案,甚至对结果也没有什么概念。
在这样的情况下,我们没有办法告诉机器对与不对,也就是说机器学习的预测结果不会得到反馈,这就是无监督学习。
有时候,我们希望通过无监督学习,从一片混乱的信息中得到结构性的特征。
例如我们有一系列人脸的数据,我们可能从中得到年龄、职业、阶层等不同类型的特征数据。
然后根据这些特征,我们就可以把具备相似结构的数据归类到一起。
例如搜索引擎里面,我们搜索石油泄露,可能会找到的相关的图片、新闻事件、危害性等等。
并且根据这些特征,我们也可以将不同结构的数据区分开来。
例如在一个鸡尾酒会上,人声和音乐声交杂,我们希望将这两种声音区分开来。
无监督学习如果应用到股票上,在我的理解中我们得到的,可能是股价的涨跌情况、公司盈利情况、公司的行业类型等等,然后我们可以利用这些不同的特征,区分开不同的情况公司,从而找到能够给我们带来超额收益的股票。
文章提前发布在**:止一之路