乌合之众的思考与博弈（26）：从科大讯飞造假事件看人工智能

都不是 / 2018-09-24 10:15 发布

最近的科大讯飞发生了所谓“人机耦合”同传造假事件，大家自然是议论纷纷，我自己对于科大讯飞方面的解释是认同又要嗤之以鼻，正好有几个朋友最近还聊到了这个话题，我就说说自己对于人工智能的看法。我自己现在不持有科大讯飞也没有将来持有的打算，也不是就为了说这么个玩意儿，只是从这说起勾起个话头比较容易带入。

科大讯飞认为，所谓“人机耦合”，可以降低同传工作者工作强度、赋能翻译人员，并在声明中特别强调：人机耦合才是未来。那“人机耦合”又是什么？根据科大讯飞董事长刘庆峰在去年一次演讲中的解释，应该是由机器帮助人类完成绝大部分工作，人类扮演辅助角色。

这要不就是一本正经的胡说八道，要不就是对人工智能的理解出现严重的偏差。

人工智能的定义是不确定的，这是因为人类对这个计算机科学分支的认识是随着相关学科的进步和人类活动的延伸不断更新的，就目前而言人们普遍认同的是这是一门综合的研究用于模拟、延伸和扩展人的智能的科学。

人工智能过去的发展是漫长而缓慢的，最早的版本也有很多，我比较倾向于艾伦图灵创造了这个构想，尽管AI这个词并不是他最早提出的。

1950年，他在一篇文章《计算机器与智能》中提出关于机器也能思考的可能性并构思了著名的“图灵测试”：首先由一个人提出一个问题，并把这个问题互不交流地传递给一个人和一台机器，然后根据他们的答案，判断哪个是人类。如果无法判断或判断错误就认为这个机器具有与人相当的智力也就是具有思维能力。

不得不承认天才的构想会创造一个时代甚至是未来，就此人工智能的魔盒被打开，麦卡锡、明斯基等同时代的科学家不断丰富完善这个构想。此后的几十年不同时代的天才们利用他们在各个相关学科的技术进步使人工智能发展成为一门综合交叉的未来学科。

在人们通常的理解中，人工智能已经取得了重大、长足的进步，但是从我自己的认识角度，我认为人工智能实际上只迈出了一小步。比如大家都认为阿尔法狗很厉害，围棋世界最强者也不能在他的手底下走过百合。但是我们忽略了一点，这些厉害怎么转化成生产力，更深一步的又怎么转化为其它方面的思维能力呢？实际上阿尔法狗是按照我们给它设定的规则来计算，算法是专款专用的，机器加速的是这个通过大数据进行专项学习的过程，而不可能突破这个边界，本质还是1+1。

所以我们目前这种人工智能是大数据+设定算法，你说它算什么呢？是人工智能也不是人工智能，也许算是半个人工智能的版本。

翻回头我们再说科大讯飞的语音识别技术。这项技术的根本也是大数据+设定算法，科大讯飞自己的说法大意是：在源头核心技术系统创新方面做的比较好，在世界上处于不落后的地位；在产品创新方面，虽然有一定进展，但是距离世界一流水平确实差距还比较大；在商业模式创新上，确实是短板。

这话大家不用细品就知道是怎么回事了。就技术创新而言，目前这个时代里投入是产出的前提，看华为的历史就知道了，这是规律，是任何人的臆想都不能替代的。而就科大讯飞的机制体制和技术发展投入与世界顶尖企业对比而言，想要它立于世界顶尖技术的位置显然是不可能的，事实就摆在那里，这和谁喜欢或者不喜欢这家企业没关系。那么科大讯飞的优势是什么呢？大数据！这一点从它的科研人员构成和数量就可以窥个大概。为什么很多用过科大讯飞产品的人觉得它翻译的还挺准确的呢？就是因为大数据，尤其是在语言环境复杂的中国，而不是基于算法。

这些都很容易查证，按照华为对三星和高通的打法，看科大讯飞相关领域的专利数与微软、Nuance等国际领军企业的对比就一目了然，而且科大讯飞的专利大部分都是不出国门的，这和华为是有本质区别的。

这不仅是科大讯飞的困境也是大多数中国正在从事与AI相关的企业的困境，甚至也是国际上AI企业的困境。这个困境就是在大数据+算法中，大数据才是根本，而算法方面实际上是没有实现突破的，几十年过去，我们依然停留在指令性算法层面，即使产生了一定的所谓自主性学习，那也是我们构想好的。这么说可能有点不好理解。比方说，你在女儿小的时候告诉她，你看邻居爷爷家养的那只柯基是小狗，下一次，她看到一只秋田，也会用小手指指说：“狗狗。”人类的这一能力和机器基于看过千万只狗的大数据存储过后的判断有着本质性区别。

现在懂了吗？我们目前的人工智能发展不仅没有取得绝对性进展，相反却遇到了严重瓶颈，因为我们遇到了人类自身暂时不能超越的认识局限。我们只能教给机器我们知道的而不能教给它我们自己还不知道的。

所以科大讯飞们的语音识别技术是不可能有超越同类性的，而且尤其是语音识别领域，大家殊途同归，最终BAT的语音产品绝不会比科大讯飞差多少，目前只是谁的前期大数据积累多而已，当然科大讯飞的产品只要有大数据投入也不会差，但也仅此而已。除非谁能找到超越目前认识论的理论，否则，中外的语音类产品只会在语言地域性上有差异，并不会有谁在算法上拥有傲视同类的资本。剩下的就是商业模式和产品推广了。

科大讯飞本次事件中使用了“人机耦合”这个自创词来解释自己的行为，其实造不造假已经不是最重要的了，重要的是科大讯飞道出了自己的处境，那就是在某些重要领域“臣妾做不到”，这才搞出了“人机耦合”这么个贻笑大方的词，这绝不是人工智能的方向，而只能代表目前科大讯飞的技术水准。

怎么理解呢？日常使用的话，科大讯飞挺准的啊，上面说过了，那是大数据的积累，而在专业领域这方面的数据积累是很难的，不仅需要数据还需要有各个方面专业背景的人士参与解读才行。在重要的场合，即使有99%以上的识别率，那漏掉的一个一定是个重要的语义。

不需要洗白，科大讯飞当然不敢自己宣称自己就是AI同传，但是也没有否认过，这就像见到孙科长喊“孙处”也不会被否认一样，你沾沾自喜地领了就是领了，现在又来否认其实没什么意思。

和语音交互有类似困境还有图像识别领域。很多人认为大华股份和海康威视也属于人工智能领域公司，将来会是人脸识别的领军企业。其实对此我是持怀疑态度的，道理是相同的，前期发展可能主要依赖大数据的专项学习，但是到了后期一定是算法占主导才可能走向人工智能，因为人脸识别的下一步是万物识别，而且是自主识别。所以这两家公司还只是软件加硬件公司，但绝不是AI公司。

至此，做个小结，我们会发现，我们所了解的人工智能是个很弱的人工智能，它只能做好我们教会它的任务，而且是具有指向性的任务。但即使这样，我们也觉得发展起来很吃力，目前它确实只能作为人类的助手来加速世界的进步。在我看来这还不是真正的人工智能，只能说是高级的电子工具。

那么人工智能的未来是什么样呢？通过图灵测试就是人工智能了吗？现在看来恐怕要远远超过艾伦图灵的构想，我们虽然还没有摸到门路，但是已经可以看到未来。

比如我们提出一个问题，而机器的回答超越了所有的大数据分析与积累，也就是说它的回答并不是我们千千万万个答案中的一个或者组合，而是完全脱离而又被认同是同类的回答，那么机器也许就真正有了类人的思维能力。

这就有另外的疑问产生，人与人工智能的界限在哪里呢？比如有一天我们有能力把自己的大脑思维或者神经元结构完整复制转移到人工智能上，那么我们是人还是人工智能？

当人工智能突破了人类指令束缚，有了自我意识之后，我们又应该如何看待它？

在某一个点上突破之后，人类在智力上将完败于人工智能，没人知道人工智能会将人类带向何处，甚至是否还会有纯的人类存在，因为与人工智能结合比如植入芯片或者脑神经网络接入机器或许是人类发展的一个必然阶段。

这些都不仅仅是科学问题、技术问题，也涉及人类伦理层面。

这些是异想天开吗？我认为并不是，从目前的科技发展轨迹看，这些必然会实现。

终有一天，人工智能会带领人类走出地球，走进宇宙，走出宇宙。

赞(67) | 评论 (17) 2018-09-24 10:15 来自网站举报

取消发布

推荐关注更多

乌合之众的思考与博弈（26）：从科大讯飞造假事件看人工智能