科研简报
人工智能浅析——教育与人工智能系列谈
作者:赵帅 发布时间:2018-07-06
摘要:

为帮助缺乏相关背景知识的读者更系统地了解人工智能,本文从发展历史、现代研究体系、与大数据的关系及专家观点分享几个部分对人工智能进行了介绍。

  人工智能是时下非常热门的话题。什么是人工智能?引用麻省理工学院帕特里克·温斯顿教授的定义,人工智能研究的是如何使计算机去做过去只有人才能做的智能工作[1]。为帮助缺乏相关背景知识的读者更系统地了解人工智能,本文从发展历史、现代研究体系、与大数据的关系、专家观点分享几个方面对人工智能进行介绍。

  一、人工智能发展历史

  人工智能并不是一个新的概念,它诞生于1956年在美国召开的达特茅斯会议。当时约翰·麦卡锡等学者对人工智能的界定是,让机器的行为看起来像人所表现出的智能行为。自诞生之日至今,人工智能的发展主要经历了三个阶段:

  第一阶段

  1956年至1974年是人工智能发展的第一个高峰期。在这段时间内,人工智能的成功应用主要是解决了一些代数应用题、证明了一些几何定理,使用的方法主要是基于搜索的方法。假设人工智能要解一道数学题,其解题思路大体如下:首先,它将解题过程划分为不同阶段,其中每个阶段都有多种可能的解法;接着,它会针对当前阶段内每种可能的解法进行尝试,直到找到正确的解法,然后向下一阶段前进。当完成所有阶段的运算后,人工智能即实现了成功解题。当时,由于人工智能的成功应用,一些学者说出了我们今天看来很熟悉的言论[2],如1965年著名学者赫伯特· 西蒙曾讲:“二十年内,机器将能完成人能做到的一切工作。”然而,后续事实证明此类预判是过于乐观的。

  1974年至1980年,人工智能经历了第一个发展低谷。此低谷出现的主要原因是,人们发现人工智能解决的是相对简单的问题,由于计算机运算能力等因素的限制,当面对复杂性更高的问题时,人工智能往往无能为力。

  第二阶段

  1980年至1987年是人工智能发展的第二个高峰期。在这段时间,人工智能的典型应用为专家系统。专家系统主要适用于人类专家短缺、相关知识不易获得的诊断、解释、预测等任务。此处以MYCIN系统为例大致介绍专家系统的工作机制。上世纪七、八十年代,血液传染病的诊断过程很复杂,高度依赖医生的临床经验,缺乏经验的医生很难进行有效诊断。鉴于此,斯坦福大学开发了应用于血液传染病诊断的专家系统MYCIN。该系统以规则集合的形式存放了大量医学专家长期以来积累的与血液传染病相关的知识。借助该系统,经验不足的医生也能有效诊断病人。使用MYCIN时,医生首先获取病人的具体信息,如心率、血压等,之后就这些信息与MYCIN的咨询子系统进行交流。基于病人的信息与自身存储的知识,MYCIN最终提供医生诊断结果及治疗方案。

  虽然专家系统取得了令人眼前一亮的进展,但好景不长,人工智能又经历了1987年至1993年间的第二个发展低谷。此次低谷出现的主要原因是,人们发现专家系统仅适用于特定的应用情景,并不适用于普遍性问题。再者,若使专家系统保持有效性,人们需要对其进行长期维护与知识库升级,这个过程往往伴随较高的经济成本。

  第三阶段

  1993年至今是人工智能发展的第三个高峰期。这波高峰出现的主要原因有两点:其一,根据摩尔定律,在价格不变的情况下,计算机的性能每隔18-24个月便会增加一倍。计算机日益强大的运算能力为人工智能的发展奠定了坚实的基础;其二,基于性能强大的计算机,数学领域的复杂模型[3]被用于构建深层智能,使人工智能领域的难题得到了更好的解决。这段时期内人工智能取得的一个标志性突破为:1997年IBM制造的超级计算机“深蓝”与国际象棋大师卡斯帕罗夫对弈时以2:1的总比分胜出。通过此例,人们认识到在某些竞技项目上,人工智能的表现比最杰出的人类选手还要出色。

  二、现代人工智能发展体系

  “深蓝”极具意义的一胜已是20年前。20年之后的今天,当我们再提及人工智能,耳熟能详的应用有很多,如自动驾驶、智能翻译、AlphaGo、人脸识别、深度学习……那么这些应用与人工智能间存在什么样的系统性关联?此部分从现代人工智能体系的角度回答这个问题。

  现代人工智能体系主要包含计算机视觉、自然语言处理、机器人学、机器学习、认知与推理、博弈与伦理六个活跃的研究子领域[4]。相比于其余子领域,认知与推理、博弈与伦理与实际应用的距离较远,本文仅以举例的形式略加说明。

  首先是认知与推理。仍以专家系统MYCIN为例,该系统结合病人信息及存储的知识生成诊断结果、治疗方案的过程,即为认知与推理的过程。其次是博弈与伦理。以前段时间火遍网络的“小型杀人机器人”[5]为例,此类利用人工智能技术进行精准打击的武器若用于正当目的固然很好,但万一落入恐怖分子之手后果则不堪设想,如何监管这类武器即为博弈与伦理领域学者关注的问题。

  下文分别对计算机视觉、自然语言处理、机器人学、机器学习的工作及应用进行简要介绍。

  计算机视觉

  计算机视觉领域的工作主要是从图像视角提取特征,用于描述物体外观,进而完成物体识别与分类。此处列举该领域的两个典型应用:一是苹果手机的人脸识别功能。在最新款的苹果手机Iphone X中,用户可在系统内预设自己的面部特征。当手机锁屏时,可通过摄像头扫描当前面孔并与系统预设面孔进行比对,若一致,则手机自动解锁。二是教育公司好未来推出的“魔镜系统”[6]。该系统通过实时扫描人脸,收集眉毛、嘴唇弯曲程度等数据,并结合算法判断人的情绪状态。利用该系统,一位老师即使在面对很多学生时,也能准确把握每位学生的学习情绪,并借此了解学生的学习状况,给予学生更个性化的指导。

  自然语言处理

  自然语言处理领域的研究可以细分为三部分:第一部分是自然语言理解。计算机不能直接处理人的语言,自然语言理解的主要工作是将人类语言转化为计算机易于处理的形式。第二部分是自然语言认知,此部分工作确保计算机在处理人的语言时,能“读懂”语言的意思,“明白”人类表述语言背后的意图。第三部分是自然语言生成。为实现计算机与人之间的互动,不仅需要计算机“懂”人的语言,而且也需要人懂计算机信息。自然语言生成的主要工作即是把计算机信息转化成人的语言。此处列举自然语言处理领域的两个应用:一是科大讯飞研发的“听见”系统[7]。该系统能实时地把人的话语转换成文字,并同时翻译为六种语言。对于打算出国旅游但又不懂外语的人来说,“听见”系统无疑是伴侣“神器”。二是腾讯公司研发的“腾讯同传”系统。该系统能以较高的可靠性提供同声传译服务,在2018年的亚洲博鳌论坛上已被正式使用[8]。

  机器人学

  机器人学注重视觉识别、语言交流、认知推理、机械控制等技术的综合研发,典型应用为索尼公司开发的aibo狗(图1)。从外观上看,aibo狗十分可爱,与真实的狗相似度很高。从功能上讲,aibo狗具备多项智能,比如,它能识别人的情绪。当人冲它微笑时,它会做出晃脑袋、摇尾巴等代表高兴情绪的动作。它也能识别人的部分行为模式,当人在它面前摊开双掌时,它会伸出两只前腿积极与人互动。

人工智能浅析——教育与人工智能系列谈

  图1 索尼公司开发的人工智能:aibo狗[9]

  机器学习

  机器学习领域的工作主要是让机器从输入数据中获得知识,进而自动帮人类完成解释、预测等任务。最近,机器学习中广受关注的对象为深度学习。深度学习并不是一个模型,而是一系列模型的总称,我们可以广义地将其理解为深度神经网络的集合。近两年深度学习在语音识别、图像处理等方向上的应用取得了很大成功。在深度学习的一系列模型中,卷积神经网络(Convolutional Neural Network,CNN)堪称“明星”级模型,图2为卷积神经网络的一个示例。

人工智能浅析——教育与人工智能系列谈

  图2 卷积神经网络示例[10]

  从构成结构的角度来讲,卷积神经网络分为输入层、隐藏层和输出层。隐藏层又细分为卷积层、池化层。讨论卷积神经网络更多的细节,若缺乏相关背景知识,可能一时不易理解,但提及图3所示的围棋人机大战,相信很多人都知道。有人会问,围棋人工智能AlphaGo大胜排名世界第一的人类棋手柯洁,靠的是什么?类比人类的大脑,是什么充当了AlphaGo的大脑?答案就是卷积神经网络。利用卷积神经网络,AlphaGo从大量人类棋手的历史对局中习得了下棋妙法,并获得了远强于人类棋手的棋势预判能力。

人工智能浅析——教育与人工智能系列谈

  图3 AlphaGo与柯洁的人机围棋大战[11]

  三、人工智能与大数据

  现今谈起人工智能,常被提起的一个词语是大数据。什么是大数据?目前并无清晰的定义,但对于大数据的特征是有共识的。一般被描述为4V特征:Volume(数量)、Velocity(速度)、Variety(种类)、value(价值)。简单来讲,大数据的数据量巨大、增长速度很快、存在的形式丰富、蕴含的价值很高。那么大数据与现代人工智能有什么关联?概括来讲,大数据是人工智能的基础。人工智能的“智能”,是利用机器学习算法从大数据中学来的。因此,想要使人工智能具备什么样的本领,就需要为它提供什么样的大数据。比如,若要让人工智能学会中英文翻译,就要为它提供中英文对应文本大数据;若要AlphaGo学会下围棋,就要为它提供围棋对局大数据。

  从畅想未来的角度讲,也许有一天人工智能不再需要人准备的大数据作为知识源,仅通过自身机制即可在应用场景中学习、进化,像AlphaGo的高阶版AlphaGo Zero一样,这样的人工智能无疑能为人提供更灵活、更有效的服务。目前来看,人类要实现这样通用的人工智能还有很长的路要走,AlphaGo Zero之所以能够成功,是因为围棋的场景是十分清晰明了的,比如,针对围棋建模时,模型的输入、输出能被清楚地定义,分别为棋盘的当前状态、下一步的落子位置。输入、输出清晰,模型即可基于大数据进行有效优化,进而获取“智能”。但在别的应用场景(如汽车自动驾驶)下,由于外部环境中需要考虑的因素太多,可以采取的行动种类也太多,建模时清晰地定义输入、输出是很困难的。

  四、人工智能专家观点分享

  自AlphaGo战胜人类围棋高手后,人们看到了人工智能的巨大潜力。因此,围绕着人工智能进行了广泛的讨论,其中有两种观点的热度较高:第一种是人工智能万能论,认为人工智能仿佛开启了上帝视角,无所不能。第二种是人类智能威胁论,认为人工智能会造成大范围失业,甚至有一天会取代人类。那么现代人工智能到底发展到什么程度了?是不是已经到了万能、威胁人类的地步?就此,本文分享两位人工智能领域前沿学者的看法。

  首先是机器学习领域权威、加州大学伯克利分校迈克尔·乔丹教授的观点[12]:

  1.“未来十年之内,人工智能的智能水平还非常有限。”

  2. “创造力对于人工智能系统来说还很难实现。现在所谓的智能,只能复制、模拟人类的行动,而不是真正的智能。”

  3.“人工智能代替一部分人的工作岗位是很正常的,但同时也有更多新岗位的出现。”

  其次是卡耐基梅隆大学计算机科学系邢波教授的观点[13]:

  1.“人工智能现阶段的功能主要用于视觉场景识别、自然语言处理与翻译等,但是一些深度的视觉学习是目前技术无法实现的。”

  2.“人工智能仍然处在‘中世纪阶段’,开发者仍在尝试不同的方法与研究。 人工智能的普及仍然有很长的路要走。”

  3.“在人工智能发展的初级阶段,人类过度的焦虑是没有必要的,新的工作将会应运而生,人类一定程度上不可被科技取代。”

  总结以上两位学者的观点,我们发现:第一,人工智能目前虽有亮眼应用,但整体仍处在初级阶段,能做的还很有限;第二,人工智能确实会造成一部分人失业,但抢人“饭碗”的同时,它也会带来新的工作机会,因此人们无须过度焦虑。

  以上,本文对人工智能的发展历史、现代研究体系等内容进行了介绍。未来人工智能将取得哪些突破?将带给人类什么样的惊喜?让我们拭目以待。


  [1] 张守刚、刘海波. 人工智能的认识论问题[M]. 人民出版社,1984.

  [2] 如创新工场CEO李开复在2017年曾说:“未来十年,大概人类50%的工作,都会被人工智能取代。”详见:http://www.sohu.com/a/191988148_467362.

  [3] 典型的数学模型为图模型和神经网络模型。

  [4] 关于现代人工智能的体系,不同学者有不同的解读形式,但各方给出的大体框架是基本一致的,本文引用的是加州大学洛杉矶分校计算机科学系教授朱松纯给出的描述,详见:朱松纯. 浅谈人工智能:现状、任务、构架与统一 | 正本清源[EB/OL].文章链接如下:https://mp.weixin.qq.com/s/-wSYLu-XvOrsST8_KEUa-Q.

  [5] 详见:https://www.bilibili.com/video/av16591423/.

  [6] 详见:http://www.sohu.com/a/197387802_508579.

  [7] 详见:http://new.qq.com/omn/20180209/20180209A13ASN.html.

  [8] 详见:http://www.10tiao.com/html/765/201804/2652948734/1.html.

  [9] 图片引自:http://tech.ifeng.com/a/20171104/44744783_0.shtml.

  [10] 图中的卷积神经网络正尝试识别左边图片中手写的字母是哪一个。图片引自:http://www.cnblogs.com/ilovebcz/p/4086013.html.

  [11] 图片引自:http://www.50cnnet.com/show-29-143150.html.

  [12] 详见王心馨.迈克尔·乔丹:人类暂时不必对人工智能感到焦虑,它智能有限[EB/OL].

  http://tech.163.com/17/1027/07/D1O6516E00097U7R.html.

  [13] 详见王兆迪.卡耐基梅隆教授邢波:没有必要对人工智能过度焦虑[EB/OL].

  http://finance.sina.com.cn/china/gncj/2018-04-07/doc-ifyvtmxc3945158.shtml.