首页>旗帜动态> 智库资讯 >孙茂松 :人工智能与未来语言教育

孙茂松 :人工智能与未来语言教育

  时间: 2021-09-24      508     分享:

在“第五届大学外语信息技术与课程教学深度融合学术论坛暨智能时代外语教育创新发展高峰论坛”上,清华大学孙茂松教授作了题为“人工智能与未来语言教育”的主旨报告。报告从人工智能的发展、人工智能的两面性,以及人工智能与语言教育等多个方面进行了阐释。

01 一路走来的人工智能

      人工智能的发展起始于机器翻译,从语言研究开始,经历了以下几个发展节点。信息论的先驱之一,科学家沃伦·韦弗(Warren Weaver)提出了用计算机来进行语言转化。韦弗在1947年同控制论之父维纳(N. Wiener)书信探讨了机器翻译的可能性;1949年,他写了Translation备忘录,也探讨了机器翻译,并给出了机器翻译的发展“路线图”;计算机科学和密码学的先驱阿兰·麦席森·图灵于1950年提出图灵测试 “Can machines think?”;1956年历时2个月的达特茅斯会议(Dartmouth Workshop)正式出现了“人工智能”这个术语,被看作是人工智能正式诞生的标志。

      随着人工智能的发展,目前与人工智能相关的图灵奖共72项,其中11项是和机器翻译有关。机器翻译,其难度在于高度复杂的语义空间,而且语义的判断也取决于常识和知识的储备,以下例子可以说明该问题。

      1962年,John A. Kouwenhoven在美国的Harper’s Magazine上发表了一篇题目为《翻译的困扰》的文章,讲到当时有人将《马太福音》中的英语成语:

The spirit is willing but the flesh is weak.

直译:精神是愿意的, 肉体却是虚弱的。

意译:心有余而力不足。

      经过机器翻译成俄文,再将其翻译回英语,得到了令人啼笑皆非的结果:

The Vodka is good but the meat is rotten.

直译:伏特加酒是好的,但肉却腐烂了。


      此外,还有一个示例可以说明该问题。1960年,以色列知名哲学家、数学家和语言学家Yehoshua Bar-Hillel发表了一篇长文证明机器翻译的难度,且说明机器翻译需要一定的知识和常识。如,“pen”至少有两个意思:“钢笔”和“围栏”。在Little John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy.中,基于常识,我们可以判断“pen”的意思应该为“围栏”;但在The pen was in the box.中,“pen”的意思为“钢笔。

       纵观机器翻译的发展,其发展趋势波折起伏。20世纪60年代,机器翻译的发展停滞,直至20世纪90年代起,机器翻译由于语料库的建立、大数据的应用、深度学习理论的应用及研究方法的创新,开始快速发展,且其翻译结果更加精准。以基于大数据和经验主义谷歌的神经网络翻译系统(GNMT)为例,可见机器翻译的可靠性。

输出中文译文:精神是愿意的,但肉体是软弱的

从中文译文再翻译成英文:

The spirit is willing, but the flesh is weak.

输出俄文译文:

Дух бодр, но плоть слаба.

从俄文译文再翻译成英文:

The spirit indeed is willing, but the flesh is weak.

输出苗语译文:

Tus ntsuj plig yog kam, tab sis lub cev nqaij daim tawv yog tsis muaj zog.

从苗语译文再翻译成英文:

The spirit is willing, but the flesh is weak.

      再观人工智能,其发展经历也是波折起伏的,当前的发展态势是数十年风云际会的结果。“大数据”、“强计算”和“好算法”三驾马车的集合,在促进人工智能快速高效发展的同时,也推进了各种应用的产生,如谷歌 MetNet(神经网络天气模型)和九歌等。



02 人工智能的另一面,需要冷静的思考

      人工智能是否无所不能,是否能够超越人类,是大家都比较关注也是比较担心的一个问题。但其实,人工智能远不能代替并超越人类。如果人工智能要超越人类,应具备的基本条件包括:边界清楚的单一任务,且该任务需要同时满足有限状态(即使状态再多)、确定的元规则、信息完备、结果判断量化且明确等条件。但是现实问题极其复杂,通常并非是单一任务,而是多任务的融合,且边界不清楚。人工智能并不能解决所有问题,如图像识别、语音识别、机器翻译、自动驾驶等都基本不具备上述条件,无法完成高端任务,只是基于大数据可以完成低端任务,起到协助作用,替代相对简单、重复性智力劳动;只有个别的场景人工智能可能会“超越”人类,但是这类场景往往涉及群体智慧,也是人类本来就做不好的事情,如商品图书推荐和智慧城市等。人工智能有这样的局限性,其原因就是人工智能背后涉及的深层神经网络即使功能再强大,本质上也只是一个针对单一任务的函数,由此会出现可解释性差、运用显式知识能力差,缺乏推理能力等问题。

      任何事物都有两面性,人工智能也是如此。由于人工智能的局限性,我们不用担心人工智能有一天超越人类或者代替人类,但是人工智能的技术确实很强大,可以协助人类解决很多问题,可以满足很多场景的应用需求,其发展前景也很宽阔。未来人工智能的发展,更需要通过引入知识驱动谋求新的突破。


03 人工智能与语言教育

      外语教育不是简单的语言学习。基于专业的语料库的建立和维护,机器翻译对于外语教育的发展起着协助作用。目前,人工智能在语言教育中的有效应用包括:智能语音测评(词汇学习)、分级阅读、拼写检查和语法改错及作文批改等。针对人工智能在语法改错等学习场景的应用,清华大学研发的“清华文达”(http://jiuge.thunlp.org/wenda/)可与Grammarly相比,能够给用户准确、可参考的反馈。可以说,人工智能在外语学习中发挥着一定的积极作用。此外,人工智能在外语MOOC的建设和线上教学的场景中有着用武之地,可以提供一定的数据分析,协助用户完成个性化学习。

      人工智能的发展,未来可期,而人工智能在各领域的成功,需要与各领域专家的研究进行合作,由此才可以发挥其积极的作用。


孙茂松,清华大学计算机科学与技术系系主任,教授,博士生导师,现任清华大学人工智能研究院常务副院长、清华大学计算机学位评定分委员会主席、教育部在线教育研究中心副主任、清华大学大规模在线开放教育研究中心主任。曾任清华大学计算机系主任、党委书记。