【科技】超越人类阅读能力，阿里巴巴、微软AI创纪录，抢攻客服导览工作

「这是机器第一次在测试中超越人类。」人工智慧（AI）不仅击败围棋世界冠军李世乭，如今又在「阅读理解」项目攻下一城。

阿里巴巴与微软的AI机器学习模型，参与被认为最具权威性的史丹佛大学阅读理解测验，在分析500多篇维基百科文章、通过题目库10万条问题的随机测验后，最后出炉的成绩都纷纷超越人类过去的纪录。

阿里巴巴AI阅读能力首度超越人类

由史丹佛大学研究人员所开发的史丹佛大学阅读理解测试（Stanford Question Answering Dataset，简称SQuAD），被业界认为是最具权威与公信力的机器阅读理解测验，包括Google、IBM、Facebook、卡内基美隆大学等企业机构都曾参与。

人类过去在SQuAD测验拿下最高的成绩是82.304分，这次中国阿里巴巴所开发的人工智慧（AI）机器学习模型，在回答完一份由10万条题目所组成的题目库问题后，以82.44分的分数首度超越人类，接着微软在相同的测验中以82.650分同样超越人类记录。

消化大量资讯、模拟人类阅读理解行为

SQuAD比赛由一个10万条问题组成的机器阅读理解题目库组成，这些题目以500篇维基百科文章为基础，主要用来测试机器是否能透过自然语言处理模仿人类对单字、句子的理解，在消化大量资讯后，精準地回答出问题。

AI在阅读完题目库中的一篇短文后，需要回答关于文章的几个问题。例如，让AI阅读影集《异世奇人》资料，然后问「博士的飞船叫什么名字？」；或是阅读成吉思汗的历史后，问「成吉思汗是哪年去世的？」

阿里巴巴研究团队提出的「基於分层融合注意力机制」的深度神经网络模型，是这项技术的重大突破，这款模型可以模拟人类在阅读理解时的行为，包括串联不同篇章的内容、带着问题反覆阅读文章、在阅读时标注避免遗忘资讯等。

客服、导览都派得上用场

阿里巴巴自然语言处理首席科学家司罗（Si Luo）表示，目前AI只能回答有明确答案的问题，如果问题表达的方式太模糊不清、不合语法、没有预先準备好资料，AI有可能无法正常运作。

不过测验结果还是相当振奋人心，「2018年有了一个强劲的开始。」SQuAD负责人Pranav Rajpurkar兴奋地在Twitter上这么写下。

透过AI阅读理解的精进，未来将可以帮助人类处理大量资料、更加準确回答问题，「像是『为什么会下雨？』这类客观的问题就可以透过机器高度精準的回答。」首席科学家司罗（Si Luo）说：「这项科技可以应用在客服、美术馆导览，甚至是回答病患的医疗问题。」

成为第一家在阅读理解测验分数超越人类的科技公司，阿里巴巴近年加入腾讯、百度等公司的行列，积极在AI领域求突破，希望能借助AI发展社群媒体、广告以及自动驾驶技术，中国也喊出要在2030年成为AI领域的领头羊。

本文获得数位时代授权转载

Tagged AI Alibaba 人工智能史丹佛微软百科文章科技阅读理解阿里巴巴