Share this...
Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn

「这是机器第一次在测试中超越人类。」人工智慧(AI)不仅击败围棋世界冠军李世乭,如今又在「阅读理解」项目攻下一城。

阿里巴巴与微软的AI机器学习模型,参与被认为最具权威性的史丹佛大学阅读理解测验,在分析500多篇维基百科文章、通过题目库10万条问题的随机测验后,最后出炉的成绩都纷纷超越人类过去的纪录。

阿里巴巴AI阅读能力首度超越人类

由史丹佛大学研究人员所开发的史丹佛大学阅读理解测试(Stanford Question Answering Dataset,简称SQuAD),被业界认为是最具权威与公信力的机器阅读理解测验,包括Google、IBM、Facebook、卡内基美隆大学等企业机构都曾参与。

人类过去在SQuAD测验拿下最高的成绩是82.304分,这次中国阿里巴巴所开发的人工智慧(AI)机器学习模型,在回答完一份由10万条题目所组成的题目库问题后,以82.44分的分数首度超越人类,接着微软在相同的测验中以82.650分同样超越人类记录。

阿里巴巴所开发的人工智慧(AI)机器学习模型,在阅读理解测试中,以82.44分的分数首度超越人类,微软也在相同的测验中以82.650分超越人类表现。图片来源:123RF

消化大量资讯、模拟人类阅读理解行为

SQuAD比赛由一个10万条问题组成的机器阅读理解题目库组成,这些题目以500篇维基百科文章为基础,主要用来测试机器是否能透过自然语言处理模仿人类对单字、句子的理解,在消化大量资讯后,精準地回答出问题。

AI在阅读完题目库中的一篇短文后,需要回答关于文章的几个问题。例如,让AI阅读影集《异世奇人》资料,然后问「博士的飞船叫什么名字?」;或是阅读成吉思汗的历史后,问「成吉思汗是哪年去世的?」

阿里巴巴研究团队提出的「基於分层融合注意力机制」的深度神经网络模型,是这项技术的重大突破,这款模型可以模拟人类在阅读理解时的行为,包括串联不同篇章的内容、带着问题反覆阅读文章、在阅读时标注避免遗忘资讯等。

客服、导览都派得上用场

阿里巴巴自然语言处理首席科学家司罗(Si Luo)表示,目前AI只能回答有明确答案的问题,如果问题表达的方式太模糊不清、不合语法、没有预先準备好资料,AI有可能无法正常运作。

不过测验结果还是相当振奋人心,「2018年有了一个强劲的开始。」SQuAD负责人Pranav Rajpurkar兴奋地在Twitter上这么写下。

AI阅读理解的精进,未来可以应用在客服、美术馆导览,甚至是回答病患的医疗问题。图片来源:shutterstock

透过AI阅读理解的精进,未来将可以帮助人类处理大量资料、更加準确回答问题,「像是『为什么会下雨?』这类客观的问题就可以透过机器高度精準的回答。」首席科学家司罗(Si Luo)说:「这项科技可以应用在客服、美术馆导览,甚至是回答病患的医疗问题。」

成为第一家在阅读理解测验分数超越人类的科技公司,阿里巴巴近年加入腾讯、百度等公司的行列,积极在AI领域求突破,希望能借助AI发展社群媒体、广告以及自动驾驶技术,中国也喊出要在2030年成为AI领域的领头羊。

本文获得数位时代授权转载

Share this...
Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn