当前位置:首页 > 明升m88线上娱乐 > 新闻中心 > 讯飞动态 > 正文
明升m88线上娱乐

哈工大讯飞联合实验室荣登对话型阅读理解挑战赛CoQA榜首

发布时间:2018-12-14 来源: 点击次数: 打印 作者:

字号:

12月12日,哈工大讯飞联合实验室(HFL)由斯坦福大学发起的对话型机器阅读理解挑战赛CoQA(Conversational Question Answering Challenge)中获得冠军,这也是科大讯飞在2018年获得的第十二个世界冠军


在该挑战赛中,哈工大讯飞联合实验室凭借所研发的D-AoA + BERT模型,全面刷新所有评价指标,以总成绩80.2%位列该挑战赛的榜首,同时也是首个总成绩超过80%的系统,与人类在该数据上的平均水平差距进一步缩小。


值得一提的是,哈工大讯飞联合实验室本次提交的单模型效果显著优于榜单上已有的多模型融合结果,凸显了哈工大讯飞联合实验室在机器阅读理解技术上的国际领先水平。CoQA挑战赛于2018年8月正式启动,吸引了众多国内外知名研究机构和高校,其中包括微软、艾伦研究院(AI2)、北京邮电大学、复旦大学等。




CoQA挑战赛最新成绩榜单

(截止2018年12月12日)



CoQA挑战赛到底有多难?


与业界所熟知的机器阅读理解评测SQuAD一样,CoQA挑战赛同样由斯坦福大学发起,但侧重点与SQuAD评测不同。CoQA数据集中的问题不再是单轮的一问一答的形式,而是扩展到多轮的对话交互从示例中我们可以看出,问题Q2的解答需要依赖上一轮的问题Q1,使得问题理解的难度大大增加。


另外一个不同之处在于,CoQA数据的答案不再是完全来自于篇章中的某一个连续片段,其答案可以是Yes/No或其它一些没有出现在篇章中的内容,使得该数据集更加符合真实的应用场景。总的来说,CoQA挑战赛更加注重机器阅读理解技术在多轮对话中的应用,预示着机器阅读理解未来的研究方向,具有前瞻性、挑战性和实用性。



CoQA挑战赛数据示例


探索机器阅读理解的攻坚路上

讯飞一直在前行


哈工大讯飞联合实验室资深研究员、阅读理解组研究主管崔一鸣介绍:将机器阅读理解技术和人机对话任务进行结合是自然的。相比传统生硬的一问一答的形式,通过多轮人机对话完成阅读理解并获取所需要的信息更加符合真实的应用场景,也是未来机器阅读理解技术落地的一大方向。


这标志着科大讯飞的机器阅读理解能力不断在进化。从去年开始,科大讯飞就已经从探索技术无人区的角度出发,开始尝试在阅读理解与问题拒答领域进行技术拓展,不论是参与今年斯坦福大学的SQuAD2.0评测,还是在本次的CoQA挑战赛中夺冠,都进一步佐证了科大讯飞在自然语言处理等基础研究上的前瞻性。


至此,哈工大讯飞联合实验室在2018年已获得四次机器阅读理解领域世界冠军,其中包括:


1 . 2018年1月,机器阅读理解挑战赛SQuAD 1.1夺冠;

2 . 2018年2月,国际语义评测SemEval 2018阅读理解任务中夺冠;

3 . 2018年11月,机器阅读理解挑战赛SQuAD 2.0夺冠;

4 . 2018年12月,对话型机器阅读理解挑战赛CoQA夺冠。


当然,在科大讯飞看来,参加挑战赛不是根本目的,技术+应用才是硬道理。自然语言处理一直是实现人机交互、人工智能的重要技术基石,机器阅读理解正是这一领域的一个研究焦点;同样,让机器实现“能听会说”到“能理解会思考”,也一直是科大讯飞所肩负的使命和方向。


机器阅读理解技术拥有广阔的应用场景,例如在产品的精准问答、开放域的问答上都会起到有力的支撑作用,讯飞也在不断探索机器阅读理解技术的应用落地。


比如,基于此前研究的积累,目前科大讯飞已成功将机器阅读理解技术融合于车载智能交互系统中,通过让车机阅读汽车说明书和其他介绍材料,车载系统就可以深度理解并掌握车型的具体情况,从而在用户提出问题时,针对用户问题做到及时、精确的反馈,并对说明书等材料中未涉及内容直接拒答,从而提高用户获取信息的速度,在未来技术进一步提升后,甚至还可以直接根据厂商所提供的资料,针对用户的问题作出具体且准确的答复。


哈工大讯飞联合实验室



哈工大讯飞联合实验室(HFL)是科大讯飞针对“讯飞超脑”项目计划,重点引进和布局的核心研发团队之一,由科大讯飞AI研究院与哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)共同创办。


根据联合实验室建设规划,双方将在语言认知计算领域进行长期、深入合作,具体开展阅读理解、自动阅卷、类人答题、人机对话、语音识别后处理、社会舆情计算等前瞻课题的研究。重点突破深层语义理解、逻辑推理决策、自主学习进化等认知智能关键技术,支撑科大讯飞实现从“能听会说”到“能理解会思考”的技术跨越,并围绕教育、司法、人机交互等领域实现科研成果的规模化应用




关 闭