Log in to save to my catalogue

复述平行语料构建及其应用方法研究

复述平行语料构建及其应用方法研究

https://devfeature-collection.sl.nsw.gov.au/record/TN_cdi_wanfang_journals_bjdxxb202101010

复述平行语料构建及其应用方法研究

About this item

Full title

复述平行语料构建及其应用方法研究

Publisher

北京交通大学计算机与信息技术学院,北京 100044

Journal title

北京大学学报(自然科学版), 2021-01, Vol.57 (1), p.68-74

Language

Chinese

Formats

Publication information

Publisher

北京交通大学计算机与信息技术学院,北京 100044

More information

Scope and Contents

Contents

以汉语为研究对象,提出构建大规模高质量汉语复述平行语料的方法.基于翻译引擎进行复述数据增强,将英语复述平行语料迁移到汉语中,同时人工构建汉语复述评测数据集.基于构建的汉语复述数据,在复述识别和自然语言推理任务中验证复述数据构建及其应用方法的有效性.首先基于复述语料生成复述识别数据集,预训练基于注意力机制的神经网络句子匹配模型,训练模型捕获复述信息,然后将预训练的模型用于自然语言推理任务,改进其性能.在自然语言推理公开数据集上的评测结果表明,所构建的复述语料可有效地应用在复述识别任务中,模型可以学习复述知识.应用在自然语言推理任务中时,复述知识能有效地提升自然语言推理模型的精度,从而验证了复述知识对下游语义理解任务的有效性.所提出的复述语料构建方法不依赖语种,可为其他语言和领域提供更多的训练数...

Alternative Titles

Full title

复述平行语料构建及其应用方法研究

Authors, Artists and Contributors

Identifiers

Primary Identifiers

Record Identifier

TN_cdi_wanfang_journals_bjdxxb202101010

Permalink

https://devfeature-collection.sl.nsw.gov.au/record/TN_cdi_wanfang_journals_bjdxxb202101010

Other Identifiers

ISSN

0479-8023

DOI

10.13209/j.0479-8023.2020.078

How to access this item