(单篇优先)网络出版时间:2017-06-01 19:17:27

篇章话题结构分析主要针对篇章的意图性,是篇章语义分析的基础,其主要任务是从整体层次上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章。篇章分析既需要研究篇章的基本构成单元,更需要研究基本构成单元之间的篇章关系。然而当前自然语言处理的研究重心大都集中在词法和句法领域,而忽略了篇章内在规律的研究,缺乏对篇章话题结构展开有效分析的系统理论方法,这就极大阻碍了基于篇章语义分析的相关应用。本文首先从篇章衔接性和连贯性两个基本特征入手,讨论了篇章话题结构分析的国内外研究现状,从理论体系探索、语料库构建和计算模型三方面展开详细综述,分析对比了各类理论、资源及其模型的特点。其中,理论部分代表性的工作包括语域加衔接理论,Hobbs模型,修辞结构理论,PDTB体系,意图结构理论,宏观结构理论等;资源部分主要工作有修辞结构篇章树库、宾州篇章树库、MUC语料、ACE评测语料、ARRAU、Onto Notes和篇章图库等;在计算模型方面,主要围绕上述理论和技术资源展开相关研究;随后,特别讨论了汉语篇章话题结构的最新研究进展。基于上述讨论,本文分析探索了基于主述位理论的篇章微观话题结构表示体系,并描述了相应语料库资源的构建及其一致性检验;篇章微观话题结构形式化表示为一个三元组,其主要特征是一种链式结构,链结点为篇章基本话题(子句),其内部的主位或述位为连接端,连接端之间通过微观话题联接建立起连接关系,其实质是一种语义关联,体现篇章之间的衔接关系。最后,本文还对篇章话题结构研究未来的发展方向进行了总结展望。

国家自然科学基金重点项目 跨语言社会舆情分析基础理论与关键技术(No. 61331011) 、国家自然科学基金面上项目 汉语篇章连贯性分析:话题结构、逻辑语义结构及其联合学习研究(No. 61472264)、苏州市科技发展计划(重点实验室SZS201609);

篇章话题结构; 篇章理论; 语料库标注; 计算模型; 篇章意图性; 篇章语义分析;

TP391

计算机学报

Chinese Journal of Computers

ISSN:0254-4164

中文核心期刊

421261479K
在线咨询 用户反馈