书籍详情

基于修辞结构树库的篇章衔接标记研究

基于修辞结构树库的篇章衔接标记研究

作者:乐明

出版社:世界图书出版公司

出版时间:2019-01-01

ISBN:9787519258788

定价:¥58.00

购买这本书可以去
内容简介
  《基于修辞结构树库的篇章衔接标记研究》定量考察汉语常见篇章衔接标记在书面话语中的连贯用法。首先根据修辞结构理论(Rhetorical Structure Theory,RST),设立了汉语修辞关系集以及关系优选协议,按标注流程开发出汉语财经评论修辞结构树库。接着为各类衔接标记在该篇章语料库中的分布和用法设立多个特征变量,展开形式、句法、语义和语用标注。随后利用树库和标注语料,对特定衔接标记展开深入的个案分析,探讨其篇章分布与语用连贯作用之间的相关性。最后尝试利用衔接标记及其所在篇章单元的形式特征,通过机器学习方法来自动判定所在篇章单元间的修辞连贯关系,测试结果较令人满意。本文最后也讨论了对人工标注质量的理解,以及数据挖掘技术在语言学研究中的应用前景。
作者简介
  乐明,浙江大学副教授、“求是青年学者”。曾师从冯志伟研究员,于2006年获中国传媒大学语言学及应用语言学博士,研究方向为计算语言学。2011年在美国新墨西哥大学语言学系访问,师从JoanBybee教授,研究方向为语法化理论。已发表多篇AHCI/CSSCI/SCI/SSCI语言学论文,负责完成国家社科基金青年项目一项及省部级项目两项。目前主要的研究方向是语言资源的开发和利用,重点关注关联词语和人称代词在各类自然语篇中的分布和功能,通过制定详细的工作手册和标注规范,指导篇章语料库的构建以及目标词语在,语料库中的多维度标注,在此基础上用进行量化的语言学本体研究。
目录
缩略语
第一章 篇章连贯研究概论
1.1 研究对象
1.2 研究背景
1.2.1 篇章连贯的理论研究
1.2.2 篇章剖析技术的发展
1.2.3 标注篇章语料库的开发
1.2.4 中文信息处理的相关研究
1.3 研究问题
1.4 研究方法及主要成果
1.5 本书结构
第二章 研究方法
2.1 语料库设计
2.2 语料标注
2.2.1 标注理据
2.2.2 标注原则
2.2.3 标注格式
2.2.4 标注手段
2.2.5 标注质量的控制和检验
2.3 统计分析和机器学习
2.3.1 描述性统计
2.3.2 推断性统计
2.3.3 机器学习
2.4 小结
第三章 构建汉语篇章修辞结构树库
3.1 修辞结构理论
3.1.1 内容简介
3.1.2 应用情况
3.1.3 主要争议
3.1.4 与汉语传统理论的比较
3.2 构建汉语篇章语料库
3.2.1 语料选择
3.2.2 语料预处理
3.3 汉语篇章基本单元切分
3.3.1 篇章基本单元的定义
3.3.2 切分的方法
3.3.3 自动切分的形式标记
3.3.4 自动切分的处理结果
3.4 汉语篇章修辞关系集的设定
3.4.1 基于特征的定义方法
3.4.2 汉语修辞关系集的简化分类
3.4.3 一些说明
3.5 修辞关系标注及篇章修辞结构树的构造
3.5.1 分号句层级及以上的修辞结构标注
3.5.2 逗号子句层级的修辞结构标注
3.6 工具和流程
3.7 质量控制和检验
3.8 小结
第四章 标注篇章衔接标记特征
4.1 标注对象
4.2 理论框架
4.2.1 连接词
4.2.2 指代词
4.2.3 语气词
4.2.4 标点符号
4.3 自动标注
4.4 人工标注
4.4.1 标注内容(通用部分)
4.4.2 软件工具
4.4.3 标注流程和质量控制
4.5 统计分析和参数选择
4.6 小结
第五章 数据分析
5.1 财经评论语料库篇章结构特点
5.1.1 修辞结构树特征
5.1.2 分号句层级上的RR概率分布
5.1.3 小结
5.2 但、但是
5.2.1 前人成果
5.2.2 标注方案
5.2.3 数据结果
5.2.4 讨论
5.2.5 小结
5.3 这、那
5.3.1 前人成果
5.3.2 标注方案
5.3.3 数据结果
5.3.4 讨论
5.3.5 小结
5.4 吗、?
5.4.1 前人成果
5.4.2 标注方案
5.4.3 数据结果
5.4.4 讨论
5.4.5 小结
第六章 应用测试——以“因为”为例
6.1 研究背景
6.2 任务分析
6.3 学习工具
6.4 数据处理、结果及讨论
6.5 小结
……
第七章 讨论
第八章 结语
第九章 附录
参考文献
索引
后记
猜您喜欢

读书导航