书籍详情

基于注疏文献的《孟子》信息处理研究

基于注疏文献的《孟子》信息处理研究

作者:梁社会

出版社:北京大学出版社

出版时间:2021-05-01

ISBN:9787301320983

定价:¥35.00

购买这本书可以去
内容简介
  《基于注疏文献的《孟子》信息处理研究》为作者主持的国家社会科学基金项目“基于注疏文献的先秦汉语语料信息处理研究”(项目批准号:15BYY096)阶段性成果。《基于注疏文献的《孟子》信息处理研究》主要以《孟子》及《孟子注疏》《孟子集注》《孟子正义》等《孟子》相关注疏文献为资源,对比《论语》《左传》等先秦文献的研究,对《孟子》进行了较深层次的加工和处理,尝试探索出一条基于注疏文献的《孟子》自动分词、词性标注等信息处理的新方法、新思路,研究了《孟子》及其注疏文献的句子对齐和词语对齐,《孟子》的自动分词、词性标注、词义消歧,《孟子》及其注疏的文本特征和语言风格统计,《孟子》中的排比句自动识别等问题。
作者简介
  梁社会,男,汉族,1979年出生,文学博士,副教授。现为南京师范大学国际文化教育学院副院长,硕士生导师。“青蓝工程”优秀青年骨干教师培养对象。中国政府奖学金预科教育指导委员会委员,南京市鼓楼区欧美同学会(留学人员联谊会)副会长。主要从事对外汉语教学和计算语言学研究。已在国内外中英文学术期刊发表CSSCI、CSCD、EI论文30余篇。近几年作为项目负责人主持国家社会科学基金项目1项,*人文社会科学研究项目1项,江苏教育厅哲学社会科学基金项目1项,江苏省高校自然科学项目2项,学校教育教学改革项目1项。
目录

目 录
引 言 1
一、《孟子》及其注疏信息处理研究现状 1
(一)传统的《孟子》及其注疏的研究 2
(二)句子对齐技术研究 3
(三)自动分词研究 4
(四)词性标注研究 6
(五)词义消歧研究 6
(六)风格计算研究 8
(七)修辞格的识别 9
(八)余论 9
二、研究思路和研究内容 10
(一)研究思路 10
(二)研究内容 11
三、本书的结构安排 11
章 注疏对齐 13
一、注疏结构和注疏文献的作用 14
(一)注疏结构 14
(二)注疏文献的作用 17
二、注疏文献的平行对齐 18
(一)原文与引文句子对齐 19
(二)原文与引文注释对齐 33
三、本章小结 41
第二章 自动分词 42
一、先秦汉语分词规范 43
二、基于规则的自动分词方法 49
(一)匹配法简介 49
(二)词表介绍 50
(三)实验结果 51
三、基于统计模型的自动分词方法 55
(一)条件随机场模型 55
(二)CRFs分词原理 55
(三)基于CRFs的分词实验 56
四、利用注疏文献的自动分词方法 60
(一)利用注疏文献自动分词方法概述 60
(二)利用注疏文献自动分词实验 61
五、本章小结 65
第三章 词性标注 66
一、词性标记集的构建 67
(一)名词作状语 67
(二)其他词类活用作动词 67
(三)使动用法 68
(四)意动用法 68
(五)为动用法 68
二、基于条件随机场模型的词性标注 69
(一)CRFs自动词性标注原理 70
(二)基于CRFs的词性标注实验 71
(三)标注错误分析 73
三、利用注疏信息自动校正词性 73
(一)注疏文献中的词性提示信息 73
(二)利用去声信息的词性自动校正方法 75
(三)实验和分析 78
四、本章小结 79
第四章 词义消歧 80
一、词义消歧的概念和难点 81
(一)词义消歧的概念 81
(二)词义消歧的难点 81
二、词义消歧树算法消歧 82
(一)义项的划分 82
(二)上下文的有效范围 83
(三)消歧方法的设计 85
三、CRFs模型词义消歧 89
(一)特征的选择提取 89
(二)特征模板的构造 91
四、实验结果与分析 92
(一)实验的语料 92
(二)实验环境与测评指标 92
(三)两种消歧算法比较 93
五、本章小结 95
第五章 风格计算 97
一、文本特征及语言风格分析 100
(一)基于字的文本特征及语言风格统计 100
(二)基于词的文本特征及语言风格统计 108
(三)基于句子的文本特征及语言风格统计 116
二、排比句的自动识别 118
(一)排比句自动识别的算法设计 118
(二)实验及结果分析 127
三、本章小结 134
结 语 136
一、本研究的主要工作 136
二、进一步的研究计划 138
附 录 141
附录A:注疏文献中抽取出的去声字表 141
附录B:注疏文献中抽取出的反切字表 149
附录C:人工标注的《孟子》排比句 157
附录D:人工标注的《论语》排比句 167
参考文献 172
后 记 186

猜您喜欢

读书导航