书籍详情

语言资源开发与应用

语言资源开发与应用

作者:亢世勇 等

出版社:外语教学与研究出版社

出版时间:2018-12-01

ISBN:9787521305975

定价:¥86.90

购买这本书可以去
内容简介
  语言是一个系统,具有层级性,音义结合的双面单位从低级单位到高级单位依次是语素(字)、词、短语、句子、篇章等。高一级单位是由低一级单位按照一定规则组合而成的,如果能够系统地总结出这些规则,就可以提高计算机语言信息处理智能化水平,加快中文信息化的发展,同时对于辞书编纂、语言教学也有积极的推动作用。这些规则实际涉及到语法的、语义的甚至语用的,而且还涉及到读音等。按照以上的认识,近些年我们进行了系统的现代汉语语言资源开发,从字(语素)到构词、到词义网、到新词语、句法语义多信息标注语料库,再到汉语拼音词汇数据库、方言有声资源库等,逐步构建现代汉语综合语言知识库。这样我们开发的大规模语言资源实际包括两大部分:(1)语言知识库,主要是针对语素(字)、词这两级语言单位的,包括《汉字义类信息库》、《汉语语义构词信息库》、《新词语电子词典》、《新编同义词词林》、《汉语拼音词汇数据库》、《方言数据库》等;(2)大型标注语料库,包括短语、句子级的,对真实文本标注词性、句法成分、语义角色、词义等信息的语料库,篇章级的文本蕴含信息库、中小学生语言偏误语料库等。语言知识库是辞书编纂需要的基础知识和资源,选词立目、注音、词性标注等都依靠这些知识。大型标注语料库可以使原始语言资源结构化、数据化,是计算机辞书自动生成的基础,至少也为辞书编纂中的选词、释义、词性标注、配例等提供便捷手段和丰富的资源,提高辞书编纂的速度与质量。
作者简介
暂缺《语言资源开发与应用》作者简介
目录
第一章 绪论
一、语言是一种资源
二、语言资源的内容与价值
三、语言资源的开发
四、语言资源的应用:语言产业
五、语言资源开发的实践
第二章 《汉字义类信息库》的建设及语义构词研究
第一节 研究思路
第二节 《汉字义类信息库>的研究与实现
第三节 基于数据库的现代汉语字、词义类分布统计比较研究
第四节 基于数据库的汉语语义构词法初探
第三章 汉语词汇数据库的开发与应用
第一节 《现代汉语新词语信息电子词典》的开发
第二节 新词语词典编纂的创新
第三节 《新编同义词词林》的开发与应用
第四章 词义标注语料库建设
第一节 绪论
第二节 影响多义动词词义标注的因素
第三节 多义动词词义标注的原则和方法
第四节 多义动词词义标注中的问题与思考
第五节 总结与展望
第五章 句法语义标注语料库建设
第一节 关于句法语义标注
第二节 句法语义标注的流程及原则
第三节 事件描述块的判断
第四节 句法信息的标注
第五节 语义角色的标注
第六节 标注中的其他问题
第六章 汉语文本蕴涵语料库的构建研究
第一节 绪论
第二节 面向自然语言处理的"文本蕴涵
第三节 汉语文本蕴涵库的构建与思考
第四节 文本蕴涵词汇层面类型及推理规则探讨
第五节 文本蕴涵语法层面类型及推理规则探讨
第六节 文本蕴涵语义和语用层面的推理规则探讨
第七节 后续可开展的研究工作
第七章 中小学语文教学语料库的建设与研究
第一节 中小学语文教学语料库建设
第二节 语言偏误语料库的建设及应用
第三节 中小学生语言偏误的类型
第四节 语言偏误与课文对比研究
参考文献
猜您喜欢

读书导航