书籍详情

《汉语主题词表》构建研究

《汉语主题词表》构建研究

作者:曾建勋,吴雯娜,常春,刘伟 著

出版社:科学技术文献出版社

出版时间:2020-09-01

ISBN:9787518969487

定价:¥48.00

购买这本书可以去
内容简介

  。《汉语主题词表》是我国第一部大型综合性叙词表,是专家与群众相结合,实行社会主义大协作的产物,是我国情报界与图书馆界于20世纪70年代协作的集体智慧结晶,并于1985年获得国家科学技术进步奖二等奖。 随着互联网技术的高速发展,大数据、云计算、机器智能对文本数据处理提出了更丰富的应用需求,对知识组织提出了更细粒度的计算关联要求,如进行切词、信息抽取、聚类、词频统计、情感分析等文本信息处理,在电子政务、电子商务的信息搜索中实现知识自动分类、智能推理和语义聚类,在各类知识管理中实现不同粒度的智能查询、领域监测、知识挖掘,在信息检索发现中实现分类导航和语义分面、英汉跨语言检索和辅助机器翻译等功能。这些都需要借助主题词表进行知识组织和文本处理,即《汉语主题词表》的应用将超越传统主题标引,跨出传统图书情报档案领域,融入整个文本信息处理和知识组织过程之中,应用于情报检索、搜索引擎、知识管理、电子政务、电子商务、数字出版、数据挖掘、知识计算等领域,发挥其更加广泛、更深层次和更有价值的作用,这就需要跨出图书情报视野,借助大数据、云计算和机器智能等新动能,放眼整个知识内容行业和文本信息处理领域,不断完善《汉语主题词表》的内在结构和外在功能,为《汉语主题词表》注入新鲜血液和活力,焕发数字环境下《汉语主题词表》的生命力。为此,中国科学技术信息研究所于2009年启动《汉语主题词表》在网络环境下的重构与修订工作,并分工程技术卷、自然科学卷、生物医学农业卷和社会科学卷依次展开修订。 为此,我们在中国科学技术信息研究所信息资源中心(国家工程技术图书馆)成立了《汉语主题词表》研究编制专项组。我们在剖析和正视传统《汉语主题词表》的内在问题和外在机遇之后,通过分析新时期知识组织和文本处理对《汉语主题词表》的需求,制定新型《汉语主题词表》编制的技术路线,编制新型《汉语主题词表》的重构和修订方案,收集与加工了包括文献关键词、用户检索词、各类百科全书、专业术语、相关专业及综合叙词表等在内的术语资源,建立收词量达400万条的基础词库;研究词汇概念的分类方法,构建概念与文献导航的范畴体系;结合认知计算和机器智能应用需要,制定《汉语主题词表》编制标准和规则,开发基于标准规则的叙词表协同编制管理平台;建立专业术语选词、专业概念归类与同义词归并、关系建立、范畴划分、逻辑关系验证、英文审定、增加参考注释等工作流程;采取先选词再分编最后融合、先选词再集成最后集中编制等多种方式,展开不同领域主题词表的编制工作。目前,《汉语主题词表(工程技术卷)》《汉语主题词表(自然科学卷)》已经修订完成并出版,正联合相关单位编制《汉语主题词表(生物医学农业卷)》。 网络环境下《汉语主题词表》的重构与修订是新时期全国图书情报界再次集体协作的典范项目,是网络在线编制叙词表的协同示范。《汉语主题词表》建设和应用具有深厚的理论基础,网络环境下《汉语主题词表》既可以运用于知识组织与知识关联,又可以支撑知识计算与知识服务,通过有机地嵌入各类信息系统,实现基于《汉语主题词表》的机器标注和语义关联,直接应用到主题标引、知识检索、自动聚类、热点追踪、知识链接、术语服务、科研关系网络构建等多个方面。我们一方面期待与业界同行继续推进《汉语主题词表》的基础建设和持续维护更新;另一方面期盼社会各界全面实施网络环境下《汉语主题词表》的应用及实践,不断推进知识资源的有序组织和知识服务的深层次发展,服务于信息精确检索和数据智能挖掘。
作者简介
暂缺《《汉语主题词表》构建研究》作者简介
目录

目录


第1章 《汉语主题词表》历史作用与现实挑战 1

1.1?我国主题词表发展概况 1

1.2  《汉语主题词表》发展历程 3

1.3  《汉语主题词表》研究现状 4

1.4  《汉语主题词表》面临的挑战与机遇 7

1.5?网络环境下主题词表的作用及发展趋势 9

第2章 《汉语主题词表》编制思路 12

2.1  《汉语主题词表》编制原则 13

2.2  《汉语主题词表》编制标准 15

2.3  《汉语主题词表》形态特征 16

2.4  《汉语主题词表》组成结构 20

2.5  《汉语主题词表》技术框架 22

2.6  《汉语主题词表》编制方案 23

第3章 《汉语主题词表》协同编制系统 30

3.1?协同编制的必要性 30

3.2?协同编制系统的构建 32

3.3?协同编制系统的运作机制 37

第4章 《汉语主题词表》基础词库 41

4.1?基础词库与《汉语主题词表》的关系 41

4.2?基础词库词汇词源获取途径 42

4.3?基础词库元数据框架 51

4.4?基础词库词汇的遴选 52

4.5?基础词库管理与更新机制 53

第5章 《汉语主题词表》范畴体系建设 55

5.1?范畴体系构建原则 55

5.2?范畴体系构建 56

5.3?范畴体系的映射 57

5.4?概念的范畴分类 59

第6章 《汉语主题词表》概念建设 62

6.1?概念的建设原则 62

6.2?概念的英文翻译 65

6.3?概念的词形控制 67

6.4?概念的词义控制 68

6.5?通用概念获取与识别 70

第7章 《汉语主题词表》概念关系构建 76

7.1?概念间语义关系的获取途径 76

7.2?概念间语义关系的发现方法 77

7.3?等级关系构建 82

7.4?等同关系构建 83

7.5?相关关系构建 86

7.6?概念间语义关系的合并 93

7.7?无关联概念处理 98

7.8?等级关系逻辑错误检查及处理 102

7.9?相关关系逻辑错误检查及处理 107

第8章 《汉语主题词表》服务与应用 112

8.1?主题词表服务现状 112

8.2?主题词表服务的基本架构 114

8.3  《汉语主题词表》功能定位 119

8.4  《汉语主题词表》服务系统 128

第9章 国家叙词库构建及展望 135

9.1?国家叙词库概述 135

9.2?国家叙词库的结构模式 136

9.3?国家叙词库的构建流程 140

9.4?国家叙词库的维护模式 143

9.5?国家叙词库的服务应用 144

参考文献 146

后 记 153


猜您喜欢

读书导航