书籍详情

科学知识图谱:工具、方法与应用

科学知识图谱:工具、方法与应用

作者:王大阜

出版社:人民邮电出版社

出版时间:2023-11-01

ISBN:9787115624420

定价:¥79.80

购买这本书可以去
内容简介
  本书旨在讲述科学知识图谱中常用的工具及其应用。本书首先介绍知识图谱基础知识,智慧图书馆领域中文献题录数据的采集和预处理操作,然后介绍文献计量分析工具CiteSpace、VOSviewer、HistCite、Bibliometrix与SATI的应用,以及多元统计分析工具SPSS和社会网络分析工具UCINET的应用,最后阐述LDA(Latent Dirichlet Allocation,隐狄利克雷分配)主题模型的应用。本书适合科研人员、科研管理者和科学知识图谱爱好者阅读。
作者简介
  王大阜,中国矿业大学图书馆工程师,从事校园网数据中心和信息化的建设与运维工作十余年,在运维、软件开发以及网络安全管理等方面具有丰富的实践经验,并从事过“网页开发”“C#程序设计”两门课程的教学工作。研究方向包括科学知识图谱、机器学习及网络安全,已发表论文数篇,主持一项江苏省高校哲学社会科学研究项目,参与研究一项江苏省高校哲学社会科学研究项目,参与研究一项国家社会科学基金项目。
目录

目 录




第 1章 科学知识图谱概述 1
1.1 知识图谱的概念 1
1.1.1 科学知识图谱 2
1.1.2 语义知识图谱 3
1.2 科学知识图谱的研究方法 6
1.3 科学知识图谱的研究意义 7
1.3.1 学科分析研究 7
1.3.2 科研合作网络分析 8
1.3.3 学科建设评估 9
1.4 科学知识图谱的绘制与解读流程 10
1.5 科学知识图谱工具 11
1.6 本章小结 12
第 2章 数据采集与预处理 13
2.1 数据库简介 13
2.1.1 三大数据库 13
2.1.2 OA数据库 14
2.1.3 其他数据库 15
2.2 数据采集 15
2.2.1 CNKI数据采集 16
2.2.2 CSSCI数据采集 20
2.2.3 WOS数据采集 22
2.3 数据预处理 24
2.3.1 WOS题录格式说明 25
2.3.2 数据预处理前期准备 27
2.3.3 数据预处理操作 28
2.3.4 数据转换存在的问题 30
2.3.5 工具演示说明 32
2.4 本章小结 33
第3章 文献计量分析工具的应用 34
3.1 文献计量分析理论方法 34
3.1.1 引文分析 34
3.1.2 共词分析 37
3.2 CiteSpace 38
3.2.1 CiteSpace简介 38
3.2.2 CiteSpace概念模型 38
3.2.3 下载与运行CiteSpace 39
3.2.4 设置参数 41
3.2.5 新建项目与可视化 45
3.2.6 共词网络可视化视图 47
3.2.7 科研合作网络图谱 56
3.2.8 共被引网络 59
3.2.9 保存图谱 63
3.3 VOSviewer 65
3.3.1 VOSviewer简介 65
3.3.2 下载与运行VOSviewer 66
3.3.3 知识单元合并及删除 67
3.3.4 创建图谱 67
3.3.5 可视化视图 74
3.3.6 中文文献可视化图谱 74
3.3.7 外文文献可视化图谱 91
3.3.8 保存图谱 97
3.4 HistCite 99
3.4.1 HistCite简介 99
3.4.2 下载与运行HistCite 99
3.4.3 HistCite界面 100
3.4.4 绘制引文时序图 102
3.5 Bibliometrix 104
3.5.1 Bibliometrix简介 104
3.5.2 下载与运行Bibliometrix 106
3.5.3 Bibliometrix的部分功能 108
3.6 SATI 112
3.6.1 SATI简介 112
3.6.2 SATI的部分功能 115
3.7 本章小结 117
第4章 多元统计分析工具SPSS的应用 119
4.1 多元统计分析理论方法 119
4.1.1 因子分析 119
4.1.2 聚类分析 120
4.1.3 多维尺度分析 121
4.1.4 战略坐标分析 122
4.2 BICOMB 123
4.2.1 BICOMB简介 123
4.2.2 下载与运行BICOMB 123
4.2.3 使用BICOMB 124
4.3 SPSS 130
4.3.1 SPSS简介 130
4.3.2 SPSS距离分析的应用 131
4.3.3 SPSS因子分析的应用 134
4.3.4 SPSS聚类分析的应用 140
4.3.5 SPSS多维尺度分析的应用 144
4.3.6 战略坐标分析的应用 146
4.4 本章小结 149
第5章 社会网络分析工具UCINET的应用 150
5.1 社会网络分析理论方法 150
5.1.1 中心度 151
5.1.2 凝聚子群 155
5.1.3 网络密度 156
5.2 UCINET 156
5.2.1 UCINET简介 156
5.2.2 数据输入/输出 157
5.2.3 层次聚类 158
5.2.4 中心度计算 160
5.2.5 共词网络可视化图谱 161
5.2.6 国内合作网络可视化图谱 164
5.2.7 保存图谱 169
5.3 本章小结 170
第6章 LDA主题模型的应用 171
6.1 NLP理论方法 171
6.1.1 语料库 171
6.1.2 分词 172
6.1.3 特征工程 173
6.1.4 文本表示方法 173
6.1.5 LDA主题模型 175
6.2 开源NLP工具包 176
6.3 Python集成开发环境 177
6.4 分词处理 179
6.4.1 分词工具 179
6.4.2 自定义词典 180
6.5 词袋模型示例 180
6.5.1 词频统计 180
6.5.2 TF-IDF统计 181
6.6 主题分析应用 182
6.6.1 数据准备 182
6.6.2 LDA主题模型的相关参数 182
6.6.3 程序代码 183
6.6.4 主题输出与可视化 184
6.6.5 热点主题解读 186
6.6.6 主题演化历程 187
6.7 本章小结 189

附录A 文献计量分析的常用术语 190
附录B 基本科学指标 191
附录C 知网题录数据格式转换代码 192
附录D CSSCI题录数据格式转换代码 194


猜您喜欢

读书导航