书籍详情
基于语料库的意象和语义可视化研究
作者:丁国旗
出版社:中国社会科学出版社
出版时间:2019-10-01
ISBN:9787520351041
定价:¥86.00
购买这本书可以去
内容简介
《基于语料库的意象和语义可视化研究》以认知语言学提出的基于使用的语言模型为理论依据,以英汉原创与翻译散文语料库为基础,对比分析文学性语言中的意象和语义结构,并探索对分析结果进行可视化的方法。研究的创新性在于将语料库与数据可视化相结合,有效利用R、Python、D3.js等多种文本分析、统计计算、数据处理和呈现手段,展示了数字人文方法对英汉对比与翻译及语言历时研究的意义。数字人文是近年来在国外蓬勃发展的一个研究方向,然而在国内人文社科领域此类研究较少,专著形式的研究成果亦不多见。
作者简介
丁国旗,男,外国语言学及应用语言学博士,浙江农林大学暨阳学院副教授,主要从事认知语言学、语料库翻译学及数字人文等方面的研究。主持完成教育部和浙江省人文社会科学研究项目各一项,已出版学术专著一部,在《外国语》、《中国翻译》、《外语研究》、《外语与外语教学》等期刊发表论文多篇。
目录
章 引言
节 研究背景
第二节 研究内容与意义
第三节 本书的结构
第二章 语义研究中的语料库方法
节 语言使用和语料库
第二节 语言形式的本质
一 语言的象似性
二 语法即意象
第三节 语言的意义、可译性及语料库的应用
一 意义的体验性
二 意义的主观性
三 意义即是概念化
四 语义的百科性
五 意义的可译性
六 意义的语料库分析案例
七 小结
第三章 语料库创建及研究方法
节 语料库的创建与加工
一 语料库结构和选材
二 对齐
三 分词与赋码
四 语料库基本信息
第二节 研究方法与工具
―― WordSmith & AntConc
二 Notepad
三 PowerGREP
四 TextPro
五 ReNamer
六 R
七 Python
八 Gephi
九 D3.js
十 Photoshop
第三节 小结
第四章 频率、关键词、搭配、语义韵
节 频率
一 原始频率
二 词语过滤
第二节 关键词
一 参照词表
二 借助参照语料库或词表的关键词分析
三 TF―IDF
第三节 搭配
一 quanteda
二 tidytext
第四节 语义倾向和语义韵
一 语义韵的定义及研究现状
二 更广意义上的语义韵
三 情感分析与数据驱动的语义韵研究
四 中英翻译及原创散文语义韵分析
第五节 小结
第五章 英译中散文词类对比
节 相关研究
第二节 理论前提
一 刻画
二 名词与动词
第三节 材料与方法
第四节 数据与分析
一 词类分布及差异
二 词类相关性分析
三 中译动词的回归分析
第五节 讨论
第六节 小结
第六章 语义研究:词语关联
节 tidytext
第二节 词语关联
一 英文散文
二 中译散文
三 中文散文
第三节 翻译对等词
第四节 小结
第七章 语义研究:词语嵌入
节 word2vec词语嵌人原理
第二节 t-SNE
一 英文散文
二 中译散文
三 中文散文
第三节 语义网络
一 英文散文
二 中译散文
三 中文散文
第四节 小结
第八章 语义研究:主题分析1
节 主题建模及其研究现状
一 主题
二 主题建模的定义与简单原理
三 研究现状
第二节 材料、工具与步骤
一 语料库
二 主题建模工具
三 分析步骤
第三节 结果与讨论
第四节 小结
第九章 语义研究:主题分析2
节 研究现状
第二节 材料、工具与步骤
一 语料库
二 中文分词
三 主题建模工具
四 分析步骤
第三节 结果与讨论
一 tidytext语义相关性分析
二 Gensim神经网络分析
三 dfrtopics主题模型分析
第四节 小结
第十章 结语
节 本书的发现
第二节 本书的不足和对未来研究的建议
附录
附录1 斯坦福大学的分词和赋码工具使用方法及代码
附录2 借助参照语料库或词表的关键词分析和绘图代码(R)
附录3 文本中关键词的TF-IDF计算和绘图代码(R)
附录4 回归分析可视化代码(R)
附录5 获取翻译对等词的代码(R)
附录6 词嵌入模型训练代码(Python)
附录7 使用t―sNE降维和可视化代码(Python)
附录8 用于生成语义网络的代码(Python)
附录9 用于主题模型的代码(R)
参考文献
索引
节 研究背景
第二节 研究内容与意义
第三节 本书的结构
第二章 语义研究中的语料库方法
节 语言使用和语料库
第二节 语言形式的本质
一 语言的象似性
二 语法即意象
第三节 语言的意义、可译性及语料库的应用
一 意义的体验性
二 意义的主观性
三 意义即是概念化
四 语义的百科性
五 意义的可译性
六 意义的语料库分析案例
七 小结
第三章 语料库创建及研究方法
节 语料库的创建与加工
一 语料库结构和选材
二 对齐
三 分词与赋码
四 语料库基本信息
第二节 研究方法与工具
―― WordSmith & AntConc
二 Notepad
三 PowerGREP
四 TextPro
五 ReNamer
六 R
七 Python
八 Gephi
九 D3.js
十 Photoshop
第三节 小结
第四章 频率、关键词、搭配、语义韵
节 频率
一 原始频率
二 词语过滤
第二节 关键词
一 参照词表
二 借助参照语料库或词表的关键词分析
三 TF―IDF
第三节 搭配
一 quanteda
二 tidytext
第四节 语义倾向和语义韵
一 语义韵的定义及研究现状
二 更广意义上的语义韵
三 情感分析与数据驱动的语义韵研究
四 中英翻译及原创散文语义韵分析
第五节 小结
第五章 英译中散文词类对比
节 相关研究
第二节 理论前提
一 刻画
二 名词与动词
第三节 材料与方法
第四节 数据与分析
一 词类分布及差异
二 词类相关性分析
三 中译动词的回归分析
第五节 讨论
第六节 小结
第六章 语义研究:词语关联
节 tidytext
第二节 词语关联
一 英文散文
二 中译散文
三 中文散文
第三节 翻译对等词
第四节 小结
第七章 语义研究:词语嵌入
节 word2vec词语嵌人原理
第二节 t-SNE
一 英文散文
二 中译散文
三 中文散文
第三节 语义网络
一 英文散文
二 中译散文
三 中文散文
第四节 小结
第八章 语义研究:主题分析1
节 主题建模及其研究现状
一 主题
二 主题建模的定义与简单原理
三 研究现状
第二节 材料、工具与步骤
一 语料库
二 主题建模工具
三 分析步骤
第三节 结果与讨论
第四节 小结
第九章 语义研究:主题分析2
节 研究现状
第二节 材料、工具与步骤
一 语料库
二 中文分词
三 主题建模工具
四 分析步骤
第三节 结果与讨论
一 tidytext语义相关性分析
二 Gensim神经网络分析
三 dfrtopics主题模型分析
第四节 小结
第十章 结语
节 本书的发现
第二节 本书的不足和对未来研究的建议
附录
附录1 斯坦福大学的分词和赋码工具使用方法及代码
附录2 借助参照语料库或词表的关键词分析和绘图代码(R)
附录3 文本中关键词的TF-IDF计算和绘图代码(R)
附录4 回归分析可视化代码(R)
附录5 获取翻译对等词的代码(R)
附录6 词嵌入模型训练代码(Python)
附录7 使用t―sNE降维和可视化代码(Python)
附录8 用于生成语义网络的代码(Python)
附录9 用于主题模型的代码(R)
参考文献
索引
猜您喜欢