书籍详情
语料库的制作与日语研究
作者:于康 著
出版社:浙江工商大学出版社
出版时间:2013-03-01
ISBN:9787811407068
定价:¥32.00
购买这本书可以去
内容简介
本书是方法工具与日语教学丛书之一。主要介绍如何利用免费软件来制作日语语料库和如何使用语料库。让每位读者拥有自己的语料库,以此进行各自的研究。内容主要包括语料的收集、PDF转换为文本文件的处理技巧、语料库的具体制作技术、语料库的使用、利用语料库研究日语的范例研究等。
作者简介
于康,笔名云丹加措。日本关西学院大学教授、博士生导师。主要致力于日语语言学、汉日语法对比、第二语言习得和日语学习中的误用等领域的研究。著书「日本語に於ける不定語の構文的機能に関する歴史的研究」(1999,渓水社)、《日语论文写作-方法与实践》(2008,高等教育出版社)、《现代日语语言学丛书语法学》(2012,高等教育出版社)等10部,论文“‘V下’的语义扩展与结果义”(2006,「中国語の補語」白帝社)、“从「入れる」和‘放’的对比看受事位移动词与致使义”(2008年,《北京大学日語学科成立60周年国際研討会論文集 日本語言文化研究》第8輯,学苑出版社)、「「目的語残存受身文」における目的語残存の条件について―中国語との対照という視点から―」(2012,「国文学攷」214)等82篇。
目录
卷首语
前言
第1章 语言资源的利用与语料库建设
1.1 制作语料库的目的
1.2 现在可供使用的主要语料库
1.3 制作自己的语料库
1.4 语料库的多元化用途
第2章 电脑配置、所需软件及软件的安装
2.1 电脑的配置
2.1 所需软件
2.2.1 Java
2.2.2 「秀丸」
2.2.3 「えだまめ」
2.2.4 「ひまわり」
2.3 软件的下载和安装
2.3.1 Java的下载和安装
2.3.2 「秀丸」的下载和安装
3.3.3 「えだまめ」的下载和安装
2.3.4 「ひまわり」的下载和安装
2.4 小结
第3章 收集与保存语料
3.1 收集语料时所需的设备和软件
3.1.1 扫描仪
3.1.1.1 单页扫描仪
3.1.1.2 连续扫描仪
3.1.2 Adobe®Acrobat®9 Standard(或X,或Pro,或以上的版本)
3.1.3 JUST PDF 2 [作成?高度編集?データ変換]
3.1.4 OCR软件
3.1.5 「秀丸」
3.2 建立保存语料用的文件夹
3.3 收集语料的具体操作方法
3.3.1 从网上直接下载和保存语料
3.3.1.1 如何下载电子版报纸的社论
3.3.1.2 如何下载「青空文庫」中的作品
3.3.1.3 如何下载「国会会議録」中的会议记录
3.3.2 从PDF文件中读取和保存语料
3.3.3 将纸版语料转换为电子语料的步骤
3.3.3.1 如何将纸版语料转换为PDF格式的文件
3.3.3.2 如何将PDF格式的文件转换为文本格式的文件
3.3.3.2.1 如何使用OCR将PDF格式的文件转换为文本格式的文件
3.3.3.2.2 如何使用PDF软件自带的OCR功能将文件转换为文本格式的文件
3.4 小结
第4章 清理语料
4.1 手动删除无需的信息
4.2 使用“规则命令句”删除注音假名 (ルビ)
4.3 使用“规则命令句”删除文中的各类不需要的符号
4.3.1 删除各种装饰性符号
4.3.2 删除多余的文字和符号信息
4.3.3 删除空格和空行
4.3.3.1 删除空格
4.3.3.2 删除空行
4.4 出错时的返工方法
4.5 小结 第5章 制作语料库
5.1 使用「えだまめ」转换文件的格式
5.2 使用全文检索软件「ひまわり」制作语料库
5.3 设定检索条件与检索例句
5.3.1 「検索文字列」
5.3.1.1 无条件检索
5.3.1.1.1 固定形式的无条件检索
5.3.1.1.2 可变形式的无条件检索
5.3.1.2 有条件检索
5.3.2 「フィルタ」
5.3.3 「コーパス」
5.3.4 「検索オプション」
5.3.4 例句栏上方的10个栏目标题
5.4 在全文中观察、保存和使用例句
5.4.1 在全文中观察例句
5.4.2 保存例句
5.4.2.1 保存其中的个别例句
5.4.2.2 保存检索的全部结果
5.4.3 展开和使用例句
5.4.3.1 使用「秀丸」展开例句
5.4.3.2 使用Word展开例句
5.4.3.3 使用Excel展开例句
5.5 小结 第6章 给例句加注标签与日语研究
6.1 制作标签的思路
6.2 标签的分类与所需软件
6.2.1 标签的分类
6.2.2 加注标签时所使用的软件
6.3 如何给日语例句加注标签
6.3.1 加注标签与日语「存在構文」的研究
6.3.2 加注标签
6.3.2.1 通过语料库收集「NPに(は)+NPが+V」的例句
6.3.2.2 清除垃圾例句
6.3.2.3 给例句加注标签
6.3.3 制作加注标签的语料库「日本語の存在構文コーパス」
6.3.4 检索和保存例句以及清除垃圾例句
6.3.5 对标签进行统计和分析
6.3.5.1 「非対格自動詞」存在句
6.3.5.2 「他動詞」存在句
6.3.5.3 「非能格自動詞」存在句
6.3.5.4 日语存在句成句规则的假设
6.4 小结 后记
参考文献
前言
第1章 语言资源的利用与语料库建设
1.1 制作语料库的目的
1.2 现在可供使用的主要语料库
1.3 制作自己的语料库
1.4 语料库的多元化用途
第2章 电脑配置、所需软件及软件的安装
2.1 电脑的配置
2.1 所需软件
2.2.1 Java
2.2.2 「秀丸」
2.2.3 「えだまめ」
2.2.4 「ひまわり」
2.3 软件的下载和安装
2.3.1 Java的下载和安装
2.3.2 「秀丸」的下载和安装
3.3.3 「えだまめ」的下载和安装
2.3.4 「ひまわり」的下载和安装
2.4 小结
第3章 收集与保存语料
3.1 收集语料时所需的设备和软件
3.1.1 扫描仪
3.1.1.1 单页扫描仪
3.1.1.2 连续扫描仪
3.1.2 Adobe®Acrobat®9 Standard(或X,或Pro,或以上的版本)
3.1.3 JUST PDF 2 [作成?高度編集?データ変換]
3.1.4 OCR软件
3.1.5 「秀丸」
3.2 建立保存语料用的文件夹
3.3 收集语料的具体操作方法
3.3.1 从网上直接下载和保存语料
3.3.1.1 如何下载电子版报纸的社论
3.3.1.2 如何下载「青空文庫」中的作品
3.3.1.3 如何下载「国会会議録」中的会议记录
3.3.2 从PDF文件中读取和保存语料
3.3.3 将纸版语料转换为电子语料的步骤
3.3.3.1 如何将纸版语料转换为PDF格式的文件
3.3.3.2 如何将PDF格式的文件转换为文本格式的文件
3.3.3.2.1 如何使用OCR将PDF格式的文件转换为文本格式的文件
3.3.3.2.2 如何使用PDF软件自带的OCR功能将文件转换为文本格式的文件
3.4 小结
第4章 清理语料
4.1 手动删除无需的信息
4.2 使用“规则命令句”删除注音假名 (ルビ)
4.3 使用“规则命令句”删除文中的各类不需要的符号
4.3.1 删除各种装饰性符号
4.3.2 删除多余的文字和符号信息
4.3.3 删除空格和空行
4.3.3.1 删除空格
4.3.3.2 删除空行
4.4 出错时的返工方法
4.5 小结 第5章 制作语料库
5.1 使用「えだまめ」转换文件的格式
5.2 使用全文检索软件「ひまわり」制作语料库
5.3 设定检索条件与检索例句
5.3.1 「検索文字列」
5.3.1.1 无条件检索
5.3.1.1.1 固定形式的无条件检索
5.3.1.1.2 可变形式的无条件检索
5.3.1.2 有条件检索
5.3.2 「フィルタ」
5.3.3 「コーパス」
5.3.4 「検索オプション」
5.3.4 例句栏上方的10个栏目标题
5.4 在全文中观察、保存和使用例句
5.4.1 在全文中观察例句
5.4.2 保存例句
5.4.2.1 保存其中的个别例句
5.4.2.2 保存检索的全部结果
5.4.3 展开和使用例句
5.4.3.1 使用「秀丸」展开例句
5.4.3.2 使用Word展开例句
5.4.3.3 使用Excel展开例句
5.5 小结 第6章 给例句加注标签与日语研究
6.1 制作标签的思路
6.2 标签的分类与所需软件
6.2.1 标签的分类
6.2.2 加注标签时所使用的软件
6.3 如何给日语例句加注标签
6.3.1 加注标签与日语「存在構文」的研究
6.3.2 加注标签
6.3.2.1 通过语料库收集「NPに(は)+NPが+V」的例句
6.3.2.2 清除垃圾例句
6.3.2.3 给例句加注标签
6.3.3 制作加注标签的语料库「日本語の存在構文コーパス」
6.3.4 检索和保存例句以及清除垃圾例句
6.3.5 对标签进行统计和分析
6.3.5.1 「非対格自動詞」存在句
6.3.5.2 「他動詞」存在句
6.3.5.3 「非能格自動詞」存在句
6.3.5.4 日语存在句成句规则的假设
6.4 小结 后记
参考文献
猜您喜欢