书籍详情

Python文本数据分析与挖掘

Python文本数据分析与挖掘

作者:【日】山内长承 著,张倩南 刘博 译

出版社:中国青年出版社

出版时间:2021-04-01

ISBN:9787515362946

定价:¥79.80

购买这本书可以去
内容简介
  书中将自然语言处理技术和统计处理技术视为工具,不会涉及到其繁琐的原理、数学定理等。书中利用操作简便的Python程序包来处理文本数据,探索文本挖掘可以帮我们做到的事情,而非用尖端的技术进行程序设计。书中用简单明快的例子演示应用效果,并配有视频展示,下载资料包即可获取视频和案例二维码!本书通过5个章节介绍相关知识,第1章介绍文本挖掘的整体印象;在第2章中概括介绍了本书后面用到的Python的必要知识;第3章中介绍文本处理相关的基本概念和观点;第4章中利用Python学习作为基础处理的频率分析方法和其能得到的结果;*后,在第5章中介绍文本挖掘需要用到的各种具体方法以及在Python中的处理步骤。
作者简介
  1975年毕业于东京大学工学部电子工学专业。1977年完成工学专业课程硕士课程。1978年进入斯坦福大学电气工学专业,1984年退出博士课程,进入日本艾比·艾姆东京基础研究所工作。2000年加入到东邦大学理学部情报科学科,任东邦大学理学部情报科学科教授。
目录
前言
第1章 文本挖掘的概要
1.1 什么是文本挖掘
1.2 应用实例
第2章 Python概要和实验准备
2.1 什么是Python
2.2 编写、运行程序的环境
2.3 Python的语法规则
2.4 可用于文本挖掘的程序包
2.5 数据的准备
第3章 文本分割和数据分析的方法
3.1 文本的构成元素
3.2 统计分析、数据挖掘的基本方法
3.3 文本挖掘特有的方法
第4章 频率统计的实际应用
4.1 文字单位的出现频率分析
4.2 单词的出现频率分析
第5章 文本挖掘的各种处理示例
5.1 连续·N-gram的分析和利用
5.2 词的重要性和TF-IDF分析
5.3 基于KWIC的检索
5.4 基于单词属性的积极消极分析
5.5 基于WordNet的同义词检索
5.6 句法分析和关联分析的实际操作
5.7 语义分析和Word2Vec
附录 Python编程环境的简单安装
A.1 什么是开发环境
A.2 在Windows10上的安装
A.3 开始使用Jupyter Notebook
A.4 作业结果的保存和Jupyter Notebook的结束
猜您喜欢

读书导航