书籍详情
Python数据分析之道(Thinking in Pandas)
作者:(美)汉娜 斯捷潘内克 著
出版社:水利水电出版社
出版时间:2021-08-01
ISBN:9787517097808
定价:¥48.00
购买这本书可以去
内容简介
本书通过以Pandas实现的精彩的数据分析项目,来讲解大数据相关的主题及概念。通过学习本书,读者可以根据项目的大小及类型来评估自己的项目是否适合使用Pandas库。本书对如何在Pandas中高效地加载及标准化数据进行了解读,并回顾了一些常用的加载器及它们的一些**威力的选项,从而读者可以学会如何高效地存取及转换数据、使用什么方法、什么时候采用或回避一些更高性能的技术。本书还将带读者用心思考Pandas中基本的数据访问及维护,以及直觉字典语法。本书适合作为Python数据分析学习者及相关从业人员的参考用书。
作者简介
Hannah Stepanek是一名对软件性能富有激情的软件开发人员,同时也是开源软件的积极倡导者。她拥有七年以上的Python编程行业经验,她花了两年左右的时间使用Pandas实现了一个数据分析项目。
目录
前言
第1章 概述
pandas简介
如何利用pandas构建一个黑洞图像
如何利用pandas帮助金融机构对未来市场
进行更准确预测
如何利用pandas提高内容可发现性
第2章 基本数据访问与合并
DataFrame的创建和访问
iloc方法
loc方法
使用merge方法合并DataFrame
使用join方法合并DataFrame
使用concat方法合并DataFrame
第3章 pandas在Hood下的工作机制
Python数据结构
CPython解释器、Python和NumPy的性能
pandas性能简介
选择正确的DataFrame
第4章 数据加载与规范化
pd.read_csv
pd.read_json
pd.read_sql, pd.read_sql_table, and
pd.read_sql_query
第5章 pandas基础数据转换
pivot和pivot表
stack和unstack
melt
转置transpose
第6章 apply方法
不适用apply方法的场合
适用apply方法的场合
利用Cythorl提高apply方法的性能
第7章 Groupby
正确使用groupby
索引
避免使用groupby
第8章 pandas之外的性能改进
计算机体系结构
如何利用NumExpr改进性能
BLAS和LAPACK
第9章 pandas的发展趋势
pandas 1.0
结论
第1章 概述
pandas简介
如何利用pandas构建一个黑洞图像
如何利用pandas帮助金融机构对未来市场
进行更准确预测
如何利用pandas提高内容可发现性
第2章 基本数据访问与合并
DataFrame的创建和访问
iloc方法
loc方法
使用merge方法合并DataFrame
使用join方法合并DataFrame
使用concat方法合并DataFrame
第3章 pandas在Hood下的工作机制
Python数据结构
CPython解释器、Python和NumPy的性能
pandas性能简介
选择正确的DataFrame
第4章 数据加载与规范化
pd.read_csv
pd.read_json
pd.read_sql, pd.read_sql_table, and
pd.read_sql_query
第5章 pandas基础数据转换
pivot和pivot表
stack和unstack
melt
转置transpose
第6章 apply方法
不适用apply方法的场合
适用apply方法的场合
利用Cythorl提高apply方法的性能
第7章 Groupby
正确使用groupby
索引
避免使用groupby
第8章 pandas之外的性能改进
计算机体系结构
如何利用NumExpr改进性能
BLAS和LAPACK
第9章 pandas的发展趋势
pandas 1.0
结论
猜您喜欢