书籍详情

交通时空大数据分析、挖掘与可视化(Python版)

交通时空大数据分析、挖掘与可视化(Python版)

作者:余庆,李玮峰

出版社:清华大学出版社

出版时间:2022-09-01

ISBN:9787302611967

定价:¥169.00

购买这本书可以去
内容简介
  大数据时代已经到来,随着数据的逐步开放,交通领域的研究课题或多或少都要接触、使用时空大数据。交通领域的从业者迫切需要强有力的工具和技术应对日益纷杂的交通数据。交通是一个交叉学科,交通数据分析人才的知识体系需要与数据处理、网络爬虫、数据可视化、地理信息、复杂网络、数据挖掘、机器学习等多学科知识深度融合,这也为交通领域的人才培养带来巨大挑战。 在此背景下,本书针对不同的学习阶段与业务需求设计了三篇共15章内容。基础篇(第1~5章)梳理Python数据分析、网络爬虫、数据可视化、地理信息等基础知识;应用篇(第6~10章)介绍出租车GPS数据、地铁IC刷卡数据、共享单车订单数据、公交GPS数据等各类时空大数据的实际案例应用;方法篇(第11~15章)融汇数据挖掘、空间统计、复杂网络学科等交叉学科方法,与交通领域的大量实际案例分析结合,全面梳理总结交通时空大数据所需跨学科技能。 本书由浅入深,学科交叉,强调实践。对读者不同的学习阶段与业务需求设计相应内容,全面梳理总结交通大数据科研所需技能,并与交通领域的大量实际案例分析结合。本书可作为教材也可作为参考工具书,基础篇定位交通数据领域新手入门,应用篇定位有数据分析需求的高校学生或社会人士,方法篇定位高校学术科研人员。
作者简介
  余庆(交通数据小旭学长)博士,南方科技大学斯发基斯可信自主系统研究院助理研究员,交通时空大数据开源Python库TransBigData作者。B站交通时空大数据相关视频课程总播放量超过80万。2022年博士毕业于同济大学交通运输工程专业,博士期间赴日本东京大学公派联合培养,主要研究方向为交通大数据分析、数据可视化、城市计算,发表SCI论文十余篇。自2020年起在B站上制作交通时空大数据相关课程,涵盖时空数据处理、数据可视化等。李玮峰同济大学交通运输工程学院助理研究员,博士。主要研究方向为交通规划、智能交通系统规划和交通大数据分析。参加国家重点研发计划项目1项、国家自然科学基金重点项目2项、面上项目2项,国家科技支撑计划项目2项,同时参加地方政府和科研院所的研究与咨询项目多项。发表期刊及会议论文50余篇,其中SCI收录16篇、EI收录20余篇;完成专著3本;获得发明专利4项,软件著作权3项。
目录
目 录
基 础 篇
第1章 绪论 ·····························2
1.1 多源交通时空大数据简介 ················2
1.1.1 传统集计统计数据 ·······························3
1.1.2 个体连续追踪数据 ·······························4
1.1.3 地理空间信息数据 ·······························5
1.2 为什么要用Python处理交通大数据 ·····6
1.2.1 常用数据处理技术 ·······························6
1.2.2 Python在交通大数据领域中的优势 ····8
1.2.3 Python与SQL的比较 ····························9
1.3 大规模数据处理的解决方案··············9
1.3.1 决定大数据处理性能的三个硬件
 要素 ·······················································9
1.3.2 分布式数据处理架构 ·························11
1.4 本章习题 ···································14
第2章 Python数据处理基础 ······15
2.1 Python的环境配置 ························15
2.1.1 Python的集成开发环境 ······················15
2.1.2 Anaconda的安装 ·································16
2.1.3 Jupyter Notebook的使用 ·····················16
2.1.4 Python第三方库的安装 ······················18
2.2 Python基本语法 ···························19
2.2.1 对象与变量 ·········································19
2.2.2 运算符 ·················································20
2.2.3 内置数据类型 ·····································20
2.2.4 语句 ·····················································24
2.2.5 函数 ·····················································26
2.2.6 包的使用 ·············································27
2.2.7 数据分析常用第三方库简介 ·············28
2.3 pandas数据处理基础 ·····················29
2.3.1 数据文件的编码格式与存储形式 ·····30
2.3.2 数据表的行列处理 ·····························33
2.3.3 数据的表格运算 ·································41
2.4 时空大数据的处理思维 ·················46
2.4.1 复杂数据处理任务的解决思路 ·········46
2.4.2 数据处理任务分解实例:地铁换乘量
 识别 ······················································49
2.5 数据处理中表格运算的常用技巧 ······51
2.5.1 分组编号 ·············································51
2.5.2 去除重复的记录 ·································53
2.5.3 个体ID重新编号 ·································54
2.5.4 生成数据之间的对应表 ·····················55
2.5.5 时空插值 ·············································58
2.6 本章习题 ···································60
2.6.1 思考题 ·················································60
2.6.2 Python基础代码练习 ··························60
2.6.3 pandas基础代码练习 ··························62
第3章 数据可视化基础 ············64
3.1 可视化的基本原则 ·······················64
 
猜您喜欢

读书导航