数据素养:人工智能如何有据可依
作者:龚超,郑子杰,汪辉
出版社:化学工业出版社
出版时间:2023-09-01
ISBN:9787122434975
定价:¥69.80
第1章 数据概述 001
1.1 数字化社会与数据思维 002
1.1.1 数字的社会早已到来 002
1.1.2 人人都该提升数据素养 004
1.1.3 化无形为有形,化抽象为具体 006
1.2 数据的含义与类型划分 007
1.2.1 数据的狭义含义 007
1.2.2 数据的广义含义 009
1.2.3 数据类型的划分 010
1.3 人工智能与数据 011
1.3.1 新时代的金矿——数据 011
1.3.2 将数据转化为洞见 012
1.3.3 警惕选择偏见与数据偏见 013
第2章 随机世界中的数据规律 016
2.1 随机现象 017
2.1.1 生活中的随机现象 017
2.1.2 随机试验 019
2.2 随机变量与数据中的随机 024
2.2.1 随机变量及其分布 024
2.2.2 数据中的随机性 028
2.3 数据的形态与中心极限定理 030
2.3.1 正态分布 030
2.3.2 中心极限定理 033
第3章 数据收集与整理 036
3.1 如何获取数据 037
3.1.1 获取一手数据 037
3.1.2 获取二手数据 048
3.2 “二维”视角看数据 054
3.2.1 二维表 054
3.2.2 二维表的基本操作 059
3.3 如何清洗数据 063
3.3.1 数据的格式化与结构化 064
3.3.2 缺失值与异常值 066
第4章 数据的描述与可视化 070
4.1 数据的集中、离中趋势 071
4.1.1 数据的集中趋势 071
4.1.2 数据的离中趋势 075
4.2 数据的变换 077
4.2.1 数据的无量纲化 077
4.2.2 连续型变量的变换 080
4.2.3 类别特征的变换 083
4.3 数据的可视化 084
4.3.1 科学绘图 084
4.3.2 可视化的重要性 096
4.3.3 数据形态看数据 104
第5章 特征的构建与关联 112
5.1 特征的创建与选取 113
5.1.1 特征的创建 113
5.1.2 与时俱进选取指标 115
5.2 特征的扩充与降维分析 117
5.2.1 特征的扩充 117
5.2.2 降维分析 121
5.3 特征间的关系 126
5.3.1 相关≠因果 126
5.3.2 相关系数 128
5.3.3 从相关到回归 132
第6章 非结构化数据的结构化 141
6.1 用“二维表”的结构理解数据 142
6.2 图像即矩阵 145
6.2.1 用矩阵视角打开图像 145
6.2.2 图像特征的处理 150
6.3 文本的向量之路 156
6.3.1 文本的分词、清洗与整理 156
6.3.2 从句子到向量的词袋模型 167
6.3.3 Word2Vec让词语变向量 171
第7章 无数据,不课堂 176
7.1 数据与算法,打开另一扇窗 177
7.1.1 语文——水浒传 177
7.1.2 物理——伏安法测电阻 178
7.1.3 生物——鸢尾花分类 180
7.2 可视化,让内容更加图强 183
7.2.1 数学——二次函数性质分析 183
7.2.2 英语——I have a dream 185
7.2.3 化学——绘制元素周期表 186
7.2.4 历史——中国历史人口数据可视化 189
7.2.5 地理——卫星影像图 193
附录 196
附录一 抽样分布与参数估计 197
附录二 假设检验 208
附录三 腾讯扣叮Python实验室:Jupyter Lab使用说明 214