书籍详情

数据素养:人工智能如何有据可依

数据素养:人工智能如何有据可依

作者:龚超,郑子杰,汪辉

出版社:化学工业出版社

出版时间:2023-09-01

ISBN:9787122434975

定价:¥69.80

购买这本书可以去
内容简介
  “人工智能超入门丛书”面向人工智能各技术方向零基础的读者,内容涉及数据思维、机器学习、视觉感知、情感分析、搜索算法、强化学习、知识图谱、专家系统等方向,辅以程序代码解决问题,帮助读者快速入门。 《数据素养:人工智能如何有据可依》是“人工智能超入门丛书”中的分册,主要讲解数据的重要性,重点解读处理数据的各种方法,培养读者的数据素养和数据思维。具体内容包括数据规律、数据收集、数据清洗、数据可视化,以及特征构建、图像处理、文本分析等,同时在本书最后一章,分析了各个学科中如何运用数据思维处理问题。 本书内容通俗易懂,可以作为人工智能及计算机相关工作岗位技术人员的入门读物,对数据及人工智能方向感兴趣的人群也可以阅读。
作者简介
  龚超,工学博士,清华大学日本研究中心主任助理,深圳清华大学研究院下一代互联网研发中心核心成员,海口经济学院雅和人居工程学院客座教授。中国高科技产业化研究会理事、中国自动化学会普及工作委员会委员、中国人工智能学会中小学工作委员会委员、教育信息化教学应用实践共同体项目特聘专家。研究方向为人工智能优化算法,人工智能在数字化转型中的应用等。著有10本人工智能相关图书,多家500强企业数字化转型领域高级顾问,在国内外期刊上发表文章共计60余篇。 郑子杰,北京大学学士、博士,信号与信息处理专业。北京市十一学校数学教师,人工智能课程负责人,帮助学校开发人工智能相关的课程体系。在学校期间与学校信息技术教师共同开发的人工智能普及课程 "人工智能技术与应用",在2021年4月被认定为北京市第一批普通高中特色课程。在各类学术期刊和会议上发表论文40余篇。 汪辉,磊垚创投管理合伙人,未来基因(北京)人工智能研究院特聘专家,上市公司独立董事,投资并服务数百家新三板/北交所企业。研究方向知识图谱技术、人工智能在知识产权保护中的应用等。
目录

第1章 数据概述 001
1.1 数字化社会与数据思维 002
1.1.1 数字的社会早已到来 002
1.1.2 人人都该提升数据素养 004
1.1.3 化无形为有形,化抽象为具体 006
1.2 数据的含义与类型划分 007
1.2.1 数据的狭义含义 007
1.2.2 数据的广义含义 009
1.2.3 数据类型的划分 010
1.3 人工智能与数据 011
1.3.1 新时代的金矿——数据 011
1.3.2 将数据转化为洞见 012
1.3.3 警惕选择偏见与数据偏见 013
第2章 随机世界中的数据规律 016
2.1 随机现象 017
2.1.1 生活中的随机现象 017
2.1.2 随机试验 019
2.2 随机变量与数据中的随机 024
2.2.1 随机变量及其分布 024
2.2.2 数据中的随机性 028
2.3 数据的形态与中心极限定理 030
2.3.1 正态分布 030
2.3.2 中心极限定理 033
第3章 数据收集与整理 036
3.1 如何获取数据 037
3.1.1 获取一手数据 037
3.1.2 获取二手数据 048
3.2 “二维”视角看数据 054
3.2.1 二维表 054
3.2.2 二维表的基本操作 059
3.3 如何清洗数据 063
3.3.1 数据的格式化与结构化 064
3.3.2 缺失值与异常值 066
第4章 数据的描述与可视化 070
4.1 数据的集中、离中趋势 071
4.1.1 数据的集中趋势 071
4.1.2 数据的离中趋势 075
4.2 数据的变换 077
4.2.1 数据的无量纲化 077
4.2.2 连续型变量的变换 080
4.2.3 类别特征的变换 083
4.3 数据的可视化 084
4.3.1 科学绘图 084
4.3.2 可视化的重要性 096
4.3.3 数据形态看数据 104
第5章 特征的构建与关联 112
5.1 特征的创建与选取 113
5.1.1 特征的创建 113
5.1.2 与时俱进选取指标 115
5.2 特征的扩充与降维分析 117
5.2.1 特征的扩充 117
5.2.2 降维分析 121
5.3 特征间的关系 126
5.3.1 相关≠因果 126
5.3.2 相关系数 128
5.3.3 从相关到回归 132
第6章 非结构化数据的结构化 141
6.1 用“二维表”的结构理解数据 142
6.2 图像即矩阵 145
6.2.1 用矩阵视角打开图像 145
6.2.2 图像特征的处理 150
6.3 文本的向量之路 156
6.3.1 文本的分词、清洗与整理 156
6.3.2 从句子到向量的词袋模型 167
6.3.3 Word2Vec让词语变向量 171
第7章 无数据,不课堂 176
7.1 数据与算法,打开另一扇窗 177
7.1.1 语文——水浒传 177
7.1.2 物理——伏安法测电阻 178
7.1.3 生物——鸢尾花分类 180
7.2 可视化,让内容更加图强 183
7.2.1 数学——二次函数性质分析 183
7.2.2 英语——I have a dream 185
7.2.3 化学——绘制元素周期表 186
7.2.4 历史——中国历史人口数据可视化 189
7.2.5 地理——卫星影像图 193
附录  196
附录一 抽样分布与参数估计 197
附录二 假设检验 208
附录三 腾讯扣叮Python实验室:Jupyter Lab使用说明 214

猜您喜欢

读书导航