数据库
-
OpenShift开发指南[美]约书亚·伍德,[美]布赖恩·坦努斯 著本书解释了什么是OpenShift以及如何使用它来构建应用程序、运行它们,并使它们能够在面对各种复杂情况时保持运行。本书的内容包括:OpenShift及其组件和基本概念;如何运行OpenShift;如何配置OpenShift;OpenShift流水线;如何通过手动和自动的方式检查、操作和扩展正在运行的应用程序,如何设置OpenShift以定期检查应用程序的健康状况,以及如何管理应用程序的新版本发布;OpenShift的监控和告警功能;OpenShift的自动化特性。
-
预测性分析杜尔森·德伦(Dursun Delen)本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究—包括从失败项目获得的经验教训。本书理论和实践内容相对平衡,便于读者加深理解。全书共9章,外加一个附录。第1章为分析导论,第2章为预测性分析和数据挖掘导论,第3章介绍预测性分析的标准流程,第4章介绍预测性分析的数据和方法,第5章介绍预测性分析算法,第6章探讨预测性建模中的高阶主题,第7章介绍文本分析、主题建模和情感分析,第8章介绍预测性分析使用的大数据,第9章介绍深度学习和认知计算,附录展望了商业分析和数据科学工具的前景。本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。
-
实战大数据 分布式大数据分析处理系统开发与应用井超 杨俊 乔钢柱实战大数据——分布式大数据分析处理系统开发与应用,从大数据技术基础概念出发,介绍了大数据分析的流程和大数据分析处理系统的组成,以及大数据集群的搭建,并在此基础上讲解了多种不同技术构成的离线/实时数据分析系统实战项目。全书共10章,包括大数据概述、大数据分析的基本流程与工具、分布式大数据分析处理系统概述、构建大数据集群环境、构建基于LayUI的集群管理系统、基于HBase的大数据离线分析系统、基于Hive+Hadoop+Spark的大数据离线分析系统、基于MySQL+Spark的大数据离线分析系统、基于Redis+Kafka+Spark的大数据实时分析系统、基于Flume+Kafka+Flink的大数据实时分析系统。实战大数据—— 分布式大数据分析处理系统开发与应用,适合从事大数据系统搭建与运维、大数据分析等岗位的技术人员阅读,也适合高等院校大数据相关专业的学生使用。
-
Pandas数据分析快速上手500招罗帅、罗斌本书采用“问题描述+解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多种条件筛选数据;统计NaN(缺失值)的数量、占比,根据规则填充和删除NaN;在DataFrame中增、删、查、改行列数据,计算各种行差、列差、极差以及直接对两个DataFrame进行加、减、乘、除运算和比较差异;将宽表和长表相互转换,创建交叉表和各种透视表;对数据分组结果进行求和、累加、求平均值、求极差、求占比、排序、筛选、重采样等多种形式的分析,将分组数据导出为Excel文件。本书还附赠36个数据可视化案例,如根据指定的条件设置行列数据的颜色和样式,根据行列数据绘制条形图、柱形图、饼图、折线图、散点图、六边形图、箱形图、面积图等。本书适于作为数据分析师、物流分析师、金融分析师、数据产品开发人员、人工智能开发人员、市场营销人员、办公管理人员、Python程序员等各行各业人员的案头参考书,无论对于初学者还是专业人士,本书都极具参考和收藏价值。
-
医疗大数据分析与应用平装-胶订医疗大数据是大数据在医疗领域的一个分支,处理的是在与人类健康相关的活动中产生的与生命健康和医疗有关的数据。本书将对医疗大数据进行全面、透彻的分析,从医疗大数据的现状开始,介绍医疗大数据方向的统计、数据挖掘、数据预处理、建模以及可视化等技术与应用。此外,还介绍了医疗领域的图像处理和自然语言处理等人工智能技术。在本书的末尾,还讨论了这个领域普遍关注的一个问题——医疗数据隐私保护,介绍了潜在的隐私风险和隐私保护方法等,并关注了医疗经济的概况与前景。通过阅读本书,你将了解:医疗大数据的现状及产业划分等;如何统计挖掘和处理医疗领域的数据以方便分析;医学数据可视化如何提升医疗人员诊断病情的效率;人工智能技术在医疗领域的应用;如何对医疗数据进行隐私保护。
-
规范性分析平装-胶订本书介绍规范性分析以及如何使用规范性分析进行决策,理论部分和实践部分相对平衡,展示了直观的概念插图、现实的示例问题和案例研究。全书共6章。第1章概述商业分析及分析的纵向视图和简单分类,并介绍规范性分析所处的位置。第2章介绍优化。第3章解释蒙特卡罗模拟、离散模拟和连续模拟等强大的决策工具。第4章介绍多准则决策及其简单分类。第5章介绍专家系统和基于案例的推理。第6章介绍大数据、深度学习和认知计算等前沿分析技术。本书适合商业分析专业人员与相关专业本科生和研究生阅读。
-
薛定宇教授大讲堂薛定宇本书按照一般微积分学教程的方式介绍微积分问题的求解,首先介绍函数与序列的描述与图形绘制,然后介绍极限问题的求解、导数与微分问题的求解以及积分问题的求解,并介绍函数的逼近与级数求和等方面的内容,还介绍数值导数与数值积分方面的内容,并给出积分变换、分数阶微积分等的入门介绍。本书可作为一般读者学习微积分学的辅助教材,从另一个角度认识微积分学问题的求解方法,更好地学习微积分学相关问题的求解方法。本书还可以作为高等学校理工科各类专业的本科生和研究生学习计算机数学语言的教材或参考书或查询某数学问题求解方法的手册。
-
业务驱动的推荐系统付聪 著这是一本从业务视角解读推荐系统架构设计、评估方法、数据工程和算法原理的著作。市面上推荐系统方面的著作,内容多以推荐技术、算法和模型为主,让读者误以为掌握了推荐算法就能用好推荐系统并提升业务指标,其实推荐算法只是工具,要真正发挥推荐系统的价值,需要将推荐系统植根于业务之上。本书从业务视角出发,描绘了当下主流推荐系统的设计思想和架构全貌,重点突出系统每个模块所需要解决的问题,进而介绍一到两种实践检验普遍有效、在学术界具备里程碑性质的算法。帮助读者练成识别算法的火眼金睛,从每年大量产出的新算法研究中去粗取精,真正解决实际问题。阅读本书,你将有如下收获:从商业、运营、算法、工程视角理解推荐系统,对推荐系统的认知更加立体化;从业务视角理解推荐系统的顶层设计,掌握业务驱动的推荐系统设计思想;掌握业务驱动型推荐系统的评估方法,涵盖B端、C端和平台等多个维度;了解推荐系统的数据工程,掌握获取各类数据、构建特征体系的方法;从业务视角理解召回、排序和决策智能方面的经典算法和学术界有里程碑意义的算法;从技术和业务的双重视角去规划推荐算法工程师的成长路径,以达到事半功倍的效果。
-
高维统计学[美]马丁·J.温赖特著近年来,在所有科学学科和工业环境中收集的数据量和种类都出现了爆炸式增长。如此庞大的数据集给统计和机器学习领域的研究人员带来了许多挑战。本书对高维统计学进行了详尽介绍,重点介绍核心方法论和理论,包括尾部界、集中不等式、一致律和经验过程以及随机矩阵。此外还深入探索了特定的模型类,包括稀疏线性模型、用秩约束矩阵模型、图模型和各种类型的非参数模型。书中提供了数百个工作示例和练习,既适合统计学相关课程使用,也适合统计学、机器学习和相关领域的研究生与研究人员自学。
-
数据分析实战曾津 韩知白本书通过实战案例和可视化的图形讲解数据分析的知识。通过阅读本书,读者可以从容地处理数据,高效地完成数据分析工作。本书共9章,主要内容包括不同场景下的数据分析方法,从业者应具备的数据分析基本知识,数据分析师应具有的思维方式,海盗法则和指标体系建模,用户画像赋能数据分析,数据可视化的实操技巧等。本书不仅适合产品经理、运营人员、市场营销人员阅读,还适合数据分析人员阅读。