数据库
-
量化研究体系李一邨 著本书是以给广大量化研究者建立一个一般性的量化研究流程(主要是量化策略开发,也包括其他量化研究)为主旨来展开编写的。全部章节以流程化的形式展开,从量化研究的数据开始到最终以交易结束。数据库、指标库、算法库、工具库、可视化库、报告和日常工作系统、交易系统这7个核心库/系统分别解决了量化研究中某一个环节的问题。 量化研究是以上述7个核心库/系统所代表环节的一个循环,在这个循环中不断进行的改进和研究。它将数据和思想相结合,通过交易来检验研究成果是否达到预期,然后改进思想和更换数据,并投入下一次交易中。这样的循环使得每一次量化研究都更加接近理想效果。而在循环的每一个环节上,本书给出了一系列工具、算法、技术等来支撑各个核心库/系统的功能。 本书在编程语言上以Matlab和Python为主,数据库一章用到了MySQL的基本知识,交易系统一章用到了MongoDB的知识。本书的内容十分丰富,通过阅读本书,读者可以对量化研究形成一个系统、全面、完整的认识,并在今后的研究工作中逐步拓展,最终形成自己的体系。
-
SQL编程思想董旭阳 著本书基于作者十多年的工作经验和知识分享,全面覆盖了从SQL基础查询到高级分析、从数据库设计到查询优化等内容,通过循序渐进的方式和简单易懂的案例分析,透彻讲解了每个SQL知识点。本书采用了全新的SQL:2019标准,紧跟产业发展趋势,帮助读者解锁最前沿的SQL技能,同时提供了5种主流数据库的实现和差异。最后,本书还介绍了全新的SQL:2019标准对文档存储(JSON)、行模式识别(MATCH_RECOGNIZE)、多维数组(SQL/MDA)以及图形存储(SQL/PGQ)的支持。 本书适合需要在日常工作中完成数据处理的IT从业人员,包括SQL初学者、拥有一定基础的中高级工程师,甚至精通某种数据库产品的专家阅读。
-
深入理解分布式事务肖宇,冰河 著本书的广度与深度兼备、理论与实战兼顾的分布式事务专著,它从基础知识、解决方案、原理分析、源码实现、工程实战5个维度对分布式事务做了全面、细致的讲解,试图解决你在实践中遇到的所有关于分布式事务的问题。两位作者都是分布式事务领域的资深架构专家,是Apache ShenYu(incubating)网关创始人、Hmily、RainCat、Myth等分布式事务框架的创始人。本书因为内容扎实,所以得到了来自京东、阿里、腾讯、蚂蚁金服、滴滴、饿了么、58集团、IBM等互联网大厂及Apache软件基金会的近20位专家的高度评价。 ·基础知识维度:首先全面介绍了事务和分布式事务的概念和基础知识,然后详细讲解了MySQL事务和Spring事务的实现原理; ·解决方案维度:详细介绍了分布式事务的各种解决方案,包括强一致性分布式事务解决方案和Z终一致性分布式事务解决方案; ·原理分析维度:详细讲解了分布式事务的原理,包括XA强一致性分布式事务、TCC分布式事务、可靠消息Z终一致性分布式事务和Z大努力通知型分布式事务的原理。 ·源码实现维度:深入分析了Atomikos,Narayana框架实现XA强一致性分布式事务解决方案的源码,以及Dromara开源社区的Hmily分布式事务框架实现TCC分布式事务的源码; ·工程实践维度:通过多个在生产环境中经历了高并发、大流量考验的综合案例,讲解了XA强一致性分布式事务、TCC分布式事务、可靠消息Z终一致性分布式事务和Z大努力通知型分布式事务的工程实践方法。全书配有大量流程图和原理图,便于读者阅读理解;精选了大量来自生产环境的完整案例及其代码,便于读者动手实践。阅读本书,你将体验到事半功倍的效果。
-
图数据库实战[美] 戴夫·贝克伯杰(Dave Bechberger),乔希·佩里曼(Josh Perryman) 著,叶伟民,刘华 译现实世界中的数据往往并不是能以行列形式呈现的表格型数据,而是富含关系信息的复杂网络。对于挖掘这类数据的潜在价值,图数据库具有明显的优势。本书介绍如何针对真实场景设计和实现图数据库。你将学习图论的基础知识,并尝试构建基于图数据库的社交网络应用程序和推荐引擎等。你将掌握图数据库开发的所有重要概念,包括递归遍历、图数据建模、查询调优、性能调优、图分析,以及如何避免超级节点等反模式。学完本书后,你将有能力构建基于图数据库的应用程序,从而显著地提升数据价值。本书示例采用开源图计算框架TinkerPop及其查询语言Gremlin,但所述概念均适用于Neo4j等基于Cypher的图数据库。
-
分布式数据库原理、架构与实践李海翔 著这是一部对分布式数据库的核心原理、架构设计以及经典分布式数据库的实现进行深入剖析的著作,融入了作者在腾讯、Oracle等企业20余年的数据库实践经验,以及数据库领域前沿的研究成果,得到了中国人民大学杜小勇教授等多位业界知名专家的高口碑和鼎力推荐。 本书以前沿技术和工程实践为抓手,沿着问题确认、原理阐述、架构剖析、实例分析的思路,从3个方面对分布式数据进行了讲解。 分布式数据库原理。首先提出了分布式系统面临的典型问题,尤其是一致性问题;然后结合CAP原理和分布式事务处理技术中的ACID技术对这些问题(重点是一致性问题)的本质进行深挖;接着基于时钟、Paxos协议、Raft算法等给出可行的解决方案;最后深度解读事务处理技术中的MVCC、OCC、DTA等技术在近年的发展。 分布式数据库架构。讨论了影响架构的内在、外在技术因素,其中内在因素包括强一致性、高可靠性、高可用性等;外在因素包括云计算、Serveless需求等。这部分最终要解决的问题是:如何通过计算/存储分离、智能化和新硬件技术实现系统的高可扩展性、高可靠性以及高可用性? 分布式数据库实现。从工程实践的角度,以Spanner、CockroachDB等多个数据库为对象,从问题、原理、前沿技术研究成果等角度对分布式数据库的架构、事务处理技术的实现以及在实际系统中的落地进行了详细介绍。
-
MySQL 8查询性能优化杰斯帕·威斯堡·克罗 著,史跃东,杨欣,殷海英 译主要内容● 监控性能,找出效果不佳的查询● 选取要优化的查询,**限度地提高收益● 使用EXPLAIN ANALYZE和Visual Explain等工具来分析查询● 借助多种策略改进慢查询● 正确使用索引和直方图,创建快速的执行计划● 了解并分析锁,从而解决争用问题,提升系统吞吐量
-
SQL Server 2012数据库技术及应用周慧 施乐军 崔玉礼 著本书介绍数据库系统的基本知识、需求分析、概念设计和逻辑设计的方法,然后分别介绍SQL Server 2012的基本服务功能、安装与配置;使用SSMS或T-SQL创建与管理数据库、表、索引和视图;T-SQL的SELECT数据查询;T-SQL编程基础,创建与管理存储过程、触发器和用户定义函数;最后介绍SQL Server 2012的数据库安全管理技术、备份与还原技术、导出与导入技术。
-
面向高端制造领域的大数据管理系统“面向高端制造领域的大数据管理系统”项目 著《面向高端制造领域的大数据管理系统》是“十三五”国家重点研发计划“云计算和大数据”专项“面向高端制造领域的大数据管理系统”项目的研究成果。全书共25章,分为导论篇、多模态异构数据源管理引擎篇、语义融合与一体化管理引擎篇、运维工具篇、测试篇和应用篇,紧密围绕我国先进制造发展的需求和国际大数据管理技术的前沿,在工业大数据一体化管理体系架构、多模态异构数据管理、语义融合与协同优化、运维工具与测试床等多个方面论述了本项目的重要成果。《面向高端制造领域的大数据管理系统》可供高端制造企业大数据管理和工业大数据管理领域的科研、开发和运维人员阅读。
-
AWS系统管理员学习指南[美] 萨拉·佩洛特(Sara Perrott) 著涵盖了所有考试目标: ● 监测和报告服务 ● AWS的高可用性环境 ● 存储和数据管理 ● 部署和资源供给 ● 安全性和合规性 ● AWS的网络和连接服务 ● 自动化和优化
-
文本数据挖掘宗成庆,夏睿,张家俊 著《Text data mining》 offers thorough and detailed introduction to the fundamental theories and methods of text data mining, ranging from pre-processing (for both Chinese and English texts), text representation, feature selection, to text classification and text clustering. Also it presents predominant applications of text data mining, for example, topic model, sentiment analysis and opinion mining, topic detection and tracking, information extraction, and text automatic summarization, etc.