数据库挖掘/数据仓库
-
基于大数据的智能风控技术应用实战平台、模型与知识的综合实践万振龙 等万振龙 ,廖梦洁,林英撑,李博文本书分为:绪论、智能风控的理论基础、基于大数据的智能风控系统技术架构、数据结构化表示与实时融合技术、知识工程及知识图谱技术应用、机器学习及人工智能在风控中的应用、规则引擎技术应用及优化、智能风控技术实战应用案例、总结与展望。本书的目的是通过总结税收征管与风先甄别项目的实施经验,将项目的核心技术架构抽象为一个通用的智能风控系统解决方案,并对方案中用到的理论基础、具体技术、常见问题及解决办法等进行较为详细的说明,为其他行业开展风控系统建设提供有价值的借鉴。 -
数据要素价值化蓝图史凯内容简介这既是一本系统讲解数据资产价值变现的入门书,又是一本全面介绍数据要素的科普书,它能帮助零基础的读者厘清数据要素各种概念并建立系统的知识体系,同时还能掌握数据资产价值变现的认知、实现路径和实操方法。本书由凯捷咨询前亚太区副总裁、阿里云中国区前咨询总经理撰写,全球数据资产理事会(DAC)联合出品。本书是《精益数据方法论:数据驱动的数字化转型》一书的姊妹篇,后者讲了如何制定数据战略、梳理数据场景、开发数据产品,如何利用精益数据方法转型为数字化企业;前者为数字化企业的数据资产变现给出了方案。全书一共17章,分为5篇。第一篇 数据要素基础与政策环境首先详细介绍了数据要素的定义、特征以及20余个该领域的相关概念,彻底厘清读者对数据要素的认知;然后全面分析了国家在数据要素领域的布局以及与之相关的各种政策和法规。第二篇 数据要素价值化详细阐述了如何实现数据要素价值化,具体包括数据资产管理、数据治理与确权、数据资产评估与定价等多个方面,提供具体的方法和操作指南;同时介绍了数据资源入表,数据监管、合规与安全,数据资产的交易,数据要素市场,以及数据基础设施,帮助读者全面理解和实践数据价值化路径。第三篇 公共数据要素价值化重点介绍了公共数据要素的基本知识,并通过公共数据要素价值蓝图,让读者直观了解公共数据的价值构成和实现路径,为公共数据的利用提供参考。第四篇 产业数据要素价值化聚焦于产业数据要素,介绍其基本知识,并通过产业数据要素价值蓝图,让读者清晰地看到产业数据的具体价值构成,以更好地利用数据驱动业务发展。第五篇 个人数据要素价值化聚焦于个人数据要素,介绍其基本知识,并通过个人数据要素价值蓝图,让读者学习到个人数据的价值实现过程,从而更好地理解和保护个人数据资产。总体而言,本书可以提升企业管理者对数据的敏感度,以做出更具前瞻性的决策;提升数据专家职业能力,掌握数据要素的深层次价值;助力科技行业从业者了解数据如何驱动行业创新,抢占未来市场。 -
一本书讲透数据跨境流动林梓瀚这是一本从理论与实践双重角度讲解数据跨境流动的著作,既系统讲解了数据跨境流动的经济价值、制度建设、技术路径、企业管理、场景识别,又给出了数据跨境流动面向未来的解释框架,包括经济形态、表征行为、应用架构与底层技术等。本书覆盖了数据跨境流动所需的知识,详细讨论了在实际操作中的落地实操方法,具备系统性、落地性与前瞻性三大特点,融合了作者多年研究与落地经验,中国电子信息产业集团原总法律顾问、中国信息化百人会执委、上海数据交易所党总支书记、广东省数据要素产业协会秘书长等17位来自学界和业界的专家联袂推荐。本书共9章,分为4个部分,全面讲述了数据跨境流动的定义、政策法律体系以及开展数据跨境流动的合规方法与技术保障选择,并从经济形态、应用框架和底层技术对数据跨境流动的未来发展趋势做出研判,帮助读者掌握数据跨境流动的发展动向。第一部分 基础概览(第1章和第2章)介绍数据跨境流动的基本定义、发展阶段及数据跨境流动的内涵,同时从全球治理、全球经济发展、全球科技发展3个角度阐明数据跨境流动所蕴含的巨大价值。第二部分 核心规则体系(第3章和第4章)详细介绍我国对数据跨境流动的政策以及相关法律体系,梳理了基本的合规规则,为后续的实操奠定了基础。第三部分 操作指引(第5章至第7章)介绍数据处理者的内部实操,包括数据出境业务的梳理、内部合规制度建设等,并列举了重点行业梳理数据出境场景以及数据字段的方法,同时介绍了相关安全保障技术的技术原理及应用价值等。第四部分 域外规则要点(第8章和第9章)介绍了国际机构、国际贸易协定、全球主要经济体有关数据跨境流动的规则,以及这些规则对我国境内数据处理者开展数据跨境流动的影响,另外还描述了全球未来经济形态和相关技术的发展路径,并探讨了它们与数据跨境流动的关系。 -
大数据应用朱扬勇 主编现今,数据已无处不在、无时不用,数据驱动管理决策、科学研究、技术发明、经济生活,数据驱动创新发展,数据成为企业资产、成为生产要素。开发大数据应用、实现数字化转型、提升核心竞争力是各类主体所希望的。开发一个大数据应用项目,需要进行充分的数据准备和技术准备,设计好实施方案,解决实际应用中的问题。本书介绍了多个领域的大数据应用案例研究与实践,包括工业、农业、金融、物流、旅游、气象、医疗、城市管理、城市交通等领域。这些应用案例涵盖了大数据应用的大部分领域,也从一个侧面展示了大数据在实际应用中的挑战。 -
向量数据库梁楠《向量数据库:大模型驱动的智能检索与应用》系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。《向量数据库:大模型驱动的智能检索与应用》分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。《向量数据库:大模型驱动的智能检索与应用》不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训机构和高校相关课程的教学用书。 -
一本书讲透数据资产入表王琰 孟庆国 刘晗 朱越 等内容简介这是一部能指引零基础读者顺利完成数据资产入表的实操性著作。它不仅为读者提供了数据资产入表所需的全部知识,还给出了实际操作层面的方法指引;既是数据资产入表的初学者指南,也是企业实施数据资产入表操作的工作手册。本书由数据资产管理领域的标杆企业亿信华辰倾情奉献,同时融合了行业的先进实践经验,开创性提出“数据资产三次入表理论”(数据原始资源入表、数据产品入表、数据金融资产入表),得到了来自学术界和企业界的12位数据资产管理专家的高度评价和强烈推荐。本书分为四部分,不仅从战略、方法、工具、实操、案例等角度为读者提供了全面的数据资产入表知识体系,还前瞻性地探讨了数据资产入表后的价值挖掘、资产评估和金融创新。第一部分 数据资产入表全景概览(第1和第2章)深入分析数据资产入表的宏观背景、核心目标及其对企业乃至社会的价值,为读者描绘数据资产入表的时代意义和发展蓝图。第二部分 数据资产入表核心知识体系(第3~5章)详解数据资产入表所需的会计原理、法律框架和大数据技术基础,建立全面而深入的知识体系,为实操打下坚实基础。第三部分 数据资产入表实操指南(第6~9章)系统阐述实施策略与具体步骤,涵盖数据原始资源入表与数据产品入表的关键环节,提供详尽的实操指南。第四部分 数据资产入表后的价值挖掘(第10~13章)指导企业探索金融创新工具的应用,实现数据的资产化和资本化,释放数据资源的巨大潜在价值。此外,附录包含“数据资产入表36问”“数据要素相关标准清单”等内容,插页给出了“数据资产入表知识地图”。 -
从零开始学Power BI商业数据分析刘鑫《从零开始学Power BI商业数据分析(视频教学版)》从Power BI的基础知识讲起,然后逐步深入Power BI的进阶提升知识,最后配合项目实战案例,展示如何使用Power BI进行数据清洗、数据统计和数据可视化等相关操作,从而帮助零基础的数据分析人员快速上手。《从零开始学Power BI商业数据分析(视频教学版)》共10章,分为3篇。第1篇“基础知识”,主要介绍Power BI的下载和注册方法,以及相关组件的用法和数据导入方法,并详细介绍Power Query的基础知识。第2篇“进阶提升”,主要介绍数据建模、度量值、常用的度量值应用案例、可视化看板的制作和Power BI在线版等相关知识。第3篇“项目案例实战”,主要介绍如何用Power BI制作数据大屏、多页面交互式可视化看板和分析报告3个实战案例,展现数据清洗、数据统计和数据可视化的整个流程。《从零开始学Power BI商业数据分析(视频教学版)》通俗易懂,案例丰富,实用性强,适合Power BI的入门与进阶读者阅读,尤其是从事数据分析、商业分析、运营、人力管理和财务管理等经常与数据打交道的相关人员阅读,另外还适合相关培训机构的数据分析学员阅读。 -
模式识别中的机器学习与数据挖掘Petra Perner 著This book constitutes the refereed proceedings of the 4th International Conference on Machine Learning and Data Mining in Pattern Recognition, MLDM 2005, held in Leipzig, Germany, in July 2005.The 68 revised full papers presented were carefully reviewed and selected. The papers are organized in topical sections on classification and model estimation, neural methods, subspace methods, basics and applications of clustering, feature grouping, discretization, selection and transformation, applications in medicine, time series and sequential pattern mining, mining images in computer vision, mining images and texture, mining motion from sequence, speech analysis, aspects of data mining, text mining, and as a special track: industrial applications of data mining. -
开放协同的科技大数据汇聚融合与演化分析陈浩等《开放协同的科技大数据汇聚融合与演化分析》针对科技服务对科技资源数据汇聚融合的需求,研究面向开放协同的科技大数据汇聚融合和演化分析技术,研究多源异构科技大数据资源体系建设与应用场景,设计科技大数据汇聚融合与演化分析系统架构,利用在线知识图谱建立多源异构、碎片化数据之间的语义关联和多粒度层次语义映射,完成科技大数据的实体识别和匹配,向各行业各领域用户提供面向开放协同的科技大数据检索服务。基于区块链技术实现科技大数据的可信数据确权与追踪保护,实现数据生命周期管理。 -
科技大数据的建模与分析技术周向东,刘德兵,王元卓,王尧科技大数据的建模理论与分析方法是科技大数据相关技术研究与服务平台建设的重要理论基础和应用方法论。科技大数据主要由非结构化和复杂结构数据组成,涉及广泛而丰富的建模理论和方法。本书内容侧重面向科技大数据应用的基于张量的非结构数据建模、知识图谱及迁移学习等的基本概念及理论,同时介绍相关理论在认知图谱、跨域图像分类以及学者研究兴趣及机构合作关系挖掘等方面的应用。
