数据质量管理:数据可靠性与数据质量问题解决之道在线阅读
会员

数据质量管理:数据可靠性与数据质量问题解决之道

(美)巴尔·摩西等
开会员,本书免费读 >

计算机网络数据库17万字

更新时间:2024-08-19 16:21:20 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书是一本关于如何清洗、整理和理解数据的手册,还介绍了围绕构建更可靠的数据系统的最佳实践、技术和流程,并在此过程中培养团队和利益相关方对数据的信任。本书首先引入“数据宕机”的概念,然后介绍如何跨多个关键数据管道技术构建更具弹性的数据系统。还介绍了数据可靠性工作流中的主动异常检测与监测,并设置SLA、SLI和SLO,以及构建由新鲜度、容量、分布、模式和沿袭这5个关键支柱组成的优化数据质量的数据平台。之后深入探讨在生产环境中实际应对和解决数据质量问题所需的步骤,包括数据事件管理、根因分析、事后分析等。接着讨论数据团队在大规模宣传和普及数据质量时必须跨越的一些文化和组织障碍,并分享了几个真实案例研究和与数据工程领域领军人物的对话。
品牌:机械工业出版社
译者:李晗玥等
上架时间:2024-05-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

同类热门书

最新上架

  • 会员
    为了便于读者进行系统学习、分类整理知识点及遇到问题时能够快速找到求解的方法,本书按照算法策略进行划分,每一章都引入了若干个经典问题。通过问题的分析、计算模型的建立、算法的设计与描述、算法的分析来深入解读每一种算法策略所能解决的问题范畴及方法。全书共分9章,内容包括:算法设计基础、算法效率分析基础、迭代法、蛮力法、分治策略、回溯与分支界限、贪心算法、动态规划、随机算法。本书非常注重教材的可读性和实用
    张小东主编计算机9.4万字
  • 会员
    本书旨在帮助数据行业的从业者在AI时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。本书共8章。第1章回顾企业数据的发展历史,并讲解现代企业数据组织。第2章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动AI变革等视角介绍数据价值创造的方法和成果。第3章系统讲解数据管理的方法与技术,包括数据资产管理、数据资产运营、数据平台架构的规划及实践案例。第4
    刘汪根 王志军 陈果编著计算机20.2万字
  • 会员
    这是一本能指导首席数据官(CDO)快速构建知识体系和能力模型的标准指南。本书融合了作者对CDO角色的深刻理解和深厚的工程实践经验,系统而全面地介绍了CDO所需的核心知识体系与能力模型。本书从CDO的基本概念出发,逐步深入探讨了CDO在政策环境、数字化转型、组织数据体系建设与管理、数据价值创造等方面的关键作用。书中不仅详细阐述了CDO应具备的基础数据知识和组织数据管理能力,还通过丰富的案例和实战技巧
    王晓华 赵瑞计算机17.3万字
  • 会员
    本书共8章,第1章介绍新媒体数据分析的基础知识;第2章介绍各种新媒体数据分析指标;第3章介绍新媒体数据的采集;第4章介绍新媒体数据处理;第5章介绍新媒体数据分析的思维和方法;第6章介绍新媒体数据可视化;第7章介绍不同新媒体平台的数据分析方法和实战技能;第8章介绍新媒体数据分析报告的制作。
    赵春红计算机9.2万字
  • 会员
    本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不
    汪晓青主编计算机7.8万字
  • 会员
    本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。
    袁昕编著计算机8.5万字
  • 会员
    本书概述了城市计算的定义、框架和主要研究问题,以典型应用为案例着重介绍大数据中异构数据的融合和协同计算技术,根据城市计算的框架分成四个部分:概念和框架、城市感知和数据采集、城市数据管理、城市数据分析。第一部分(第1章和第2章)给出城市计算的概述。第二部分(第3章)介绍了数据的来源和收集方法。第三部分由第4~6章组成,介绍了空间和时空数据的数据管理。第四部分由第7~10章组成,介绍了从城市大数据中挖
    郑宇计算机30.4万字
  • 会员
    本书共5篇,分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1-3章),主要针对初学者,从零开始,系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4-6章),介绍了PowerBI数据的整理操作、表格中行/列数据的管理,以及PowerBI数据的高级处理、M函数的使
    凤凰高新教育编著计算机0字
  • 会员
    本书内容分为五篇。第一篇从数据要素的基本概念和发展历程入手,帮助读者建立对数据要素的初步认知,并在此基础上探索与数据要素相关的政策导向和环境,了解数据在当今社会中的地位和影响。第二篇详细阐述如何实现数据要素价值化,具体包括数据资产管理、数据治理与确权、数据资产评估与定价等多个方面,还介绍了数据资源入表,数据监管、合规与安全,数据资产的交易等知识。第三篇重点介绍公共数据要素基本知识和公共数据要素价值
    史凯计算机20.8万字

同类书籍最近更新

  • 会员
    本书内容分为五篇。第一篇从数据要素的基本概念和发展历程入手,帮助读者建立对数据要素的初步认知,并在此基础上探索与数据要素相关的政策导向和环境,了解数据在当今社会中的地位和影响。第二篇详细阐述如何实现数据要素价值化,具体包括数据资产管理、数据治理与确权、数据资产评估与定价等多个方面,还介绍了数据资源入表,数据监管、合规与安全,数据资产的交易等知识。第三篇重点介绍公共数据要素基本知识和公共数据要素价值
    史凯数据库20.8万字
  • 会员
    本书基于工业4.0背景,阐述了数字孪生作为一种科学范式,为物理对象/系统及其数字对应体提供了非凡的优势和灵活性。本书结合数字孪生在各行业的应用来阐述其基本知识和运行方式。本书首先介绍了数字孪生的基本定义、相关概念、发展历程、构成要素、工作原理、类型、特性、解决方案架构等内容;其次介绍了数字孪生的优势、挑战、研究与应用;然后介绍了数字孪生在医疗、建筑、石油和天然气、制药等行业以及智慧城市、结构健康检
    (印)玛尼莎·沃赫拉主编数据库9.8万字