Spark快速大数据分析(第2版)在线阅读
会员

Spark快速大数据分析(第2版)

计算机网络数据库14.7万字

更新时间:2021-12-06 11:52:01 最新章节:看完了

立即阅读
加书架
下载
听书

书籍简介

本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用SparkSQL进行交互式查询,掌握Spark应用的优化之道,用Spark和DeltaLake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark3.0引入的新特性。
品牌:人邮图书
译者:王道远
上架时间:2021-11-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

(美)朱尔斯·S. 达米吉 布鲁克·韦尼希 丹尼·李 (印)泰瑟加塔·达斯
主页

最新上架

  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。
    白栎旸编著计算机29.9万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字
  • 会员
    《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢
    明日科技编著计算机14万字
  • 会员
    本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,
    赵明渊 唐明伟主编计算机12万字
  • 会员
    《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中
    明日科技编著计算机14.1万字
  • 会员
    MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8
    张文亮编著计算机9.7万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字
  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字

同类书籍最近更新

  • 会员
    Thisbookisdesignedforbusinessanalysts,BIanalysts,datascientists,orjuniorleveldataanalystswhoarereadytomoveonfromaconceptualunderstandingofadvancedanalyticsandbecomeanex
    Ashish Kumar Joseph Babcock数据库14.9万字
  • 会员
    这是一本讲解组织数据能力建设与数据应用工程化的著作,它旨在为企业应用和管理数据提供组织建设、技术体系和行业解决方案方面的理论指导和实践经验。本书是几位作者在数据领域十几年工作经验的总结,得到了业界10余位专家的一致好评。无论是互联网行业的数据原生类企业,还是正在数字化转型的传统企业,本书将为它们大规模、工程化地发挥数据的价值提供有意的参考。本书的内容大致分为如下4个方面:(1)行业分析:从宏观角度
    钟大伟 高铎 王鹏 宋超数据库29万字
  • 会员
    本书共分为三篇:一篇介绍数据库基础知识,重点是关系数据库理论;第二篇关注实践,重点是数据库服务器端的维护和管理;第三篇讨论数据库应用结构、数据访问接口以及应用领域和发展方向。附录用一个完整的示例说明了数据库设计的全过程。本书选用SQLServer2012作为数据库实践平台。本书注重理论与应用的结合,内容全面,实例丰富,并配有电子教案。本书可作为高等院校非计算机专业的数据库教材,也可作为计算机专
    张千帆数据库11.8万字
  • 会员
    本书是武汉工程大学王海晖、刘宝忠主编的《大学计算机基础》配套的实验指导教材。本书主要包括两个部分,第一部分为实验,内容包含6个实验,主要包括:计算机基本操作实验、Windows7操作系统实验、Office2010办公软件实验、网络基础实验、Photoshop图像处理实验、视频制作和处理实验;第二部分则包含了与主教材各章内容对应的全部习题。
    吴静 谢芳主编数据库13万字
  • 会员
    本书以大型数据库管理系统SQLServer2012为平台,通过一个贯穿全书的实例“天意购物”数据库,详细讲解了SQLServer2012的安装和配置,数据库的创建与管理,表、视图、索引、T-SQL语言、存储过程和触发器,数据库的备份恢复与导入导出,SQLServer的安全管理等内容。本书共分为绪论和6个项目,内容包括数据库基础知识、“天意购物”数据库设计与实现、“天意购物”数据库中数据表的创建与管
    刘玥数据库5.1万字
  • 会员
    本书详细介绍ProxmoxVE。ProxmoxVE是一个完整的企业虚拟化开源平台,具有去中心化的超融合特性。ProxmoxVE与前端负载均衡整合,可实现关键应用的高可用性。全书共15章,大致可分为几个部分:第1章和第2章为概述部分,主要介绍ProxmoxVE的基本特性及功能;第3~6章为基础部分,总览ProxmoxVE部署、简单管理等操作;第7~10章为项目实战,也是本书的精华部分,介绍
    田逸数据库8.6万字