Spark快速数据处理pdf电子书籍下载百度云

Spark快速数据处理pdf电子书籍下载百度云
Spark快速数据处理pdf电子书籍下载百度云

 

Spark快速数据处理中文版百度网盘电子版百度云下载

【编辑推荐】

从实用角度系统讲解Spark的数据处理工具及使用方法

手把手教你充分利用Spark提供的各种功能,快速编写高效分布式程序

【内容简介】

Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、、英特尔等各大公司等。

本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。


书籍作者简介:
【书籍作者简介】 Holden Karau 资深软件开发工程师,现就职于Databricks公司,之前曾就职于谷歌、亚马逊、微软和Foursquare等著名公司。他对开源情有独钟,参与了许多开源项目,如Linux内核无线驱动、Android程序监控、搜索引擎等,对存储系统、推荐系统、搜索分类等都有深入研究。 【译者简介】 余璜 阿里巴巴核心系统研发工程师,OceanBase核心开发人员,对分布式系统理论和工程实践有深刻理解,专注于分布式系统设计、大规模数据处理,乐于分享,在CSDN上分享了大量技术文章。 张磊 Spark爱好者,曾参与分布式OLAP数据库系统核心开发,热衷于大数据处理、分布式计算。

PDF书籍目录:
第1章 安装Spark以及构建Spark集群 / 1
第2章 Spark shell的使用 / 23
第3章 构建并运行Spark应用 / 31
第4章 创建SparkContext / 41
第5章 加载与保存数据 / 47
第6章 操作RDD / 57
第7章 Shark-Hive和Spark的综合运用 / 85
第8章 测试 / 95
第9章 技巧和窍门 / 107

大数据教程书籍PDF百度网盘下载

本文来自投稿,不代表亲测学习网立场,如若转载,请注明出处:https://www.qince.net/spark%e5%bf%ab%e9%80%9f%e6%95%b0%e6%8d%ae%e5%a4%84%e7%90%86pdf%e7%94%b5%e5%ad%90%e4%b9%a6%e7%b1%8d%e4%b8%8b%e8%bd%bd%e7%99%be%e5%ba%a6%e4%ba%91.html

郑重声明:

本站所有内容均由互联网收集整理、网友上传,并且以计算机技术研究交流为目的,仅供大家参考、学习,不存在任何商业目的与商业用途。 若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

我们不承担任何技术及版权问题,且不对任何资源负法律责任。

如遇到资源无法下载,请点击这里失效报错。失效报错提交后记得查看你的留言信息,24小时之内反馈信息。

如有侵犯您的版权,请给我们私信,我们会尽快处理,并诚恳的向你道歉!

(0)
上一篇 2022年7月5日 下午1:53
下一篇 2022年7月5日 下午1:53

猜你喜欢