数据算法 Hadoop Spark大数据处理技巧pdf电子书籍下载百度网盘

数据算法 Hadoop Spark大数据处理技巧pdf电子书籍下载百度网盘
数据算法 Hadoop Spark大数据处理技巧pdf电子书籍下载百度网盘

 

数据算法 Hadoop Spark大数据处理技巧中文版百度网盘电子版百度云下载

《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。

主要内容包括:

■ 完成超大量交易的购物篮分析。

■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。

■ 使用超大基因组数据完成DNA和RNA测序。

■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。

■ 推荐算法和成对文档相似性。

■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。

■ 等位基因频率和DNA挖掘。

■ 社交网络分析(推荐系统、三角形计数和情感分析)。


书籍作者简介:
Mahmoud Parsian,计算机科学博士,是一位热衷于实践的软件专家,作为开发人员、设计人员、架构师和作者,他有30多年的软件开发经验。目前领导着Illumina的大数据团队,在过去15年间,他主要从事Java (服务器端)、数据库、MapReduce和分布式计算的有关工作。Mahmoud还著有《JDBC Recipes》和《JDBC Metata, MySQL,and Oracle Recipes》等书(均由Apress出版)。

PDF书籍目录:
第1章二次排序:简介 19
第2章二次排序:详细示例 42
第3章 Top 10 列表 54
第4章左外连接 96
第5章反转排序 127
第6章移动平均 137
第7章购物篮分析 155
第8章共同好友 182
第9章使用MapReduce实现推荐引擎 201
第10章基于内容的电影推荐 225
第11章使用马尔可夫模型的智能邮件营销 .253
第12章 K-均值聚类 282
第13章 k-近邻 296
第14章朴素贝叶斯 315
第15章情感分析 349
第16章查找、统计和列出大图中的所有三角形 354
第17章 K-mer计数 375
第18章 DNA测序 390
第19章 Cox回归 413
第20章 Cochran-Armitage趋势检验 426
第21章等位基因频率 443
第22章 T检验 468
第23章皮尔逊相关系数 488
第24章 DNA碱基计数 520
第25章 RNA测序 543
第26章基因聚合 553
第27章线性回归 586
第28章 MapReduce和幺半群 600
第29章小文件问题 622
第30章 MapReduce的大容量缓存 635
第31章 Bloom过滤器 651Bloom

大数据教程书籍PDF百度网盘下载

本文来自投稿,不代表亲测学习网立场,如若转载,请注明出处:https://www.qince.net/%e6%95%b0%e6%8d%ae%e7%ae%97%e6%b3%95-hadoop-spark%e5%a4%a7%e6%95%b0%e6%8d%ae%e5%a4%84%e7%90%86%e6%8a%80%e5%b7%a7pdf%e7%94%b5%e5%ad%90%e4%b9%a6%e7%b1%8d%e4%b8%8b%e8%bd%bd%e7%99%be%e5%ba%a6%e7%bd%91.html

郑重声明:

本站所有内容均由互联网收集整理、网友上传,并且以计算机技术研究交流为目的,仅供大家参考、学习,不存在任何商业目的与商业用途。 若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

我们不承担任何技术及版权问题,且不对任何资源负法律责任。

如遇到资源无法下载,请点击这里失效报错。失效报错提交后记得查看你的留言信息,24小时之内反馈信息。

如有侵犯您的版权,请给我们私信,我们会尽快处理,并诚恳的向你道歉!

(0)
上一篇 2022年7月5日 下午1:54
下一篇 2022年7月5日 下午1:54

猜你喜欢