极客时间-吴磊-零基础入门 Spark(完结)

零基础 Spark 极客时间
网盘类型 夸克
文件大小 797.02 MB
文件数量 123
下载次数 0
是否有效 验证中...
最后验证 加载中...
上传时间 2025-05-30 08:00:34

文件目录结构目录内容仅供参考

极客时间-吴磊-零基础入门 Spark(完结)
01-开篇词(1讲)
开篇词丨入门Spark,你需要学会“三步走”.html (3.21 MB)
开篇词丨入门Spark,你需要学会“三步走”.m4a (12.37 MB)
开篇词丨入门Spark,你需要学会“三步走”.pdf (3.53 MB)
02-基础知识(1讲)
01丨Spark:从“大数据的HelloWorld”开始.html (4.82 MB)
01丨Spark:从“大数据的HelloWorld”开始.m4a (14.48 MB)
01丨Spark:从“大数据的HelloWorld”开始.pdf (5.04 MB)
02丨RDD与编程模型:延迟计算是怎么回事?.html (2.63 MB)
02丨RDD与编程模型:延迟计算是怎么回事?.m4a (13.81 MB)
02丨RDD与编程模型:延迟计算是怎么回事?.pdf (4.03 MB)
03丨RDD常用算子(一):RDD内部的数据转换.html (2.47 MB)
03丨RDD常用算子(一):RDD内部的数据转换.m4a (15.87 MB)
03丨RDD常用算子(一):RDD内部的数据转换.pdf (3.65 MB)
04丨进程模型与分布式部署:分布式计算是怎么回事?.html (2.51 MB)
04丨进程模型与分布式部署:分布式计算是怎么回事?.m4a (13.54 MB)
04丨进程模型与分布式部署:分布式计算是怎么回事?.pdf (3.41 MB)
05丨调度系统:DAG、Stages与分布式任务.html (3.08 MB)
05丨调度系统:DAG、Stages与分布式任务.m4a (18.68 MB)
05丨调度系统:DAG、Stages与分布式任务.pdf (5.19 MB)
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.html (2.38 MB)
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.m4a (14.41 MB)
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.pdf (3.73 MB)
07丨RDD常用算子(二):Spark如何实现数据聚合?.html (2.5 MB)
07丨RDD常用算子(二):Spark如何实现数据聚合?.m4a (13.55 MB)
07丨RDD常用算子(二):Spark如何实现数据聚合?.pdf (4.11 MB)
08丨内存管理:Spark如何使用内存?.html (3.04 MB)
08丨内存管理:Spark如何使用内存?.m4a (13.43 MB)
08丨内存管理:Spark如何使用内存?.pdf (4.24 MB)
09丨RDD常用算子(三):数据的准备、重分布与持久化.html (2.81 MB)
09丨RDD常用算子(三):数据的准备、重分布与持久化.m4a (16.93 MB)
09丨RDD常用算子(三):数据的准备、重分布与持久化.pdf (4.42 MB)
10丨广播变量-累加器:共享变量是用来做什么的?.html (2.04 MB)
10丨广播变量-累加器:共享变量是用来做什么的?.pdf (2.73 MB)
10丨广播变量&累加器:共享变量是用来做什么的?.m4a (11.77 MB)
11丨存储系统:数据到底都存哪儿了?.html (2.86 MB)
11丨存储系统:数据到底都存哪儿了?.m4a (10.79 MB)
11丨存储系统:数据到底都存哪儿了?.pdf (5.19 MB)
12丨基础配置详解:有哪些配置项是你必须要关注的?.html (2.13 MB)
12丨基础配置详解:有哪些配置项是你必须要关注的?.m4a (15.29 MB)
12丨基础配置详解:有哪些配置项是你必须要关注的?.pdf (2.43 MB)
03-Spark SQL (4讲)
13丨让我们从《小汽车摇号分析》开始.html (2.89 MB)
13丨让我们从《小汽车摇号分析》开始.m4a (12.6 MB)
13丨让我们从《小汽车摇号分析》开始.pdf (4.4 MB)
14丨DataFrame与SparkSQL的由来.html (3.44 MB)
14丨DataFrame与SparkSQL的由来.m4a (14.88 MB)
14丨DataFrame与SparkSQL的由来.pdf (5.7 MB)
15丨数据源与数据格式:DataFrame从何而来?.html (3.11 MB)
15丨数据源与数据格式:DataFrame从何而来?.m4a (18.06 MB)
15丨数据源与数据格式:DataFrame从何而来?.pdf (4.46 MB)
16丨数据转换:如何在DataFrame之上做数据处理?.html (3.35 MB)
16丨数据转换:如何在DataFrame之上做数据处理?.m4a (17.13 MB)
16丨数据转换:如何在DataFrame之上做数据处理?.pdf (4.52 MB)
17丨数据关联:不同的关联形式与实现机制该怎么选?.html (2.49 MB)
17丨数据关联:不同的关联形式与实现机制该怎么选?.m4a (14.48 MB)
17丨数据关联:不同的关联形式与实现机制该怎么选?.pdf (3.66 MB)
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.html (3.14 MB)
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.m4a (12.28 MB)
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.pdf (4.18 MB)
19丨配置项详解:哪些参数会影响应用程序执行性能?.html (3.61 MB)
19丨配置项详解:哪些参数会影响应用程序执行性能?.m4a (14.33 MB)
19丨配置项详解:哪些参数会影响应用程序执行性能?.pdf (3.73 MB)
20丨Hive+Spark强强联合:分布式数仓的不二之选.html (3.34 MB)
20丨Hive+Spark强强联合:分布式数仓的不二之选.m4a (17.36 MB)
20丨Hive+Spark强强联合:分布式数仓的不二之选.pdf (4.99 MB)
21丨SparkUI(上):如何高效地定位性能问题?.html (5.55 MB)
21丨SparkUI(上):如何高效地定位性能问题?.m4a (11.45 MB)
21丨SparkUI(上):如何高效地定位性能问题?.pdf (6.46 MB)
22丨SparkUI(下):如何高效地定位性能问题?.html (5.78 MB)
22丨SparkUI(下):如何高效地定位性能问题?.m4a (13.07 MB)
22丨SparkUI(下):如何高效地定位性能问题?.pdf (6.61 MB)
04-SparkMLlib(2讲)
23丨SparkMLlib:从“房价预测”开始.html (3.16 MB)
23丨SparkMLlib:从“房价预测”开始.m4a (14.82 MB)
23丨SparkMLlib:从“房价预测”开始.pdf (4.8 MB)
24丨特征工程(上):有哪些常用的特征处理函数?.html (3.72 MB)
24丨特征工程(上):有哪些常用的特征处理函数?.m4a (15.84 MB)
24丨特征工程(上):有哪些常用的特征处理函数?.pdf (4.63 MB)
25丨特征工程(下):有哪些常用的特征处理函数?.html (3.06 MB)
25丨特征工程(下):有哪些常用的特征处理函数?.m4a (11.64 MB)
25丨特征工程(下):有哪些常用的特征处理函数?.pdf (5.21 MB)
26丨模型训练(上):决策树系列算法详解.html (2.41 MB)
26丨模型训练(上):决策树系列算法详解.m4a (11.78 MB)
26丨模型训练(上):决策树系列算法详解.pdf (4.73 MB)
27丨模型训练(中):回归、分类和聚类算法详解.html (2.41 MB)
27丨模型训练(中):回归、分类和聚类算法详解.m4a (10.44 MB)
27丨模型训练(中):回归、分类和聚类算法详解.pdf (3.79 MB)
28丨模型训练(下):协同过滤与频繁项集算法详解.html (2.72 MB)
28丨模型训练(下):协同过滤与频繁项集算法详解.m4a (10.26 MB)
28丨模型训练(下):协同过滤与频繁项集算法详解.pdf (4.34 MB)
29丨SparkMLlibPipeline:高效开发机器学习应用.html (2.19 MB)
29丨SparkMLlibPipeline:高效开发机器学习应用.m4a (12.8 MB)
29丨SparkMLlibPipeline:高效开发机器学习应用.pdf (2.06 MB)
05-特别放送(1讲)
用户故事丨小王:保持空杯心态,不做井底之蛙.html (4.78 MB)
用户故事丨小王:保持空杯心态,不做井底之蛙.m4a (6.24 MB)
用户故事丨小王:保持空杯心态,不做井底之蛙.pdf (12.05 MB)
06-StructuredStreaming(1讲)
30丨StructuredStreaming:从“流动的WordCount”开始.html (3.31 MB)
30丨StructuredStreaming:从“流动的WordCount”开始.m4a (11.57 MB)
30丨StructuredStreaming:从“流动的WordCount”开始.pdf (4.01 MB)
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.html (3.7 MB)
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.m4a (11.03 MB)
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.pdf (5.17 MB)
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.html (2.97 MB)
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.m4a (13.2 MB)
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.pdf (4.73 MB)
33丨流计算中的数据关联:流与流、流与批.html (1.95 MB)
33丨流计算中的数据关联:流与流、流与批.m4a (13.56 MB)
33丨流计算中的数据关联:流与流、流与批.pdf (2.85 MB)
34丨Spark+Kafka:流计算中的“万金油”.html (2.49 MB)
34丨Spark+Kafka:流计算中的“万金油”.m4a (13.21 MB)
34丨Spark+Kafka:流计算中的“万金油”.pdf (4.08 MB)
08-特别放送(1讲)
用户故事丨小王:保持空杯心态,不做井底之蛙.html (4.03 MB)
用户故事丨小王:保持空杯心态,不做井底之蛙.m4a (6.24 MB)
用户故事丨小王:保持空杯心态,不做井底之蛙.pdf (11.94 MB)
09-结束语(2讲)
结束语丨进入时间裂缝,持续学习.html (2.52 MB)
结束语丨进入时间裂缝,持续学习.m4a (6.6 MB)
结束语丨进入时间裂缝,持续学习.pdf (3.87 MB)

用户评论 (0条)

免责声明

1. 本站所有资源均来自网络收集或用户分享,仅供学习交流使用,版权归原作者所有。

2. 本站不对所存储资源的完整性、准确性和合法性负责,也不承担任何法律责任。

3. 如有侵犯您的版权或其他权益,请立即联系我们删除相关内容。

4. 使用者应自行承担因下载、使用本站资源而产生的一切后果。

5. 本声明未涉及的问题参见国家有关法律法规,当本声明与国家法律法规冲突时,以国家法律法规为准。