Spark通过构建统一的数据分析平台,同时支持大数据和人工智能,简化大数据问题,使更多的公司和机构从大数据中受益。Spark作为大数据中最受欢迎的分析工具,博大精深,发展迅速,也影响着我们每个人的工作和生活。掌握Spark就是掌握大数据时代的脉搏。对于大数据开发工程师来说,掌握Spark非常重要。
然而,如果你不能很好地理解Spark背后的原理,你就不能充分发挥Spark的功能特性。如何确保可扩展性和高效性是数据模型设计的关键,也是学习Spark的难点之一。如何确保系统任务的长期稳定和基于大量数据的任务优化是学习Spark的另一个关键和困难。
讲师介绍
王磊老师是《offer》:Java面试核心知识点精讲。原则篇&作者是Java面试核心知识点的作者,拥有十多年丰富的物联网、大数据研发和技术架构经验,对物联网和大数据的原理和技术实现有着深刻的理解。长期从事海外项目的研发和交付,在异地多活数据中心建设和高可用性、高并发性系统设计方面具有丰富的实践经验。
你将获得
对Spark内核原理的深入理解;
掌握Spark API及使用场景;
Spark性能调优方案综合分析;
Spark快速完成 ML机器学习实战。
课程文件目录
01-课程介绍.mp4
02-内容综述.mp4
03-Spark简介及生态介绍.mp4
04-Spark原理及特点:模块概述+特点.mp4
05-Spark的原理和特点:运行模式+集群角色.mp4
06-Spark原理及特点:Spark操作流程.mp4
07-Spark运行环境安装:Standalone入门实战.mp4
08-Spark运行环境安装:YARN入门实战.mp4
09-Spark批处理作业入门Demo.mp4
10-Spark流处理作业入门Demo.mp4
[我要扒资料]