2018-04-23 14:46

 版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明,否则将追究法律责任。https://blog.kokojia.com/hadoop/b-1260.html

第一类:开发类

1Spark and Hadoop开发人员培训 4天)

考试建议:CCA175

课程概述

学习关键概念和掌握使用最新技术和工具将数据采集到Hadoop 机群并进行处理。通过学习掌握诸如Spark(包括 Spark StreamingSpark SQL)、FlumeKafka 以及Sqoop 这样的Hadoop 生态系统工具和技术,Hadoop开发员将具备解决实际大数据问题和挑战的能力。

培训对象

面向具有 ScalaPython 编程经验的开发人员。熟悉 Linux 命令行,对SQL有基本了解。强烈建议不熟悉Hadoop的人员参加该培训

 

2Apache HBase 培训 3天)

课程概述

学习如何运用HBase作为分布式数据存储实现低延迟查询和高度可扩展性的数据吞吐量,涵盖schema 设计、应用程序编写、配置和维护。

培训对象

面向计划使用 HBase 的开发人员和管理员。具有数据库和数据建模经验更佳。具备 Java 相关知识更佳,Hadoop 相关知识不作要求,但培训可为该课程提供良好的基础。

 

3Cloudera搜索培训 3天)

课程概述

Hadoop 的索引数据具有更强大的实时查询功能,并且将 Cloudera 搜索与外部应用程序集成。了解如何将全文本、互动搜索和可扩展的、灵活的索引导入到 Hadoop 和企业数据中心(EDH 

培训对象

面向熟悉 Hadoop 基本知识和 JavaC C++Perl Python 编程经验的开发人员和数据工程师。培训对象应熟悉 Linux 命令行,但不要求具备SolrHBaseSQL使用经验。

 

4Apache Spark开发人员培训(3天)

考试建议:CCA175

课程概述

结合批处理、流媒体和交互分析技术, 利用 Apache Spark 构建完整统一的大数据应用。学习编写复杂的并行应用程序,为各种用例、架构和行业执行快速良好的决策和实时行动。

培训对象

面向意欲优化应用程序速度、易用性和复杂程度的开发人员和工程师。培训对象要求具备 Python Scala 背景知识,具备 Linux相关基础知识更佳。

 

5MapReduce开发人员培训 4天)

课程概述

了解 HDFS MapReduce 的基础知识, 如何利用 API 编写程序、调试和优化技巧;以及如何管理大型的工作流。介绍相关的 Apache项目。

培训对象

面向编写、维护和 / 或优化 Hadoop 作业的开发人员。培训对象应具备以下编程经验:建议具备 Java 背景知识,要求完成动手练习。但不需要具备Hadoop相关知识。

 

6、大数据应用程序的设计和构建(4天)

考试建议:CCP:DE

课程概述

学习利用企业数据中心(EDH)的工具分析和解决实际业务问题。熟练掌握聚合应用解决方案的设计和建立过程,其中包括: 摄入数据、确定文件存储格式、处理存储数据, 并为最终用户展示结果

培训对象

面向意欲使用 Hadoop 解决现实问题的开发人员和架构师。培训对象要求具备良好的 Jave 相关知识、基本熟悉 Linux,具备 SQL 经验更佳,并且应已参加 MapReduce的培训。

 

第二类:运维管理类

1Apache Hadoop管理员培训(4天)

考试建议:CCA131

课程概述

从安装及配置、负载均衡及调整,以及 诊断和解决部署问题等各方面了解 Hadoop 系统管理员的概念和实践。

培训对象

面向需要建立或维护 Hadoop 集群的管理员。培训对象要求具备 Linux 基本知识,Hadoop相关知识不作要求。

 

2Apache HBase 培训(3天)

对,你没看错,跟开发类中的HBase是一样的,它也说了是面向使用 HBase 的开发人员和管理员,一样就不介绍了。

 

第三类:数据分析类

1、数据分析师培训: PigHive Impala4天)

考试建议:CCA159

课程概述

了解Apache PigApache Hive Apache Impala如何通过筛选、连接进行数据转换和数据分析,以及利用其他常见技术自定义用户功能。

培训对象

面向意欲使用 SQL、脚本和基本 Linux 操作 Hadoop 数据的分析师、BI 专家、架构师和管理员,培训对象不要求具有 Hadoop 相关知识。

 

2、基于SparkHadoop的规模化数据科学(3天)

课程概述

了解数据科学家的工作内容、需要解决的问题以及其处理现实问题时应用的方法, 以获得来自不同行业数据的业务价值。实施自动推荐系统。

培训对象

面向具备 Hadoop 基础知识(HDFSMapReduceHadoop StreamingHive 的工程师、数据分析师、统计人员。培训对象应具备熟练的脚本语言能力:Python 是首选;熟悉Perl或者Ruby也可。

 

--------------------线----

已更新过的认证体系

1CCA Administrator Exam (CCA131)  管理员认证

认证准备建议:Administrator管理员培训

考试形式:120分钟;70%通过;基于一个预配置的Cloudera企业版集群,解决8~12个场景下的任务

2CCA Spark and Hadoop Developer (CCA175) 开发者认证

认证准备建议:Spark and Hadoop开发者培训

考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题

3CCA Data Analyst (CCA159)数据分析师认证 

认证准备建议:Data Analyst数据分析师培训

考试形式:120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具

4CCP Data Engineer Exam (DE575) 数据工程师认证

认证准备建议:Spark and Hadoop开发者培训;设计及构建大数据应用;考生需对Hadoop有深入了解、具有实际使用大数据工具的经验、以及具备解决实际数据工程问题的专家级水平

考试形式:4小时;提供一个大数据集供使用、7个高性能节点组成的CDH5机群;解决大数据用户可能碰到的5-8个实际问题

 

 版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明,否则将追究法律责任。https://blog.kokojia.com/hadoop/b-1260.html

评论