Cloudera Hadoop大数据认证及考试体系简介_Hadoop

2018-04-23 14:46

标签:

第一类：开发类

1、Spark and Hadoop开发人员培训 （4天）

考试建议：CCA175

课程概述

学习关键概念和掌握使用最新技术和工具将数据采集到Hadoop 机群并进行处理。通过学习掌握诸如Spark（包括 Spark Streaming和Spark SQL）、Flume、Kafka 以及Sqoop 这样的Hadoop 生态系统工具和技术，Hadoop开发员将具备解决实际大数据问题和挑战的能力。

培训对象

面向具有 Scala或Python 编程经验的开发人员。熟悉 Linux 命令行，对SQL有基本了解。强烈建议不熟悉Hadoop的人员参加该培训

2、Apache HBase 培训（3天）

课程概述

学习如何运用HBase作为分布式数据存储实现低延迟查询和高度可扩展性的数据吞吐量，涵盖schema 设计、应用程序编写、配置和维护。

培训对象

面向计划使用 HBase 的开发人员和管理员。具有数据库和数据建模经验更佳。具备 Java 相关知识更佳，Hadoop 相关知识不作要求，但培训可为该课程提供良好的基础。

3、Cloudera搜索培训 （3天）

课程概述

Hadoop 的索引数据具有更强大的实时查询功能，并且将 Cloudera 搜索与外部应用程序集成。了解如何将全文本、互动搜索和可扩展的、灵活的索引导入到 Hadoop 和企业数据中心（EDH）

培训对象

面向熟悉 Hadoop 基本知识和 Java、C、 C++、Perl 或 Python 编程经验的开发人员和数据工程师。培训对象应熟悉 Linux 命令行，但不要求具备Solr，HBase或SQL使用经验。

4、Apache Spark开发人员培训（3天）

考试建议：CCA175

课程概述

结合批处理、流媒体和交互分析技术，利用 Apache Spark 构建完整统一的大数据应用。学习编写复杂的并行应用程序，为各种用例、架构和行业执行快速良好的决策和实时行动。

培训对象

面向意欲优化应用程序速度、易用性和复杂程度的开发人员和工程师。培训对象要求具备 Python 或 Scala 背景知识，具备 Linux相关基础知识更佳。

5、MapReduce开发人员培训 （4天）

课程概述

了解 HDFS 和 MapReduce 的基础知识，如何利用 API 编写程序、调试和优化技巧；以及如何管理大型的工作流。介绍相关的 Apache项目。

培训对象

面向编写、维护和 / 或优化 Hadoop 作业的开发人员。培训对象应具备以下编程经验：建议具备 Java 背景知识，要求完成动手练习。但不需要具备Hadoop相关知识。

6、大数据应用程序的设计和构建（4天）

考试建议:CCP:DE

课程概述

学习利用企业数据中心（EDH）的工具分析和解决实际业务问题。熟练掌握聚合应用解决方案的设计和建立过程，其中包括：摄入数据、确定文件存储格式、处理存储数据，并为最终用户展示结果

培训对象

面向意欲使用 Hadoop 解决现实问题的开发人员和架构师。培训对象要求具备良好的 Jave 相关知识、基本熟悉 Linux，具备 SQL 经验更佳，并且应已参加过MapReduce的培训。

第二类：运维管理类

1、Apache Hadoop管理员培训（4天）

考试建议：CCA131

课程概述

从安装及配置、负载均衡及调整，以及诊断和解决部署问题等各方面了解 Hadoop 系统管理员的概念和实践。

培训对象

面向需要建立或维护 Hadoop 集群的管理员。培训对象要求具备 Linux 基本知识，Hadoop相关知识不作要求。

2、Apache HBase 培训（3天）

对，你没看错，跟开发类中的HBase是一样的，它也说了是面向使用 HBase 的开发人员和管理员，一样就不介绍了。

第三类：数据分析类

1、数据分析师培训： Pig、Hive 和 Impala（4天）

考试建议：CCA159

课程概述

了解Apache Pig、Apache Hive及 Apache Impala如何通过筛选、连接进行数据转换和数据分析，以及利用其他常见技术自定义用户功能。

培训对象

面向意欲使用 SQL、脚本和基本 Linux 操作 Hadoop 数据的分析师、BI 专家、架构师和管理员，培训对象不要求具有 Hadoop 相关知识。

2、基于Spark和Hadoop的规模化数据科学（3天）

课程概述

了解数据科学家的工作内容、需要解决的问题以及其处理现实问题时应用的方法，以获得来自不同行业数据的业务价值。实施自动推荐系统。

培训对象

面向具备 Hadoop 基础知识（HDFS、MapReduce、Hadoop Streaming、Hive）的工程师、数据分析师、统计人员。培训对象应具备熟练的脚本语言能力：Python 是首选；熟悉Perl或者Ruby也可。

----我----是----分----割----线----

已更新过的认证体系

1、CCA Administrator Exam (CCA131) 管理员认证

认证准备建议：Administrator管理员培训

考试形式：120分钟；70%通过；基于一个预配置的Cloudera企业版集群，解决8~12个场景下的任务

2、CCA Spark and Hadoop Developer (CCA175) 开发者认证

认证准备建议：Spark and Hadoop开发者培训

考试形式：120分钟；70%通过；解决10~12基于CDH5机群上需通过实际操作的问题

3、CCA Data Analyst (CCA159)数据分析师认证

认证准备建议：Data Analyst数据分析师培训

考试形式：120分钟；70%通过；解决10~12个客户问题，对于每一个问题，考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具

4、CCP Data Engineer Exam (DE575) 数据工程师认证

认证准备建议：Spark and Hadoop开发者培训；设计及构建大数据应用；考生需对Hadoop有深入了解、具有实际使用大数据工具的经验、以及具备解决实际数据工程问题的专家级水平

考试形式：4小时；提供一个大数据集供使用、7个高性能节点组成的CDH5机群；解决大数据用户可能碰到的5-8个实际问题

赏

文章存档

2018年04月(1)

相关视频教程更多课程

2024年信息系统项目管理师视频教程

2024年3月计算机二级ms office（Office 2016版）视频教程

2024年软考信息安全工程师精讲视频教程（新教材新大纲）

2024信息系统项目管理师精讲视频课程

最全面2024年3月专用计算机《二级MSOFFICE高级应用》培训全套包过视频教程

2024年系统集成项目管理工程师视频教程

最新教程

热门教程

评论

文章存档

最新发表

最近访客