2050559-大数据挖掘、分析与应用-计科中兴B15-2-教学进度计划表

发布时间/2018-04-10 发布人/蒋玮荻作者/ 来源/ 414




上海建桥学院课程教学进度计划表



一、基本信息

课程代码

2050559

课程名称

大数据挖掘、分析与应用

课程学分

4

总学时

64

授课教

蔡文英

教师邮箱

Cai.wenying@huatec.com

上课班级

计科中兴B15-2

上课教室

四教303;信息418

答疑时间

周一下午三点到五点半

周三早上9点到十一点,下午三点到五点半

主要教材

大数据技术基础:基于HadoopSpark

参考资料

百度;慕课网


二、课程教学进度

周次

教学内容

教学方式

作业

1

大数据的发展历程以及大数据对国内外各行各业的影响大数据的概念及其特征大数据的来源,理解大数据在技术、安全等方面面临的挑战和研究大数据的意义大数据的存储与计算模式的相关概念,了解其中的关键技术及基本思想;大数据的典型应用场景,学会用创新性思维来看待大数据

讲授

课后复习,下节课提问

2

  1. Hadoop的发展过程和优势;Hadoop的生态系统以及其中的基本概念;Hadoop的版本发行情况;掌握Hadoop的基本结构

讲授

课后复习,下节课提问

3

Hadoop的分布式文件系统

讲授;实操

课后复习,下节课提问

4

Hadoop分布式计算框架

讲授

课后复习,下节课提问

5

MapReduce API的种类MapReduce Java API的常用类

讲授

课后复习,下节课提问

6

MapReduce的数据类型;MapReduce Java API的编程思路

讲授

课后复习,下节课提问

7

序列化MapReduce的输入输出类型与格式

讲授;实操

课后复习,下节课提问

8

MapReducemap任务和reduce任务;MapReduce任务的配置和执行

讲授

课后复习,下节课提问

9

掌握Spark环境搭建Spark的发展历程和应用现状,熟悉Spark的特点

讲授

课后复习,下节课提问

10

Spark的数据模型RDD的处理过程常用的RDD算子的使用方法

讲授

课后复习,下节课提问

11

Spark的任务调度机制;Spark的技术体系架构

讲授

课后复习,下节课提问

12

Spark Streaming的优势Spark Streaming的工作机制

讲授

课后复习,下节课提问

13

DStream流的Window操作机制;DStream的使用方法

讲授

课后复习,下节课提问

14

Spark Streaming的性能优化;Spark SQL的工作原理

讲授

课后复习,下节课提问

15

Spark SQL中的DataSetDataFrame类及其常用方法;掌握常见数据源的获取与查询

讲授

课后复习,下节课提问

16

复习周

讲授

课后复习,下节课提问

17

考试周



三、评价方式以及在总评成绩中的比例

总评构成(1+X

评价方式

占比

1

期终闭卷考

40%

X1

个人项目报告

40%

X2

课堂小测验

20%



任课教师:蔡文英主任审核: 日期:



1

注:课程教学进度计划表电子版公布在本学院课程网站上,并发送到教务处存档。