上海建桥学院课程教学进度计划表
一、基本信息
课程代码 | 2050559 | 课程名称 | 大数据挖掘、分析与应用 |
课程学分 | 4 | 总学时 | 64 |
授课教师 | 蔡文英 | 教师邮箱 | Cai.wenying@huatec.com |
上课班级 | 计科中兴B15-2 | 上课教室 | 四教303;信息418 |
答疑时间 | 周一下午三点到五点半 周三早上9点到十一点,下午三点到五点半 | ||
主要教材 | 大数据技术基础:基于Hadoop与Spark | ||
参考资料 | 百度;慕课网 |
二、课程教学进度
周次 | 教学内容 | 教学方式 | 作业 |
1 | 大数据的发展历程以及大数据对国内外各行各业的影响;大数据的概念及其特征;大数据的来源,理解大数据在技术、安全等方面面临的挑战和研究大数据的意义;大数据的存储与计算模式的相关概念,了解其中的关键技术及基本思想;大数据的典型应用场景,学会用创新性思维来看待大数据 | 讲授 | 课后复习,下节课提问 |
2 |
| 讲授 | 课后复习,下节课提问 |
3 | Hadoop的分布式文件系统 | 讲授;实操 | 课后复习,下节课提问 |
4 | Hadoop分布式计算框架 | 讲授 | 课后复习,下节课提问 |
5 | MapReduce API的种类;MapReduce Java API的常用类 | 讲授 | 课后复习,下节课提问 |
6 | MapReduce的数据类型;MapReduce Java API的编程思路 | 讲授 | 课后复习,下节课提问 |
7 | 序列化;MapReduce的输入输出类型与格式 | 讲授;实操 | 课后复习,下节课提问 |
8 | MapReduce的map任务和reduce任务;MapReduce任务的配置和执行 | 讲授 | 课后复习,下节课提问 |
9 | 掌握Spark环境搭建;Spark的发展历程和应用现状,熟悉Spark的特点 | 讲授 | 课后复习,下节课提问 |
10 | Spark的数据模型RDD的处理过程;常用的RDD算子的使用方法; | 讲授 | 课后复习,下节课提问 |
11 | Spark的任务调度机制;Spark的技术体系架构 | 讲授 | 课后复习,下节课提问 |
12 | Spark Streaming的优势;Spark Streaming的工作机制 | 讲授 | 课后复习,下节课提问 |
13 | DStream流的Window操作机制;DStream的使用方法 | 讲授 | 课后复习,下节课提问 |
14 | Spark Streaming的性能优化;Spark SQL的工作原理 | 讲授 | 课后复习,下节课提问 |
15 | Spark SQL中的DataSet与DataFrame类及其常用方法;掌握常见数据源的获取与查询 | 讲授 | 课后复习,下节课提问 |
16 | 复习周 | 讲授 | 课后复习,下节课提问 |
17 | 考试周 | 无 |
|
三、评价方式以及在总评成绩中的比例
总评构成(1+X) | 评价方式 | 占比 |
1 | 期终闭卷考 | 40% |
X1 | 个人项目报告 | 40% |
X2 | 课堂小测验 | 20% |
第
注:课程教学进度计划表电子版公布在本学院课程网站上,并发送到教务处存档。